
Sebuah kecerdasan buatan Model (AI) telah mensimulasikan setengah miliar tahun evolusi molekuler untuk membuat kode untuk protein yang sebelumnya tidak diketahui, menurut sebuah studi baru. Protein bercahaya, yang mirip dengan yang ditemukan di ubur -ubur dan karang, dapat membantu dalam pengembangan obat -obatan baru, kata para peneliti.
Protein adalah salah satu blok bangunan kehidupan dan melakukan berbagai fungsi dalam tubuh, seperti Membangun otot dan melawan penyakit. Protein yang disimulasikan, bernama ESMGFP, hanya ada sebagai kode komputer, tetapi berisi cetak biru untuk jenis protein fluoresen hijau yang sebelumnya tidak diketahui. Di alam, protein fluoresen hijau memberikan ubur -ubur neon dan karang cahaya mereka.
Urutan huruf yang menjabarkan instruksi untuk membuat ESMGFP hanya 58% mirip dengan protein fluorescent terdekat yang diketahui, yang merupakan versi protein yang dimodifikasi manusia yang ditemukan dalam anemon laut ujung gelembung (Entacmaea quadricolor) – Makhluk laut berwarna -warni yang terlihat seperti memiliki gelembung di ujung tentakel mereka. Urutan lainnya unik, dan akan membutuhkan total 96 mutasi genetik yang berbeda untuk berkembang. Perubahan ini akan membutuhkan lebih dari 500 juta tahun untuk berkembang secara alami, menurut penelitian ini.
Para peneliti di sebuah perusahaan bernama EvolutionaryScale meluncurkan ESMGFP dan model AI yang digunakan untuk membuatnya, ESM3, dalam studi pracetak tahun lalu. Ilmuwan independen sekarang telah ditinjau oleh peer-review, yang diterbitkan 16 Januari di jurnal Sains.
ESM3 tidak merancang protein dalam batasan evolusi yang biasa. Sebaliknya, ini adalah pemecah masalah yang mengisi celah kode protein tidak lengkap yang disediakan oleh para peneliti, dan dengan demikian merancang sesuatu yang mungkin ada berdasarkan semua jalur potensial yang bisa diambil oleh evolusi.
“Kami telah menemukan bahwa ESM3 belajar biologi mendasar, dan dapat menghasilkan protein fungsional di luar ruang yang dieksplorasi oleh evolusi,” rekan penulis studi Alex Rivessalah satu pendiri dan Kepala Ilmuwan EvolutionaryScale, mengatakan kepada Live Science dalam email.
Terkait: Peneliti Cina baru saja membangun saingan open-source untuk chatgpt dalam 2 bulan. Lembah Silikon ketakutan.
Studi baru ini dibangun di atas penelitian yang menurut dan rekan -rekannya dimulai di Metaperusahaan induk Facebook dan Instagram, sebelum memulai EvolutionaryScale pada tahun 2024. ESM3 adalah versi terbaru mereka dari model bahasa generatif yang mirip dengan Openai's GPT-4, yang menjalankan chatgpt, tetapi didasarkan pada biologi.
Protein terdiri dari rantai molekul yang disebut asam amino, urutannya disediakan oleh gen. Protein yang berbeda memiliki urutan asam amino yang berbeda. Mereka juga berbeda secara struktural, masing -masing lipat menjadi bentuk unik yang memungkinkan mereka untuk menjalankan fungsinya, menurut Pendidikan Alam. Agar ESM3 memahami protein, para peneliti memberi makan data model pada sifat utama protein – urutan asam amino, struktur dan fungsi – sebagai serangkaian huruf.
Tim melatih ESM3 pada data dari 2,78 miliar protein yang ditemukan di alam. Para peneliti kemudian menyembunyikan bagian cetak biru protein secara acak dan memiliki celah ESM3 di celah untuk menyelesaikan kode berdasarkan apa yang telah dipelajari.
“Dengan cara yang sama seseorang dapat mengisi kekosongan dalam solilokuy” untuk _ atau tidak ke _, yaitu _, “kita dapat melatih model bahasa untuk mengisi kekosongan dalam protein,” kata Rives. “Penelitian kami telah menunjukkan bahwa dengan menyelesaikan tugas sederhana ini, informasi tentang struktur mendalam biologi protein muncul dalam jaringan.”
Para ilmuwan sudah memodifikasi protein alami dan merekayasa yang baru untuk berbagai tujuan. Misalnya, protein fluoresen hijau digunakan secara luas di laboratorium penelitian. Kode genetik mereka sering ditambahkan ke ujung sekuens DNA lainnya untuk mengubah protein yang mereka kodekan hijau. Ini memungkinkan para ilmuwan untuk dengan mudah melacak protein dan proses seluler. Rives mencatat bahwa kemampuan ESM3 dapat mempercepat berbagai aplikasi untuk rekayasa protein, termasuk dengan membantu merancang obat baru.
Tiffany Taylorseorang ahli biologi evolusi di University of Bath di Inggris yang tidak terlibat dalam penelitian ini, melaporkan versi pracetak dari studi untuk ilmu langsung pada tahun 2024. Dalam analisisnya, Taylor menulis bahwa model AI seperti ESM3 akan memungkinkan inovasi dalam protein merekayasa evolusi yang tidak bisa. Namun, ia juga mencatat bahwa klaim para peneliti untuk mensimulasikan 500 juta tahun evolusi hanya difokuskan pada protein individu dan tidak menjelaskan banyak tahap seleksi alam yang pada akhirnya menciptakan kehidupan.
“Rekayasa protein yang digerakkan AI menarik, tetapi saya tidak dapat menahan diri untuk merasa bahwa kita mungkin terlalu percaya diri dalam mengasumsikan kita dapat mengakali proses rumit yang diasah oleh jutaan tahun seleksi alam,” kata Taylor.