رشد سریع مدلهای هوش مصنوعی تبدیل متن به تصویر مانند دال-ای ۲ اوپنایآی (برنامههایی که برای ایجاد تصاویر متنوع آموزش دیدهاند)، با ارائهی تصاویر عجیب و شگفتآور، صنایع خلاق از صنعت مُد گرفته تا صنعت فیلمسازی را به هیجان آورده است. همان فناوری پشت این برنامهها توجه آزمایشگاههای بیوتکنولوژی را نیز به خود جلب کرده است. آزمایشگاهها استفاده از این نوع هوش مصنوعی مولد معروف به مدل دیفیوژن را بهمنظور ایجاد طرحهایی برای پروتئینهایی شروع کردهاند که در طبیعت مشاهده نشدهاند.
اخیراً دو آزمایشگاه بهطورمستقل خبر از برنامههایی دادند که از مدلهای دیفیوژن برای تولید طرحهایی برای پروتئینهای جدید با دقتی بیشتر از گذشته استفاده میکنند. جنریت بیومدیسینس (Generate Biomedicines)، استارتاپی مستقر در بوستون، برنامهای به نام کروما (Chroma) را معرفی کرده است. در همین حین، تیمی از دانشگاه واشینگتن بهسرپرستی دیوید بیکر برنامهی مشابهی را به نام RoseTTAFold Diffusion توسعه داده است.
بیکر و همکارانش در مقالهی پیشچاپی که بهتازگی منتشر شد، نشان دادند که مدل آنها میتواند طرحهای دقیقی را برای پروتئینهای جدیدی ایجاد کند و سپس در آزمایشگاه ساخته شوند. برایان تریپ، از توسعهدهندگان RoseTTAFold میگوید: «در حال تولید پروتئینهایی هستیم که شباهتی با پروتئینهای موجود ندارند.» این مولدهای پروتئین را میتوان برای تولید طرحهایی برای پروتئینهایی با ویژگیهای خاص مانند شکل یا اندازه یا عملکرد هدایت کرد. درواقع، بهکمک آنها میتوان درنهایت پروتئینهای جدیدی ساخت که وظیفه خاصی را انجام دهند.
پژوهشگران امیدوارند دستاوردهای آنها به توسعه داروهای جدید و مؤثرتر منجر شود. گئورگ گریگوریان، مدیر ارشد فنی جنریت بیومدیسینس میگوید: «میتوانیم در چند دقیقه چیزی را کشف کنیم که میلیونها سال طول کشید تا تکامل به آن دست پیدا کند.» آوا امینی، بیوفیزیکدان مؤسسهی تحقیقاتی مایکروسافت در کمبریج ماساچوست میگوید: «نکتهی مهم این کار، خَلق پروتئینها براساس خصوصیات مدنظر ما است.»
ساختارهای پروتئینی متقارن که کروما تولید کرده است.
پروتئینها واحدهای ساختمانی اساسی موجودات زنده هستند. در حیوانات، آنها غذا را هضم میکنند، عضلات را منقبض میکنند، نور را تشخیص میدهند، سیستم ایمنی را هدایت میکنند و وظایف دیگری نیز برعهده دارند. هنگام بیماری نیز پروتئینها نقش دارند. بنابراین، پروتئینها هدف اصلی داروها هستند و بسیاری از داروهای جدید مبتنیبر پروتئینها هستند. گریگوریان میگوید: «طبیعت از پروتئین برای همهچیز استفاده میکند. وعدهای که این دستاورد برای مداخلات درمانی میدهد، واقعاً بزرگ است.»
دراینمیان، طراحان دارو درحالحاضر باید از فهرستی متشکل از پروتئینهای طبیعی استفاده کنند. هدف تولید پروتئین این است که با مخزن تقریباً بینهایتی از پروتئینهای طراحیشدهی کامپیوتر، این فهرست گسترش پیدا کند. تکنیکهای محاسباتی برای طراحی پروتئینها جدید نیستند؛ اما روشهای قبلی در طراحی پروتئینهای بزرگ یا کمپلکسهای پروتئینی (ماشینهای مولکولی که از چندین پروتئین متصل به هم تشکیل شده است) آهسته بودهاند و عملکرد قدرتمندی نداشتند. اغلب چنین پروتئینهایی برای درمان بیماریها حیاتی هستند.
ساختار پروتئینی تولیدشدهی RoseTTAFold Diffusion (سمت چپ) و همان ساختار که در آزمایشگاه ایجاد شده است (سمت راست).
دو برنامهای که بهتازگی اعلام شدند، نیز اولین کاربرد مدلهای دیفیوژن برای خَلق پروتئین نیستند. چندین مطالعه که در طول چند ماه گذشته امینی و دیگران منتشر کردهاند، نشان داده است که مدلهای دیفیوژن تکنیکهای امیدوارکنندهای هستند؛ اما مطالعات مذکور اثبات مفهوم بودند. Chroma و RoseTTAFold Diffusion اولین برنامههای کامل هستند که میتوانند طرحهای دقیقی برای طیف گستردهای از پروتئینها تولید کنند.
نامراتا آناند که اخیراً یکی از اولین مدلهای دیفیوژن را برای ابداع پروتئین توسعه داده است، اهمیت Chroma و RoseTTAFold Diffusion را در این میداند که آنها ابعاد کار خود را گسترش دادهاند و آن را روی دادههای بیشتر و کامپیوترهای بیشتر آموزش دادهاند. او میگوید: «بهدلیا نحوهی افزایش مقیاس کار منصفانه است که بگوییم این مدل بیشتر شبیه DALL-E است.» مدلهای دیفیوژن شبکههای عصبی هستند که برای حذف نویز از ورودیهای خود آموزش دیدهاند (اختلالات تصادفی اضافهشده به دادهها).
در کروما، نویز با بازکردن زنجیرههای آمینواسیدی که پروتئین از آن ساخته میشود، در نظر گرفته میشود. کروما با فرض تودهای تصادفی از زنجیرهها، سعی میکند آنها را کنارهم قرار دهد تا پروتئین را تشکیل دهد. کروما با هدایت محدودیتهای تعیینشده دربارهی اینکه نتیجه چگونه باید باشد، میتواند پروتئینهای جدیدی با ویژگیهای خاص تولید کند. تیم بیکر رویکرد متفاوتی را اتخاذ میکند. اگرچه نتایج نهایی مشابه است، مدل دیفیوژن آنها با ساختار آشفتهتری شروع میشود.
تفاوت مهم دیگر این است که RoseTTAFold Diffusion از اطلاعاتی دربارهی نحوهی قرارگرفتن قطعات یک پروتئین درکنارهم استفاده میکند که شبکهی عصبی جداگانهای فراهم میکند. این شبکه برای پیشبینی ساختار پروتئینهای آموزش دیده است (همانطورکه آلفافولد دیپمایند این کار را انجام میدهد). شرکت جنریت بیومدیسینس و تیم بیکر هر دو مجموعهی چشمگیری از نتایج را بهنمایش میگذارند. آنها پروتئینهایی با درجات مختلف تقارن ازجمله پروتئینهای دایرهای، مثلثی یا ششضلعی میتوانند تولید کنند. جنریت بیومدیسینس برای نشاندادن قابلیت برنامهی خود، پروتئینهایی بهشکل ۲۶ حرف الفبای لاتین و اعداد صفر تا ده تولید کرد.
اکثر ساختارهای بهنمایش گذاشتهشده عملاً هدفی را دنبال نمیکنند؛ اما ازآنجاکه عملکرد پروتئین را شکل آن تعیین میکند، توانایی تولید ساختارهای مختلف بسیار مهم است. البته ایجاد طرحهای عجیب وغریب بهکمک کامپیوتر با تبدیل این طرحها به پروتئینهای واقعی فرق دارد. جنریت بیومدیسینس برای آزمایش این موضوع که آیا کروما طرحهایی را تولید میکند که میتوانند واقعاً ساخته شوند، برخی از توالیهای طرحهای خود (رشتههای آمینواسیدی سازنده پروتئین) را انتخاب و آنها را در برنامهی هوش مصنوعی دیگری اجرا کرد. آنها دریافتند ۵۵ درصد از طرحها این قابلیت را دارند که در آزمایشگاه به پروتئینهای واقعی و ماندنی تبدیل شوند.
تیم بیکر آزمایش مشابهی را انجام داد؛ اما بیکر و همکارانش در ارزیابی مدل خود فراتر از جنریت بیومدیسینس رفتهاند. آنها برخی از طرحهای RoseTTAFold Diffusion را درون آزمایشگاه تولید کردهاند. شرکت میگوید در حال انجام آزمایشهای آزمایشگاهی است؛ اما هنوز برای انتشار نتایج آماده نیست. تریپ میگوید: «این چیزی بیش از اثبات مفهوم است. ما از آن برای ساخت پروتئینهای بسیار عالی استفاده میکنیم.»
ساختار پروتئینی تولیدشدهی RoseTTAFold Diffusion که به پروتئین اسپایک SARS-CoV-2 متصل میشود.
برای بیکر، نتیجهی اصلی تولید پروتئین جدیدی است که به هورمون پاراتیروئید متصل میشود. هورمون پاراتیروئید سطح کلسیم خون را کنترل میکند. او میگوید: «هورمون را به مدل دادیم و گفتیم پروتئینی بسازد که به آن متصل شود.» وقتی آنها پروتئین جدید را در آزمایشگاه آزمایش کردند، دریافتند محکمتر از هر پروتئین دیگری که میتوانست با استفاده از روشهای محاسباتی دیگر تولید شود و محکمتر از داروهای موجود به هورمون متصل میشود.
گریگوریان تصدیق میکند که اختراع پروتئینهای جدید اولین قدم آنها است. او میگوید: «ما شرکت داروسازی هستیم. درپایان، آنچه اهمیت دارد، این است که آیا میتوانیم داروهای مؤثری بسازیم؟» داروهای مبتنیبر پروتئین باید به مقدار زیاد تولید شوند و سپس در آزمایشگاه و درنهایت روی انسان آزمایش شوند. این کار ممکن است چندین سال طول بکشد. بااینحال، گریگوریان فکر میکند که راههایی برای سرعتبخشیدن این مراحل نیز پیدا خواهند کرد. بیکر میگوید: «سرعت پیشرفت علمی جستهگریخته است؛ اما درحالحاضر در میانهی چیزی هستیم که میتوان آن را انقلاب فنی نامید.»