एआई ने 500 मिलियन वर्षों के विकास का अनुकरण करते हुए नया चमकता हुआ प्रोटीन बनाया
नए प्रोटीन का संश्लेषण - जैविक जीवन के निर्माण खंड - अपार संभावनाओं वाला वैज्ञानिक क्षेत्र है, और एक नया विकसित AI मॉडल प्रकृति में पाए जाने वाले प्रोटीन से कहीं ज़्यादा नए प्रोटीन के लिए निर्देश बनाने का वादा करता है।

SCIENCE: अमेरिका में वैज्ञानिकों ने esmGFP (ग्रीन फ्लोरोसेंट प्रोटीन) नामक एक नए प्रोटीन को संश्लेषित करने के लिए इवोल्यूशनरीस्केल मॉडल 3 (ESM3) का उपयोग किया है, जो अपने निकटतम प्राकृतिक रिश्तेदार tagRFP के साथ अपनी सामग्री का केवल 58 प्रतिशत साझा करता है।
शोध दल का अनुमान है कि यह AI द्वारा संसाधित किए जा रहे 500 मिलियन वर्षों के विकास के बराबर है, और यह कस्टम-निर्मित प्रोटीन बनाने का रास्ता खोलता है जिन्हें विशिष्ट उपयोगों के लिए डिज़ाइन किया जा सकता है, या मौजूदा प्रोटीन से अधिक फ़ंक्शन अनलॉक किए जा सकते हैं। न्यूयॉर्क में इवोल्यूशनरीस्केल के संस्थापक थॉमस हेस के नेतृत्व में शोधकर्ताओं ने अपने प्रकाशित पेपर में लिखा है, “तीन अरब से अधिक वर्षों के विकास ने प्राकृतिक प्रोटीन के स्थान में एनकोडेड जीवविज्ञान की एक छवि का निर्माण किया है।”
“यहाँ हम दिखाते हैं कि विकासवादी डेटा पर बड़े पैमाने पर प्रशिक्षित भाषा मॉडल कार्यात्मक प्रोटीन उत्पन्न कर सकते हैं जो ज्ञात प्रोटीन से बहुत दूर हैं।” ESM3 को प्रभावशाली 3.15 बिलियन प्रोटीन अनुक्रमों (प्रोटीन में अमीनो एसिड का क्रम), 236 मिलियन प्रोटीन संरचनाओं (उनके 3D आकार) और 539 मिलियन प्रोटीन एनोटेशन (वर्णनात्मक लेबल) पर प्रशिक्षित किया गया था। डेटा के उन विशाल भंडारों में पैटर्न को पहचानकर, AI मॉडल समझ सकता है कि प्रोटीन निर्माण और कार्य में क्या काम करता है और क्या नहीं – उसी तरह जैसे ChatGPT मनुष्यों द्वारा लिखी गई लाखों कविताओं को पढ़ने के बाद एक नई कविता की रचना कर सकता है।
जो चीज esmGFP को अतिरिक्त विशेष बनाती है, वह यह है कि यह काम करता है: यह अपने सापेक्ष tagRFP की तरह ही फ्लोरोसेंट है। फ्लोरोसेंट प्रोटीन कुछ समुद्री जीवों को उनकी चमक देते हैं, और मार्कर के रूप में उनके उपयोग का चिकित्सा और जैव प्रौद्योगिकी में बहुत महत्व है। “हमने फ्लोरोसेंस की कार्यक्षमता को चुना क्योंकि इसे प्राप्त करना मुश्किल है, मापना आसान है, और प्रकृति में सबसे सुंदर तंत्रों में से एक है,” टीम लिखती है।
AI प्रोटीन संश्लेषण में बहुत सारे परीक्षण और त्रुटि को दूर करता है, जबकि प्रोटीन से दूर की खोज करने की क्षमता जोड़ता है जिसके बारे में हम वर्तमान में जानते हैं। शोधकर्ताओं ने लिखा, “प्रोटीन को एक संगठित स्थान के भीतर मौजूद देखा जा सकता है जहाँ प्रत्येक प्रोटीन हर दूसरे प्रोटीन से घिरा होता है जो एक उत्परिवर्तन घटना की दूरी पर होता है।” “विकास की संरचना इस स्थान के भीतर एक नेटवर्क के रूप में दिखाई देती है, जो सभी प्रोटीन को उन रास्तों से जोड़ती है जो विकास उनके बीच ले सकता है।” विकास होने के लिए, टीम का कहना है कि प्रत्येक प्रोटीन को अगले में बदलना चाहिए बिना उस प्रणाली के जिसका वह हिस्सा है अपनी समग्र कार्यक्षमता खोए। एक भाषा मॉडल इस स्थान में प्रोटीन को पहचानता है।
ESM3 द्वारा डिज़ाइन किए गए प्रोटीन को अभी भी मान्य, संश्लेषित और परीक्षण करने की आवश्यकता है, जिसमें समय लगता है, लेकिन टीम को यहाँ और प्रगति करने का भरोसा है। बहुत दूर के भविष्य में हम कुछ चतुर AI संकेत के साथ दवाओं से लेकर बायोमटेरियल तक हर चीज के लिए प्रोटीन का उत्पादन कर सकते हैं। शोधकर्ताओं ने स्पष्ट किया कि, “प्रोटीन भाषा मॉडल स्पष्ट रूप से विकास की भौतिक सीमाओं के भीतर काम नहीं करते हैं, बल्कि इसके बजाय वे अप्रत्यक्ष रूप से विकास के संभावित मार्गों की विविधता का एक मॉडल तैयार कर सकते हैं।”
YouTube channel Search – www.youtube.com/@mindfresh112 , www.youtube.com/@Mindfreshshort1
नए खबरों के लिए बने रहे सटीकता न्यूज के साथ।