जनरेटिव एआई: शब्दों का कैलकुलेटर या भाषा का जादू

जनरेटिव आर्टिफिशियल इंटेलिजेंस (एआई) क्या है और यह क्या करता है, यह बताने के प्रयासों ने कई रूपकों और उपमाओं को जन्म दिया है। एक “ब्लैक बॉक्स” से लेकर “स्टेरॉयड पर ऑटोकम्प्लीट”, एक “तोता” और यहाँ तक कि एक जोड़ी “स्नीकर्स” तक, इसका लक्ष्य किसी जटिल तकनीक को रोज़मर्रा के अनुभवों के आधार पर समझना आसान बनाना है – भले ही परिणामी तुलना अक्सर अति-सरलीकृत या भ्रामक हो। एक तेज़ी से व्यापक होती उपमा जनरेटिव एआई को “शब्दों के लिए कैलकुलेटर” के रूप में वर्णित करती है। ओपनएआई के मुख्य कार्यकारी अधिकारी सैम ऑल्टमैन द्वारा आंशिक रूप से लोकप्रिय, कैलकुलेटर तुलना बताती है कि गणित की कक्षा में संख्याओं को गिनने के लिए इस्तेमाल की जाने वाली परिचित प्लास्टिक की वस्तुओं की तरह, जनरेटिव एआई टूल्स का उद्देश्य हमें बड़ी मात्रा में भाषाई डेटा को गिनने में मदद करना है। कैलकुलेटर उपमा की सही ही आलोचना की गई है, क्योंकि यह जनरेटिव एआई के अधिक परेशान करने वाले पहलुओं को अस्पष्ट कर सकती है। चैटबॉट्स के विपरीत, कैलकुलेटर में अंतर्निहित पूर्वाग्रह नहीं होते, वे गलतियाँ नहीं करते, और वे मौलिक नैतिक दुविधाएँ पैदा नहीं करते।
फिर भी, इस सादृश्य को पूरी तरह से खारिज करने में भी खतरा है, क्योंकि मूलतः जनरेटिव एआई उपकरण शब्द कैलकुलेटर हैं। हालाँकि, जो मायने रखता है वह वस्तु नहीं, बल्कि गणना करने का तरीका है। और जनरेटिव एआई उपकरणों में गणनाएँ उन गणनाओं की नकल करने के लिए डिज़ाइन की गई हैं जो रोज़मर्रा की मानवीय भाषा के उपयोग का आधार हैं। भाषाओं में छिपे हुए आँकड़े होते हैं ज़्यादातर भाषा उपयोगकर्ता केवल अप्रत्यक्ष रूप से ही जानते हैं कि उनकी बातचीत किस हद तक सांख्यिकीय गणनाओं का परिणाम है।
उदाहरण के लिए, किसी को “नमक और काली मिर्च” के बजाय “काली मिर्च और नमक” कहते हुए सुनने में होने वाली असहजता के बारे में सोचें। या उस अजीब नज़र के बारे में सोचें जो आपको तब मिलेगी जब आप किसी कैफ़े में “स्ट्रॉन्ग टी” के बजाय “पावरफुल टी” ऑर्डर करेंगे। शब्दों के चयन और क्रम, और भाषा में कई अन्य अनुक्रमों को नियंत्रित करने वाले नियम, उनके साथ हमारे सामाजिक संपर्कों की आवृत्ति से आते हैं। आप जितनी बार किसी बात को एक खास तरीके से कहते हुए सुनेंगे, कोई भी विकल्प उतना ही कम व्यावहारिक लगेगा। या यूँ कहें कि, कोई भी अन्य परिकलित क्रम उतना ही कम विश्वसनीय लगेगा। भाषाविज्ञान में, भाषा के अध्ययन के लिए समर्पित एक विशाल क्षेत्र में, इन क्रमों को “कोलोकेशन” कहा जाता है। ये उन कई परिघटनाओं में से एक हैं जो दर्शाती हैं कि मनुष्य बहु-शब्द पैटर्न की गणना इस आधार पर कैसे करते हैं कि वे “सही लगते हैं” – क्या वे उपयुक्त, स्वाभाविक और मानवीय लगते हैं।
चैटबॉट आउटपुट ‘सही लगता है’ क्यों देता है
बड़े भाषा मॉडल (एलएलएम) – और इसलिए चैटबॉट – की एक प्रमुख उपलब्धि यह है कि वे इस “सही लगता है” कारक को ऐसे तरीकों से औपचारिक रूप देने में कामयाब रहे हैं जो अब मानव अंतर्ज्ञान को सफलतापूर्वक धोखा देते हैं। वास्तव में, ये दुनिया की सबसे शक्तिशाली कोलोकेशन प्रणालियों में से कुछ हैं। एक अमूर्त स्थान के अंदर टोकन (चाहे वे शब्द हों, प्रतीक हों या रंग के बिंदु) के बीच सांख्यिकीय निर्भरता की गणना करके, जो उनके अर्थों और संबंधों को दर्शाता है, AI ऐसे अनुक्रम उत्पन्न करता है जो इस बिंदु पर, न केवल ट्यूरिंग परीक्षण में मानवीय रूप से उत्तीर्ण होते हैं, बल्कि शायद अधिक परेशान करने वाली बात यह है कि उपयोगकर्ता उनसे प्रेम करने लगते हैं।

इन विकासों के संभव होने का एक प्रमुख कारण जनरेटिव AI की भाषाई जड़ें हैं, जो अक्सर तकनीक के विकास की कहानी में दबी रहती हैं। लेकिन AI उपकरण उतने ही कंप्यूटर विज्ञान के उत्पाद हैं जितने कि वे भाषा विज्ञान की विभिन्न शाखाओं के। GPT-5 और जेमिनी जैसे समकालीन LLM के पूर्वज शीत युद्ध-युग के मशीन अनुवाद उपकरण हैं, जिन्हें रूसी भाषा का अंग्रेजी में अनुवाद करने के लिए डिज़ाइन किया गया था। हालाँकि, नोम चॉम्स्की जैसे दिग्गजों के नेतृत्व में भाषा विज्ञान के विकास के साथ, ऐसी मशीनों का लक्ष्य सरल अनुवाद से हटकर प्राकृतिक (अर्थात, मानवीय) भाषा प्रसंस्करण के सिद्धांतों को डिकोड करने की ओर बढ़ गया। एलएलएम विकास की प्रक्रिया चरणों में हुई, जिसकी शुरुआत भाषाओं के “नियमों” (जैसे व्याकरण) को यंत्रवत् बनाने के प्रयासों से हुई, सांख्यिकीय दृष्टिकोणों के माध्यम से जो सीमित डेटा सेटों के आधार पर शब्द अनुक्रमों की आवृत्तियों को मापते थे, और वर्तमान मॉडल जो तरल भाषा उत्पन्न करने के लिए तंत्रिका नेटवर्क का उपयोग करते हैं।
हालाँकि, संभावनाओं की गणना करने की मूल पद्धति वही रही है। हालाँकि पैमाने और रूप में अत्यधिक परिवर्तन हुए हैं, समकालीन एआई उपकरण अभी भी पैटर्न पहचान की सांख्यिकीय प्रणालियाँ हैं। इन्हें इस बात की गणना करने के लिए डिज़ाइन किया गया है कि हम ज्ञान, व्यवहार या भावनाओं जैसी घटनाओं के बारे में कैसे “भाषा” बनाते हैं, जबकि इनमें से किसी तक भी हमारी सीधी पहुँच नहीं है। अगर आप ChatGPT जैसे किसी चैटबॉट को इस तथ्य को “प्रकट” करने के लिए कहें, तो वह तुरंत आपकी बात मान लेगा।
AI हमेशा गणना ही करता रहता है
तो फिर हम इसे आसानी से क्यों नहीं पहचान पाते? इसका एक बड़ा कारण यह है कि कंपनियाँ जनरेटिव AI टूल्स के इस्तेमाल का वर्णन और नामकरण कैसे करती हैं। “गणना” करने के बजाय, जनरेटिव AI टूल्स “सोच”, “तर्क”, “खोज” या यहाँ तक कि “सपने” भी देखते हैं। इसका तात्पर्य यह है कि मनुष्य भाषा के पैटर्न का उपयोग कैसे करते हैं, इस समीकरण को हल करने में, जनरेटिव AI ने उन मूल्यों तक पहुँच प्राप्त कर ली है जो हम भाषा के माध्यम से संप्रेषित करते हैं। लेकिन कम से कम अभी तक, ऐसा नहीं हुआ है। यह गणना कर सकता है कि “मैं” और “तुम” का “प्रेम” के साथ मेल होने की सबसे अधिक संभावना है, लेकिन यह न तो “मैं” है (यह कोई व्यक्ति नहीं है), न ही यह “प्रेम” को समझता है, और न ही, इस मामले में, आप – जो संकेत लिखने वाला उपयोगकर्ता है। जनरेटिव एआई हमेशा गणना ही करता है। और हमें इसे और कुछ समझने की भूल नहीं करनी चाहिए। यह लेख क्रिएटिव कॉमन्स लाइसेंस के तहत द कन्वर्सेशन से पुनर्प्रकाशित है।
नए खबरों के लिए बने रहे सटीकता न्यूज के साथ।




