भावनाओं को संप्रेषित करने में मशीन लर्निंग के क्षेत्र में हम कितनी दूर तक पहुंचे हैं?

क्या ऐसी मशीनें कभी हकीकत बन पाएंगी जो फिल्म 'हर' में दिखाए गए एआई की तरह भावनाओं को समझ सकें और उन्हें बता सकें? हम मशीन लर्निंग की प्रगति और संभावनाओं का पता लगाते हैं।

 

फिल्म 'हर' में ऑपरेटिंग सिस्टम और मशीन लर्निंग

फिल्म हर में एक ऑपरेटिंग सिस्टम (OS) है जिसे अमांडा सेफ़्रेड ने आवाज़ दी है। OS ऐसे काम करता है जैसे कि उसमें भावनाएँ हों, किसी व्यक्ति के साथ बातचीत के शब्द-दर-शब्द ट्रांसक्रिप्ट को संग्रहीत करता है और उसके शौक, स्वाद और विशेषताओं को निकालने के लिए उनका विश्लेषण करता है। इससे दिलचस्प बातचीत के विषय और सहानुभूति पैदा होती है, और मुख्य पात्र थिओडोर सहित कई लोग OS से प्यार करने लगते हैं। आपको लग सकता है कि यह कंप्यूटर ऑपरेटिंग सिस्टम किसी साइंस फ़िक्शन फ़िल्म से निकला हुआ है। ऐसा इसलिए है क्योंकि मशीन बातचीत और बहुत सारे अनुभवों के ज़रिए इंसान की तरह सीखती है और उसके आधार पर नए कदम उठाती है। लेकिन ये सीखने वाली मशीनें पहले से ही हमारे चारों ओर मौजूद हैं। इन मशीनों के पीछे के सिद्धांत को सामूहिक रूप से मशीन लर्निंग के रूप में जाना जाता है।

 

मशीन लर्निंग क्या है?

मशीन लर्निंग बिल्कुल वैसा ही है जैसा कि यह सुनने में लगता है: मशीनें खुद को सिखाना सीखती हैं, खास तौर पर किसी तरह से हासिल किए गए अलग-अलग तरह के डेटा का विश्लेषण करके और उससे सीखकर, और फिर एक गणितीय आधार प्रदान करके जिसे नए तरह के डेटा पर लागू किया जा सकता है। इसकी कुंजी यह है कि आपको सीखने के लिए कंप्यूटर को स्पष्ट रूप से प्रोग्राम करने की ज़रूरत नहीं है, आपको बस उसे इनपुट देना है। उदाहरण के लिए, अगर आप कंप्यूटर को सेब की तस्वीर पहचानना सिखाते हैं, तो वह पहचान लेगा कि यह एक सेब है, अगर आप उसे पिछले वाले से अलग सेब की तस्वीर दिखाते हैं, भले ही आप सेब की विशेषताओं को निर्दिष्ट न करें।
मशीन लर्निंग को सीखने के तरीके के आधार पर दो मुख्य श्रेणियों में विभाजित किया जा सकता है। एक है सुपरवाइज्ड लर्निंग, जहाँ प्रशिक्षित किए जा रहे डेटा के लिए परिणाम (या लेबल) ज्ञात होता है। उदाहरण के लिए, जब आप Facebook पर कोई फ़ोटो पोस्ट करते हैं, तो यह स्वचालित रूप से आपके चेहरे को पहचान लेता है और उसे एक वर्ग के रूप में प्रदर्शित करता है। यह यह सीखकर किया जाता है कि कौन सी छवियाँ चेहरे हैं और कौन सी छवियाँ चेहरे नहीं हैं। दूसरे शब्दों में, यदि डेटा पिक्सेल के RGB मानों से युक्त एक छवि फ़ाइल है, तो परिणाम यह है कि यह एक चेहरा है या नहीं।
दूसरी ओर, मशीन लर्निंग की एक अन्य विधि, जिसे अनसुपरवाइज्ड लर्निंग कहा जाता है, में मशीन में एक छवि को फीड करना और उसे बिना यह निर्दिष्ट किए चलने देना शामिल है कि इसे कैसे वर्गीकृत किया जाना चाहिए। ऊपर दिए गए फेस रिकग्निशन प्रोग्राम में, मशीन छवि में विशेषताओं को खोजने और यह भेद करने में सक्षम है कि यह एक इंसान है या बिल्ली, भले ही उसे यह न बताया गया हो कि छवि के साथ क्या करना है, यानी, यह एक चेहरा है या कुछ और। एक अन्य उदाहरण एक पोर्टल साइट पर एक समाचार वर्गीकरण कार्यक्रम है। यदि आप एक पोर्टल साइट पर समाचार लेख देखते हैं, तो आप देख सकते हैं कि उन्हें विभिन्न क्षेत्रों में वर्गीकृत किया गया है, जैसे कि राजनीति, जीवन, मनोरंजन, और इसी तरह, और समान समाचारों को एक साथ समूहीकृत किया गया है और अनुशंसित किया गया है। ऐसा करने के लिए, पोर्टल साइट व्यवस्थापक लर्निंग मशीन को यह निर्दिष्ट नहीं करता है कि कौन से लेख राजनीति से संबंधित हैं, कौन से मनोरंजन से संबंधित हैं, कौन से खेल से संबंधित हैं, और इसी तरह, लेकिन जब विभिन्न प्रकार के बड़ी संख्या में लेख लर्निंग मशीन में फीड किए जाते हैं, तो यह अपने आप लेखों में शब्दों की आवृत्ति का विश्लेषण करता है और उच्च सटीकता के साथ नए लेखों को वर्गीकृत करता है।

 

पर्यवेक्षित शिक्षण विधियाँ

वर्तमान में अधिकांश मशीन लर्निंग के लिए उपयोग की जाने वाली लर्निंग विधि सुपरवाइज्ड लर्निंग है। यह सभी लर्निंग मशीनों का लगभग 95% है। इसका एक कारण यह है कि एक स्वायत्त लर्निंग विधि की तुलना में प्रदर्शन के एक निश्चित स्तर को प्राप्त करने के लिए कम प्रशिक्षण डेटा की आवश्यकता होती है, क्योंकि एक मानव सीधे डेटा पर परिणाम निर्दिष्ट कर रहा है। ऐसा इसलिए है क्योंकि स्वायत्त लर्निंग विधियों को इस डेटा के भीतर उन विशेषताओं को खोजने के लिए अधिक डेटा की आवश्यकता होती है जो अपने आप वस्तुओं के बीच भेदभाव कर सकती हैं - उदाहरण के लिए, एक मानव और एक बिल्ली के बीच, एक राजनीतिक लेख और एक मनोरंजन लेख के बीच। दूसरी ओर, सुपरवाइज्ड लर्निंग विधियाँ अपेक्षाकृत कम मात्रा में डेटा के साथ अच्छा प्रदर्शन कर सकती हैं क्योंकि वे मनुष्यों द्वारा निर्देशित होती हैं, जिससे डेटा एकत्र करने में लगने वाला समय और प्रशिक्षण चलाने में लगने वाला समय कम हो जाता है।
हालाँकि, पर्यवेक्षित शिक्षण में एक बड़ी खामी है: यह उन चीज़ों के बारे में नहीं सीख सकता है जो इसे मनुष्यों द्वारा नहीं सिखाई जाती हैं, और इसका प्रदर्शन उन वातावरणों में नाटकीय रूप से गिर सकता है जो मनुष्यों द्वारा सिखाए गए वातावरण से थोड़े अलग हैं। उदाहरण के लिए, एक उज्ज्वल वातावरण में किसी व्यक्ति की छवि पर प्रशिक्षित एक मशीन असमान प्रकाश या कम रोशनी में व्यक्ति को नहीं पहचान सकती है, या यह किसी व्यक्ति के चेहरे के केवल सामने वाले हिस्से को इनपुट करने पर उसके पक्ष को नहीं पहचान सकती है।

 

स्वायत्त शिक्षण विधियाँ

स्व-शिक्षण विधियाँ पर्यवेक्षित शिक्षण की कमियों और सीमाओं को संबोधित कर सकती हैं। हालाँकि, यह शिक्षण विधि दशकों पहले अपनी सीमा तक पहुँच गई थी। आवश्यक डेटा बहुत बड़ा था, कम्प्यूटेशनल जटिलता बहुत अधिक थी, हार्डवेयर इसे संभालने में सक्षम नहीं था, और यह व्यावहारिक होने के लिए बहुत समय लेने वाला था। हालाँकि, हाल के वर्षों में, स्व-शिक्षण विधियों ने नए सिरे से ध्यान आकर्षित किया है क्योंकि हार्डवेयर के समग्र प्रदर्शन में सुधार हुआ है, जिसमें बढ़ी हुई मेमोरी और CPU प्रदर्शन शामिल है, और क्लाउड कंप्यूटर सहित मोबाइल कनेक्टिविटी के माध्यम से कहीं भी डेटा एकत्र करना, संग्रहीत करना और साझा करना बहुत आसान हो गया है।
इन बदलावों के बीच, स्व-शिक्षण की एक शाखा जिसे 'डीप लर्निंग' कहा जाता है, अग्रणी भूमिका निभा रही है। डीप लर्निंग एक ऐसी शिक्षण पद्धति है जिसकी संरचना मानव मस्तिष्क के समान होती है। मानव मस्तिष्क में मस्तिष्क के प्रत्येक भाग को जोड़ने वाले न्यूरॉन्स होते हैं, और यह ज्ञात है कि जैसे-जैसे हम सीखते हैं, भागों के बीच कनेक्शन का नेटवर्क मजबूत होता जाता है और अधिक बार उपयोग किया जाता है। यह डीप लर्निंग की प्रेरणा है, जिसमें न्यूरॉन्स की तरह, सीखने के प्रत्येक भाग के बीच एक कनेक्शन संरचना होती है, और यह संरचना लगातार बदलती रहती है क्योंकि अतिरिक्त प्रशिक्षण डेटा आता है, जिससे सीखने के भागों के बीच प्रतिक्रिया बनती है। इसलिए, यह पिछली सीख को फिर से बना सकता है और उसके आधार पर नए वातावरण के अनुकूल हो सकता है।

 

मशीन लर्निंग का वर्तमान और भविष्य

स्वायत्त और पर्यवेक्षित दोनों ही शिक्षण विधियों का उपयोग वर्तमान में विभिन्न उद्देश्यों के लिए किया जा रहा है। पर्यवेक्षित शिक्षण का उपयोग तेज़ विकास के लिए किया जाता है जिसे केवल एक विशिष्ट वातावरण में लागू करने की आवश्यकता होती है, जबकि स्वायत्त शिक्षण का उपयोग उन क्षेत्रों में किया जाता है जहाँ मशीनों की आवश्यकता होती है जिन्हें विभिन्न वातावरणों में लागू किया जा सकता है। हालाँकि, एक बात स्पष्ट है: दोनों दिशाओं में बहुत अधिक शोध चल रहा है।
हाल ही में, Facebook और Google सहित कई वैश्विक कंपनियाँ मशीन लर्निंग के विकास में बहुत अधिक ऊर्जा लगा रही हैं। Facebook पर्यवेक्षित शिक्षण विधियों का उपयोग करके चेहरे की पहचान करने वाली मशीनें विकसित करने के लिए कड़ी मेहनत कर रहा है, और Google ने हाल ही में डीप लर्निंग विशेषज्ञों के नेतृत्व वाली एक उद्यम कंपनी DeepMind का लगभग 440 बिलियन वॉन में अधिग्रहण किया है। यह तथ्य कि कंपनी केवल तीन साल पुरानी थी और उसने एक भी उत्पाद नहीं बेचा था, यह दर्शाता है कि Google मशीन लर्निंग में कितना निवेश कर रहा है। वर्तमान में, मशीन लर्निंग केवल वस्तुओं को पहचानने में सक्षम है, इसलिए यह मूवी Her में ऑपरेटिंग सिस्टम की तरह भावनाओं वाले मनुष्यों के साथ बातचीत करने में सक्षम होने से बहुत दूर है। हालाँकि, हाल ही में हुई प्रगति की तेज़ गति से पता चलता है कि Her से बात करने का दिन दूर नहीं है।
मशीन लर्निंग की संभावनाएं अनंत हैं। स्वास्थ्य सेवा में, रोगियों के निदान और उपचार में मदद करने के लिए AI सिस्टम विकसित किए जा रहे हैं, और वित्त में, बाजार में उतार-चढ़ाव की भविष्यवाणी करने और निवेश निर्णय लेने के लिए सिस्टम पेश किए जा रहे हैं। स्व-चालित कार, स्मार्ट होम और वॉयस असिस्टेंट जैसी हमारी ज़िंदगी को आसान बनाने वाली तकनीकें भी मशीन लर्निंग के विकास के साथ-साथ अधिक परिष्कृत और बुद्धिमान होती जा रही हैं। हम ऐसे युग में रह रहे हैं जहाँ मशीन लर्निंग लगातार विकसित हो रही है, और इसकी भविष्य की प्रगति अकल्पनीय है।
इसलिए, मशीन लर्निंग सिर्फ़ डेटा को प्रोसेस और एनालाइज़ करने वाली तकनीक नहीं है, बल्कि इससे मानव जीवन को समृद्ध बनाने और विभिन्न समस्याओं को हल करने में योगदान देने की उम्मीद है। ऐसी मशीनें जो मनुष्यों से भावनात्मक रूप से जुड़ सकती हैं, जैसे कि फिल्म “हर” में, दूर के भविष्य की कोई चीज़ लग सकती है, लेकिन संभावना अधिक से अधिक वास्तविक होती जा रही है। मशीन लर्निंग पहले से ही हमारे दैनिक जीवन में गहराई से समाहित है, और भविष्य के विकास हमें और अधिक आश्चर्य और नवाचार लाएंगे।

 

लेखक के बारे में

लेखक

मैं एक "बिल्ली जासूस" हूं, मैं खोई हुई बिल्लियों को उनके परिवारों से मिलाने में मदद करता हूं।
मैं कैफ़े लट्टे का एक कप पीकर खुद को तरोताज़ा कर लेता हूँ, घूमने-फिरने का आनंद लेता हूँ, और लेखन के ज़रिए अपने विचारों को विस्तृत करता हूँ। दुनिया को करीब से देखकर और एक ब्लॉग लेखक के रूप में अपनी बौद्धिक जिज्ञासा का अनुसरण करके, मुझे उम्मीद है कि मेरे शब्द दूसरों को मदद और सांत्वना दे पाएँगे।