क्या ऐसी मशीनें कभी हकीकत बन पाएंगी जो फिल्म 'हर' में दिखाए गए एआई की तरह भावनाओं को समझ सकें और उन्हें बता सकें? हम मशीन लर्निंग की प्रगति और संभावनाओं का पता लगाते हैं।
फिल्म 'हर' में ऑपरेटिंग सिस्टम और मशीन लर्निंग
फिल्म हर में एक ऑपरेटिंग सिस्टम (OS) है जिसे अमांडा सेफ़्रेड ने आवाज़ दी है। OS ऐसे काम करता है जैसे कि उसमें भावनाएँ हों, किसी व्यक्ति के साथ बातचीत के शब्द-दर-शब्द ट्रांसक्रिप्ट को संग्रहीत करता है और उसके शौक, स्वाद और विशेषताओं को निकालने के लिए उनका विश्लेषण करता है। इससे दिलचस्प बातचीत के विषय और सहानुभूति पैदा होती है, और मुख्य पात्र थिओडोर सहित कई लोग OS से प्यार करने लगते हैं। आपको लग सकता है कि यह कंप्यूटर ऑपरेटिंग सिस्टम किसी साइंस फ़िक्शन फ़िल्म से निकला हुआ है। ऐसा इसलिए है क्योंकि मशीन बातचीत और बहुत सारे अनुभवों के ज़रिए इंसान की तरह सीखती है और उसके आधार पर नए कदम उठाती है। लेकिन ये सीखने वाली मशीनें पहले से ही हमारे चारों ओर मौजूद हैं। इन मशीनों के पीछे के सिद्धांत को सामूहिक रूप से मशीन लर्निंग के रूप में जाना जाता है।
मशीन लर्निंग क्या है?
मशीन लर्निंग बिल्कुल वैसा ही है जैसा कि यह सुनने में लगता है: मशीनें खुद को सिखाना सीखती हैं, खास तौर पर किसी तरह से हासिल किए गए अलग-अलग तरह के डेटा का विश्लेषण करके और उससे सीखकर, और फिर एक गणितीय आधार प्रदान करके जिसे नए तरह के डेटा पर लागू किया जा सकता है। इसकी कुंजी यह है कि आपको सीखने के लिए कंप्यूटर को स्पष्ट रूप से प्रोग्राम करने की ज़रूरत नहीं है, आपको बस उसे इनपुट देना है। उदाहरण के लिए, अगर आप कंप्यूटर को सेब की तस्वीर पहचानना सिखाते हैं, तो वह पहचान लेगा कि यह एक सेब है, अगर आप उसे पिछले वाले से अलग सेब की तस्वीर दिखाते हैं, भले ही आप सेब की विशेषताओं को निर्दिष्ट न करें।
मशीन लर्निंग को सीखने के तरीके के आधार पर दो मुख्य श्रेणियों में विभाजित किया जा सकता है। एक है सुपरवाइज्ड लर्निंग, जहाँ प्रशिक्षित किए जा रहे डेटा के लिए परिणाम (या लेबल) ज्ञात होता है। उदाहरण के लिए, जब आप Facebook पर कोई फ़ोटो पोस्ट करते हैं, तो यह स्वचालित रूप से आपके चेहरे को पहचान लेता है और उसे एक वर्ग के रूप में प्रदर्शित करता है। यह यह सीखकर किया जाता है कि कौन सी छवियाँ चेहरे हैं और कौन सी छवियाँ चेहरे नहीं हैं। दूसरे शब्दों में, यदि डेटा पिक्सेल के RGB मानों से युक्त एक छवि फ़ाइल है, तो परिणाम यह है कि यह एक चेहरा है या नहीं।
दूसरी ओर, मशीन लर्निंग की एक अन्य विधि, जिसे अनसुपरवाइज्ड लर्निंग कहा जाता है, में मशीन में एक छवि को फीड करना और उसे बिना यह निर्दिष्ट किए चलने देना शामिल है कि इसे कैसे वर्गीकृत किया जाना चाहिए। ऊपर दिए गए फेस रिकग्निशन प्रोग्राम में, मशीन छवि में विशेषताओं को खोजने और यह भेद करने में सक्षम है कि यह एक इंसान है या बिल्ली, भले ही उसे यह न बताया गया हो कि छवि के साथ क्या करना है, यानी, यह एक चेहरा है या कुछ और। एक अन्य उदाहरण एक पोर्टल साइट पर एक समाचार वर्गीकरण कार्यक्रम है। यदि आप एक पोर्टल साइट पर समाचार लेख देखते हैं, तो आप देख सकते हैं कि उन्हें विभिन्न क्षेत्रों में वर्गीकृत किया गया है, जैसे कि राजनीति, जीवन, मनोरंजन, और इसी तरह, और समान समाचारों को एक साथ समूहीकृत किया गया है और अनुशंसित किया गया है। ऐसा करने के लिए, पोर्टल साइट व्यवस्थापक लर्निंग मशीन को यह निर्दिष्ट नहीं करता है कि कौन से लेख राजनीति से संबंधित हैं, कौन से मनोरंजन से संबंधित हैं, कौन से खेल से संबंधित हैं, और इसी तरह, लेकिन जब विभिन्न प्रकार के बड़ी संख्या में लेख लर्निंग मशीन में फीड किए जाते हैं, तो यह अपने आप लेखों में शब्दों की आवृत्ति का विश्लेषण करता है और उच्च सटीकता के साथ नए लेखों को वर्गीकृत करता है।
पर्यवेक्षित शिक्षण विधियाँ
वर्तमान में अधिकांश मशीन लर्निंग के लिए उपयोग की जाने वाली लर्निंग विधि सुपरवाइज्ड लर्निंग है। यह सभी लर्निंग मशीनों का लगभग 95% है। इसका एक कारण यह है कि एक स्वायत्त लर्निंग विधि की तुलना में प्रदर्शन के एक निश्चित स्तर को प्राप्त करने के लिए कम प्रशिक्षण डेटा की आवश्यकता होती है, क्योंकि एक मानव सीधे डेटा पर परिणाम निर्दिष्ट कर रहा है। ऐसा इसलिए है क्योंकि स्वायत्त लर्निंग विधियों को इस डेटा के भीतर उन विशेषताओं को खोजने के लिए अधिक डेटा की आवश्यकता होती है जो अपने आप वस्तुओं के बीच भेदभाव कर सकती हैं - उदाहरण के लिए, एक मानव और एक बिल्ली के बीच, एक राजनीतिक लेख और एक मनोरंजन लेख के बीच। दूसरी ओर, सुपरवाइज्ड लर्निंग विधियाँ अपेक्षाकृत कम मात्रा में डेटा के साथ अच्छा प्रदर्शन कर सकती हैं क्योंकि वे मनुष्यों द्वारा निर्देशित होती हैं, जिससे डेटा एकत्र करने में लगने वाला समय और प्रशिक्षण चलाने में लगने वाला समय कम हो जाता है।
हालाँकि, पर्यवेक्षित शिक्षण में एक बड़ी खामी है: यह उन चीज़ों के बारे में नहीं सीख सकता है जो इसे मनुष्यों द्वारा नहीं सिखाई जाती हैं, और इसका प्रदर्शन उन वातावरणों में नाटकीय रूप से गिर सकता है जो मनुष्यों द्वारा सिखाए गए वातावरण से थोड़े अलग हैं। उदाहरण के लिए, एक उज्ज्वल वातावरण में किसी व्यक्ति की छवि पर प्रशिक्षित एक मशीन असमान प्रकाश या कम रोशनी में व्यक्ति को नहीं पहचान सकती है, या यह किसी व्यक्ति के चेहरे के केवल सामने वाले हिस्से को इनपुट करने पर उसके पक्ष को नहीं पहचान सकती है।
स्वायत्त शिक्षण विधियाँ
स्व-शिक्षण विधियाँ पर्यवेक्षित शिक्षण की कमियों और सीमाओं को संबोधित कर सकती हैं। हालाँकि, यह शिक्षण विधि दशकों पहले अपनी सीमा तक पहुँच गई थी। आवश्यक डेटा बहुत बड़ा था, कम्प्यूटेशनल जटिलता बहुत अधिक थी, हार्डवेयर इसे संभालने में सक्षम नहीं था, और यह व्यावहारिक होने के लिए बहुत समय लेने वाला था। हालाँकि, हाल के वर्षों में, स्व-शिक्षण विधियों ने नए सिरे से ध्यान आकर्षित किया है क्योंकि हार्डवेयर के समग्र प्रदर्शन में सुधार हुआ है, जिसमें बढ़ी हुई मेमोरी और CPU प्रदर्शन शामिल है, और क्लाउड कंप्यूटर सहित मोबाइल कनेक्टिविटी के माध्यम से कहीं भी डेटा एकत्र करना, संग्रहीत करना और साझा करना बहुत आसान हो गया है।
इन बदलावों के बीच, स्व-शिक्षण की एक शाखा जिसे 'डीप लर्निंग' कहा जाता है, अग्रणी भूमिका निभा रही है। डीप लर्निंग एक ऐसी शिक्षण पद्धति है जिसकी संरचना मानव मस्तिष्क के समान होती है। मानव मस्तिष्क में मस्तिष्क के प्रत्येक भाग को जोड़ने वाले न्यूरॉन्स होते हैं, और यह ज्ञात है कि जैसे-जैसे हम सीखते हैं, भागों के बीच कनेक्शन का नेटवर्क मजबूत होता जाता है और अधिक बार उपयोग किया जाता है। यह डीप लर्निंग की प्रेरणा है, जिसमें न्यूरॉन्स की तरह, सीखने के प्रत्येक भाग के बीच एक कनेक्शन संरचना होती है, और यह संरचना लगातार बदलती रहती है क्योंकि अतिरिक्त प्रशिक्षण डेटा आता है, जिससे सीखने के भागों के बीच प्रतिक्रिया बनती है। इसलिए, यह पिछली सीख को फिर से बना सकता है और उसके आधार पर नए वातावरण के अनुकूल हो सकता है।
मशीन लर्निंग का वर्तमान और भविष्य
स्वायत्त और पर्यवेक्षित दोनों ही शिक्षण विधियों का उपयोग वर्तमान में विभिन्न उद्देश्यों के लिए किया जा रहा है। पर्यवेक्षित शिक्षण का उपयोग तेज़ विकास के लिए किया जाता है जिसे केवल एक विशिष्ट वातावरण में लागू करने की आवश्यकता होती है, जबकि स्वायत्त शिक्षण का उपयोग उन क्षेत्रों में किया जाता है जहाँ मशीनों की आवश्यकता होती है जिन्हें विभिन्न वातावरणों में लागू किया जा सकता है। हालाँकि, एक बात स्पष्ट है: दोनों दिशाओं में बहुत अधिक शोध चल रहा है।
हाल ही में, Facebook और Google सहित कई वैश्विक कंपनियाँ मशीन लर्निंग के विकास में बहुत अधिक ऊर्जा लगा रही हैं। Facebook पर्यवेक्षित शिक्षण विधियों का उपयोग करके चेहरे की पहचान करने वाली मशीनें विकसित करने के लिए कड़ी मेहनत कर रहा है, और Google ने हाल ही में डीप लर्निंग विशेषज्ञों के नेतृत्व वाली एक उद्यम कंपनी DeepMind का लगभग 440 बिलियन वॉन में अधिग्रहण किया है। यह तथ्य कि कंपनी केवल तीन साल पुरानी थी और उसने एक भी उत्पाद नहीं बेचा था, यह दर्शाता है कि Google मशीन लर्निंग में कितना निवेश कर रहा है। वर्तमान में, मशीन लर्निंग केवल वस्तुओं को पहचानने में सक्षम है, इसलिए यह मूवी Her में ऑपरेटिंग सिस्टम की तरह भावनाओं वाले मनुष्यों के साथ बातचीत करने में सक्षम होने से बहुत दूर है। हालाँकि, हाल ही में हुई प्रगति की तेज़ गति से पता चलता है कि Her से बात करने का दिन दूर नहीं है।
मशीन लर्निंग की संभावनाएं अनंत हैं। स्वास्थ्य सेवा में, रोगियों के निदान और उपचार में मदद करने के लिए AI सिस्टम विकसित किए जा रहे हैं, और वित्त में, बाजार में उतार-चढ़ाव की भविष्यवाणी करने और निवेश निर्णय लेने के लिए सिस्टम पेश किए जा रहे हैं। स्व-चालित कार, स्मार्ट होम और वॉयस असिस्टेंट जैसी हमारी ज़िंदगी को आसान बनाने वाली तकनीकें भी मशीन लर्निंग के विकास के साथ-साथ अधिक परिष्कृत और बुद्धिमान होती जा रही हैं। हम ऐसे युग में रह रहे हैं जहाँ मशीन लर्निंग लगातार विकसित हो रही है, और इसकी भविष्य की प्रगति अकल्पनीय है।
इसलिए, मशीन लर्निंग सिर्फ़ डेटा को प्रोसेस और एनालाइज़ करने वाली तकनीक नहीं है, बल्कि इससे मानव जीवन को समृद्ध बनाने और विभिन्न समस्याओं को हल करने में योगदान देने की उम्मीद है। ऐसी मशीनें जो मनुष्यों से भावनात्मक रूप से जुड़ सकती हैं, जैसे कि फिल्म “हर” में, दूर के भविष्य की कोई चीज़ लग सकती है, लेकिन संभावना अधिक से अधिक वास्तविक होती जा रही है। मशीन लर्निंग पहले से ही हमारे दैनिक जीवन में गहराई से समाहित है, और भविष्य के विकास हमें और अधिक आश्चर्य और नवाचार लाएंगे।