Robotics Transformer 2: अब रोबोट को सीखा सकेंगे ‘बेसिक मैनर’, Google ने पेश किया नया Ai मॉडल
Ai के आने के बाद से सभी टेक कंपनियों ने कई बड़े बदलावों की तरफ रुख किया है। लगभग हर कंपनी ने अपनी जरूरत के हिसाब से इसे आजमाया और उपयोग किया है। गूगल भी किसी से पीछे नहीं रहता है। इस बार कंपनी ने एक ऐसा एआई पेश किया है जो रोबोट्स को सामान्य सी चीजों को लेकर प्रशिक्षित करेगा जैसे कि कूड़े को बाहर फैकना।

नई दिल्ली , टेक डेस्क। Google ने एक AI मॉडल पेश किया है, जो रोबोट्स को कचरा बाहर निकालने जैसे सामान्य विचारों और अवधारणाओं को सीखने के लिए प्रशिक्षित कर सकता है। रोबोटिक्स ट्रांसफॉर्मर 2 या RT-2 कहा जाने वाला यह अपनी तरह का पहला विजन-लैंग्वेज-एक्शन (वीएलए) मॉडल है जिसे वेब से टेक्स्ट और इमेज पर प्रशिक्षित किया जा सकता है।
जैसे बड़े भाषा मॉडल (LLM) को सामान्य विचारों और अवधारणाओं को सीखने के लिए वेब टेक्स्ट पर प्रशिक्षित किया जाता है, आरटी -2 ज्ञान को रोबोट व्यवहार में अनुवादित करता है। गूगल ने कहा कि दूसरे शब्दों में, आरटी-2 रोबोट बोल सकता है।
चैटबॉट तकनीक से किस प्रकार भिन्न है यह मॉडल?
चैटबॉट्स के विपरीत, रोबोट को अत्यधिक परिवर्तनशील वातावरण में जटिल, अमूर्त कार्यों को संभालने में सक्षम होना चाहिए, खासकर वे काम जिन्हें उन्होंने पहले कभी नहीं देखा है। इसके साथ ही रोबोट्स को अपनी क्षमताओं को निखारने के लिए वास्तविक दुनिया में ‘ग्राउंडिंग’ (या प्रशिक्षण) की जरूरत होती है।
रोबोट का काम केवल इतना नहीं है कि वेसिर्फ सामान्य जानकारी रखें, उनको गहन जानकारी होनी चाहिए। मान लीजिए आप एक सेब देखते हैं तो रोबोट का काम केवल ये नहीं है कि वह जाने कि यह कैसे बढ़ता है, उसे यह पता होता कि इसके भौतिक गुण क्या है, या यहां तक कि वह सर आइजैक न्यूटन के सिर पर क्यों गिरा। एक रोबोट दो चीजों को अलग-अलग पहचानने में सक्षम होना चाहिए।
कैसे काम करता है मॉडल
इसके लिए भौतिक दुनिया की हर एक वस्तु, पर्यावरण, कार्य और स्थिति में, प्रत्यक्ष रूप से, अरबों डेटा बिंदुओं पर रोबोट्स को प्रशिक्षित करने की जरूरत थी। इस तरह का प्रशिक्षण समय लेने वाला और महंगा है, जो नवप्रवर्तकों के लिए इसे अव्यवहारिक बनाता है।
कंपनी की एआई शाखा गूगल डीपमाइंड ने कहा कि 6,000 से अधिक रोबोटिक परीक्षणों में आरटी-2 मॉडल के परीक्षण से इसने रोबोटिक डेटा से परे बेहतर सामान्यीकरण क्षमताओं और अर्थ और दृश्य समझ को दिखाया।
इसमें कहा गया कि इसमें नए आदेशों की व्याख्या करना और वस्तु की कैटेगरी या उच्च-स्तरीय जानकारी के बारे में तर्क जैसे प्राथमिक तर्क निष्पादित करके यूजर आदेशों का जवाब देना शामिल है।
कमेंट्स
सभी कमेंट्स (0)
बातचीत में शामिल हों
कृपया धैर्य रखें।