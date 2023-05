नई दिल्ली, टेक डेस्क। Google ने हाल ही में DeepMind और Brain teams को Google DeepMind नामक एक बड़ी AI टीम में मिला दिया। नई टीम ने अब एक साथ अपने पहले काम पर डिटेल साझा किया है। इसमें एक सामूहिक विवरण शामिल है, जो बताता है कि YouTube शॉर्ट्स के लिए डिस्क्रिप्शन जनरेट करने में उसके एक विजुअल लैंग्वेज मॉडल (VLM) का उपयोग कैसे किया जा रहा है।

Google डीपमाइंड ने पोस्ट में बताया कि शॉर्ट्स कुछ ही मिनटों में बनाए जाते हैं और अक्सर इसमें डिस्क्रिप्शन और सहायक शीर्षक शामिल नहीं होते हैं, जिससे उन्हें सर्च के माध्यम से खोजना कठिन हो जाता है। इसलिए हमने अपने विजुअल लैंग्वेज मॉडल फ्लेमिंगो को डिस्क्रिप्शन जनरेट करने में मदद करने के लिए पेश किया।

फ्लेमिंगो नामक विजुअल लैंग्वेज मॉडल है, जो वीडियो में क्या चल रहा है यह समझाने के लिए वीडियो के शुरुआती फ्रेम्स को एनालाइज करके डिटेल बना सकता है। बता दें कि फ्लेमिंगो सभी नए शॉर्ट्स के लिए विवरण तैयार कर रहा है।

एक उदाहरण की मदद से आप इसे समझ सकते हैं कि मान लीजिए हमारे पास एक वीडियो है, जिसमें समुद्र तट पर एक आदमी है तो इसका डिस्क्रिप्शन ‘a video of a man on a beach’ हो सकता है। अब ये टेक्स्ट डिस्क्रिप्शन मेटाडेटा के रूप में वीडियो को बेहतर ढंग से वर्गीकृत करने और दर्शकों के प्रश्नों से सर्च रिजल्ट का मिलान करने के लिए संग्रहीत किया जाएगा।

Deepmind ने ट्वीट करके इसके बारे में विस्तरित जानकारी दी है। आइये इसके बारे में जानते हैं।

Our powerful visual language model Flamingo is changing the way 𝘺𝘰𝘶 can watch @YouTube Shorts. 🦩

It automatically generates descriptions for hundreds of millions of videos in their metadata, making them more searchable.

Here’s how AI is helping creators and viewers. ⬇️ pic.twitter.com/pAt7MxFNs1— Google DeepMind (@DeepMind) May 24, 2023