Google I/O 2025: गूगल के सबसे एडवांस्ड AI इमेज और वीडियो जेनरेशन टूल्स हुए पेश; ऑटोमैटिकली जनरेट होगा ऑडियो
Google I/O 2025 में गूगल ने अपने सबसे एडवांस्ड AI इमेज और वीडियो जेनरेशन टूल्स Imagen 4 और Veo 3 को पेश किया। ये AI मॉडल्स टेक्स्ट या इमेज प्रॉम्प्ट्स से शॉर्ट वीडियो और इमेज बनाते हैं। Veo 3 ऑटोमैटिक ऑडियो जनरेट करता है जबकि Imagen 4 2K रेजोल्यूशन और टेक्स्ट हैंडलिंग में बेहतर है। आइए इनके बारे में जानते हैं विस्तार से।

टेक्नोलॉजी डेस्क, नई दिल्ली। Google I/O 2025 कीनोट में गूगल ने अपने अब तक के सबसे एडवांस्ड AI इमेज और वीडियो जेनरेशन टूल्स पेश किए- इमेज जेनरेशन के लिए Imagen 4 और वीडियो जेनरेशन के लिए Veo 3। ये नए AI मॉडल्स टेक्स्ट या इमेज प्रॉम्प्ट्स के आधार पर शॉर्ट वीडियो क्लिप्स और इमेज जनरेट करेंगे। वीडियो के साथ-साथ, Veo 3 अपने क्लिप्स में ऑटोमैटिक और रिलेवेंट ऑडियो भी जनरेट करेगा।
गूगल का कहना है कि Veo 3 इसका लेटेस्ट वीडियो जेनरेशन मॉडल है, जो टेक्स्ट या इमेज प्रॉम्प्ट्स से शॉर्ट वीडियो क्लिप्स बना सकता है। कंपनी ने बताया कि Veo 3 मॉडल मोशन, एनवायरनमेंटल इंटरैक्शन और सीन कंसिस्टेंसी को बेहतर ढंग से हैंडल कर वीडियो रियलिज़म को बढ़ाता है।
कंपनी के मुताबिक, Veo 3 अब US में Google AI Ultra प्लान सब्सक्राइबर्स के लिए बीटा में उपलब्ध है, जिसे Gemini ऐप और गूगल के AI फिल्ममेकिंग प्लेटफॉर्म Flow के जरिए एक्सेस किया जा सकता है, जिसे I/O में भी रिवील किया गया। एंटरप्राइज एक्सेस Vertex AI के जरिए दिया जा रहा है।
इसके साथ ही, गूगल ने पिछले जेनरेशन Veo 2 में भी अपडेट्स पेश किए हैं। इनमें शामिल हैं:
रेफरेंस इनपुट्स: यूजर्स अब लोगों, ऑब्जेक्ट्स या स्टाइल्स की इमेज अपलोड कर सीन में कंसिस्टेंसी बनाए रख सकते हैं।
कैमरा कंट्रोल्स: नए मॉडल में पैन, जूम और रोटेट जैसे ऑप्शन्स हैं, जिन्हें प्रॉम्प्ट में डिफाइन किया जा सकता है।
आउटपेंटिंग: वीडियो को ओरिजिनल फ्रेम से आगे बढ़ाया जा सकता है, जो फॉर्मेट्स को एडजस्ट करने में उपयोगी है।
ऑब्जेक्ट ऐड और रिमूव: Veo 2 मॉडल यूजर्स को फ्रेम्स में ऑब्जेक्ट्स जोड़ने या हटाने की सुविधा देता है। मॉडल लाइटिंग और शैडोज को कंसिस्टेंट रखता है।
Imagen 4 के बारे में जानें
वीडियो AI मॉडल के साथ, गूगल ने नया AI इमेज जेनरेटर भी पेश किया है, जिसका नाम Imagen 4 है। नया मॉडल 2K रेजोल्यूशन को सपोर्ट करता है, जिसमें फैब्रिक टेक्सचर्स, रिफ्लेक्शन्स और फर जैसे डिटेल्स को बेहतर ढंग से हैंडल करता है। मॉडल फोटोरियलिस्टिक और इलस्ट्रेटिव प्रॉम्प्ट्स जैसे अलग-अलग स्टाइल्स में काम करता है।
Imagen 4 की खासियत है कि ये इमेज में टेक्स्ट को हैंडल कर सकता है- यानी सटीक स्पेलिंग- जो इसे पोस्टर्स, स्लाइड्स या कस्टम टाइपोग्राफी वाले कार्ड्स जनरेट करने के लिए उपयोगी बनाता है।
गूगल अब Imagen 4 को Gemini, Vertex AI, Whisk और Docs, Slides, Vids जैसे Workspace टूल्स में इंटीग्रेट कर रहा है। गूगल ने ये भी घोषणा की कि जल्द ही Imagen 3 से 10 गुना तेज वर्जन रिलीज होगा, जो रैपिड प्रोटोटाइपिंग के लिए होगा।
कमेंट्स
सभी कमेंट्स (0)
बातचीत में शामिल हों
कृपया धैर्य रखें।