Trending

    Move to Jagran APP
    pixelcheck
    विज्ञापन हटाएं सिर्फ खबर पढ़ें

    Meta ने पेश किया नया जनरेटिव AI स्पीच टूल, Voicebox इन मायनों में है खास

    By Shivani KotnalaEdited By: Shivani Kotnala
    Updated: Sun, 18 Jun 2023 09:08 AM (IST)

    Meta Generative AI Speech Tool Voicebox मेटा ने अपने यूजर्स के लिए एक नया एआई मॉडल पेश किया है। नया मॉडल एक जनरेटिव एआई स्पीच टूल है। इस नए मॉडल का ना ...और पढ़ें

    Hero Image
    Meta introduces Voicebox Generative AI speech Tool Know More About Its Features

    नई दिल्ली, टेक डेस्क। मेटा ने यूजर्स के लिए जनरेटिव एआई स्पीच टूल पेश किया है। इस स्पीच को वॉइसबॉक्स के नाम से लाया गया है। मेटा का नया एआई स्पीच टूल पिछले मॉडल्स से अलग खासियतों के साथ लाया गया है।

    विज्ञापन हटाएं सिर्फ खबर पढ़ें

    क्या है Voicebox, कैसे करता है काम?

    दरअसल वॉइसबॉक्स हाई क्वालिटी ऑडियो क्लिप्स को अलग-अलग स्टाइल में प्रोड्यूस कर सकता है। वॉइसबॉक्स के इस्तेमाल के साथ यूजर एक नए और फ्रेश डेटा को इनपुट के लिए दे सकता है।

    इसके अलावा, यूजर के लिए वॉइसबॉक्स पुराने सैम्पल को मॉडिफाई करने का भी काम करता है। मेटा के इस नए एआई मॉडल को 6 भाषाओं के सपोर्ट के साथ लाया गया है। इसके अलावा, मॉडल शोर को हटा कर कंटेंट एडिटिंग स्टाइल कन्वर्सेशन और अलग-अलग सैम्पल जनरेशन का काम करता है।

    मीडिया रिपोर्ट्स की मानें तो मेटा के इस नए एआई स्पीच मॉडल को 50,000 घंटों की रिकोर्डेड स्पीच के साथ तैयार किया गया है। इसके अलावा, मॉडल को अलग-अलग भाषाओं की पब्लिक डोमेन ऑडियोबुक्स के साथ भी ट्रेनिंग दी गई है।

    मेटा का स्पीच मॉडल कौन-कौन से काम कर सकता है?

    मेटा का स्पीच मॉडल उन यूजर्स के लिए एक खास मॉडल है जो बोलने में असमर्थ हैं। मॉडल के टेक्स्ट टू स्पीच फीचर के साथ यह स्पीच जरनरेशन टास्क को परफोर्म कर सकता है। टेक्स्ट टू स्पीच फीचर के साथ मॉडल दिए गए इनपुट के साथ ऑडियो स्टाइल को मैच करने की कोशिश करता है, जिसके बाद टेक्स्ट से स्पीच को जनरेट किया जाता है। यह मॉडल यूजर्स के लिए वॉइस कस्टमाइजेशन सुविधा के साथ आता है।

    माॉडल को क्रोस-लिंग्वल स्टाइल ट्रांसफर फीचर के साथ लाया गया है। English, French, German, Spanish, Polish, और Portuguese भाषा के साथ यूजर वॉइसबॉक्स को स्पीच और टेक्स्ट इनपुट दे सकता है। वॉइसबॉक्स दिए गए टेक्स्ट को पढ़ने का काम करता है। यह फीचर अलग-अलग भाषा बोलने वाले दो लोगों के बीच कम्युनिकेशन को आसान और नेचुरल बनाता है।

    मेटा का यह एआई मॉडल एडिटिंग और स्पीच में शोर को खत्म करने की खूबी के साथ लाया गया है। मॉडल की इस खूबी की मदद से स्पीच में गलत उच्चारण वाले शब्दों को हटाया जा सकेगा। इतना ही नहीं, यह स्पीच तैयार करते हुए शोर को भी खत्म करता है। ऐसे में यूजर को पूरी स्पीच को दोबारा रिकॉर्ड करने की जरूरत नहीं होगी।