Meta ने पेश किया नया जनरेटिव AI स्पीच टूल, Voicebox इन मायनों में है खास
Meta Generative AI Speech Tool Voicebox मेटा ने अपने यूजर्स के लिए एक नया एआई मॉडल पेश किया है। नया मॉडल एक जनरेटिव एआई स्पीच टूल है। इस नए मॉडल का ना ...और पढ़ें

नई दिल्ली, टेक डेस्क। मेटा ने यूजर्स के लिए जनरेटिव एआई स्पीच टूल पेश किया है। इस स्पीच को वॉइसबॉक्स के नाम से लाया गया है। मेटा का नया एआई स्पीच टूल पिछले मॉडल्स से अलग खासियतों के साथ लाया गया है।
क्या है Voicebox, कैसे करता है काम?
दरअसल वॉइसबॉक्स हाई क्वालिटी ऑडियो क्लिप्स को अलग-अलग स्टाइल में प्रोड्यूस कर सकता है। वॉइसबॉक्स के इस्तेमाल के साथ यूजर एक नए और फ्रेश डेटा को इनपुट के लिए दे सकता है।
इसके अलावा, यूजर के लिए वॉइसबॉक्स पुराने सैम्पल को मॉडिफाई करने का भी काम करता है। मेटा के इस नए एआई मॉडल को 6 भाषाओं के सपोर्ट के साथ लाया गया है। इसके अलावा, मॉडल शोर को हटा कर कंटेंट एडिटिंग स्टाइल कन्वर्सेशन और अलग-अलग सैम्पल जनरेशन का काम करता है।
मीडिया रिपोर्ट्स की मानें तो मेटा के इस नए एआई स्पीच मॉडल को 50,000 घंटों की रिकोर्डेड स्पीच के साथ तैयार किया गया है। इसके अलावा, मॉडल को अलग-अलग भाषाओं की पब्लिक डोमेन ऑडियोबुक्स के साथ भी ट्रेनिंग दी गई है।
मेटा का स्पीच मॉडल कौन-कौन से काम कर सकता है?
मेटा का स्पीच मॉडल उन यूजर्स के लिए एक खास मॉडल है जो बोलने में असमर्थ हैं। मॉडल के टेक्स्ट टू स्पीच फीचर के साथ यह स्पीच जरनरेशन टास्क को परफोर्म कर सकता है। टेक्स्ट टू स्पीच फीचर के साथ मॉडल दिए गए इनपुट के साथ ऑडियो स्टाइल को मैच करने की कोशिश करता है, जिसके बाद टेक्स्ट से स्पीच को जनरेट किया जाता है। यह मॉडल यूजर्स के लिए वॉइस कस्टमाइजेशन सुविधा के साथ आता है।
माॉडल को क्रोस-लिंग्वल स्टाइल ट्रांसफर फीचर के साथ लाया गया है। English, French, German, Spanish, Polish, और Portuguese भाषा के साथ यूजर वॉइसबॉक्स को स्पीच और टेक्स्ट इनपुट दे सकता है। वॉइसबॉक्स दिए गए टेक्स्ट को पढ़ने का काम करता है। यह फीचर अलग-अलग भाषा बोलने वाले दो लोगों के बीच कम्युनिकेशन को आसान और नेचुरल बनाता है।
मेटा का यह एआई मॉडल एडिटिंग और स्पीच में शोर को खत्म करने की खूबी के साथ लाया गया है। मॉडल की इस खूबी की मदद से स्पीच में गलत उच्चारण वाले शब्दों को हटाया जा सकेगा। इतना ही नहीं, यह स्पीच तैयार करते हुए शोर को भी खत्म करता है। ऐसे में यूजर को पूरी स्पीच को दोबारा रिकॉर्ड करने की जरूरत नहीं होगी।

कमेंट्स
सभी कमेंट्स (0)
बातचीत में शामिल हों
कृपया धैर्य रखें।