Trending

    Move to Jagran APP
    pixelcheck
    विज्ञापन हटाएं सिर्फ खबर पढ़ें

    आवाज की हू-ब-हू नकल करने वाले स्पीच AI Model को तैयार कर रहा Microsoft, लॉन्च को लेकर है डर

    Updated: Tue, 16 Jul 2024 11:33 AM (IST)

    माइक्रोसॉफ्ट ने VALL-E स्पीच एआई मॉडल के सेकेंड जनरेशन को लेकर जानकारी दी है। यह स्पीच एआई मॉडल ऑडियो सैंपल की मदद से आवाज को तैयार कर सकता है। इस मॉडल को VALL-E 2 नाम दिया गया है। इस मॉडल को पिछले मॉडल अलग दो नए बदलावों के साथ तैयार किया जा रहा है जो इसकी परफोर्मेंस को बेहतर करने के लिए पेश किए जा रहे हैं।

    Hero Image
    Microsoft तैयार कर रहा एक नया एआई मॉडल, लेकिन लॉन्च को लेकर सता रहा डर

    टेक्नोलॉजी डेस्क, नई दिल्ली। माइक्रोसॉफ्ट ने एक रिसर्च प्रोजेक्ट को दिखाया है, जिसमें VALL-E स्पीच एआई मॉडल के सेकेंड जनरेशन को लेकर जानकारी दी गई है। यह स्पीच एआई मॉडल ऑडियो सैंपल की मदद से आवाज को तैयार कर सकता है। इस मॉडल को VALL-E 2 नाम दिया गया है। इस मॉडल को पिछले मॉडल अलग दो नए बदलावों के साथ तैयार किया जा रहा है, जो इसकी परफोर्मेंस को बेहतर करने के लिए पेश किए जा रहे हैं।

    विज्ञापन हटाएं सिर्फ खबर पढ़ें

    VALL-E 2 न्यूरल कोडेक लैंग्वेज मॉडल में लेटेस्ट एडवांस्मेंट है। यह जीरो शॉट टेक्स्ट-टू स्पीच सिंथेसिस में एक मील का पत्थर है, जो पहली बार मानव समानता प्राप्त करता है।

    माइक्रोसॉफ्ट

    VALL-E 2 को लेकर जानकारी देते हुए कंपनी का कहना है कि नया मॉडल पुराने मॉडल VALL-E पर आधारित है। इस नए मॉडल में रिपीटिशन अवेयर सैम्पलिंग और ग्रुप्ड कोड मॉडलिंग की सुविधा है।

    • रिपीटिशन अवेयर सैम्पलिंग
    • ग्रुप्ड कोड मॉडलिंग

    रिपीटिशन अवेयर सैम्पलिंग

    रिपीटिशन अवेयर सैम्पलिंग डिकोडिंग हिस्ट्री में टोकन रिपीटिशन को ध्यान में रखकर ऑरिजनल न्यूकलस सैंपलिंग प्रॉसेस को रिफाइन करता है और डिकोडिंग को स्थिर रखता है।

    ग्रुप्ड कोड मॉडलिंग

    ग्रुप्ड कोड मॉडलिंग कोडेक कोड को ग्रुप में अरेंज करता है ताकि सिक्वेंस लेंथ को बेहतर ढंग से छोटा किया जा सके। यह अनुमान लगाने की गति को बढ़ाता है और लंबे सिक्वेंस मॉडलिंग से जुड़ी परेशानी को दूर करता है।

    ये भी पढ़ेंः इस कंपनी ने लगाया एंड्रॉइड स्मार्टफोन पर बैन, कर्मचारियों को फ्री में देगी iPhone

    पब्लिकली लॉन्च नहीं होगा VALL-E 2

    VALL-E 2 वॉइस टैलेंट जैसी आवाज में बोल सकता है। वॉइस का सिमिलर होना और नेचुरल होना स्पीच प्रॉम्प्ट की क्वालिटी और लेंथ पर निर्भर करता है। यह बैकग्राउंड में हो रहे शोर और दूसरे फैक्टर पर भी निर्भर करता है। हालांकि, इस मॉडल का गलत इस्तेमाल हो सकता है।

    माइक्रोसॉफ्ट

    माइक्रोसॉफ्ट के रिसर्चर्स का साफ कहना है कि VALL-E 2 मात्र एक रिसर्च प्रोजेक्ट है। इस मॉडल का इस्तेमाल एजुकेशनल लर्निंग, एंटरटेनमेंट, जर्नलिस्टिक, सेल्फ-ऑथर्ड कंटेंट, एक्सेसिबिलिटी फीचर्स, इंटरेक्विव वॉइस रिस्पॉन्स सिस्टम, ट्रांसलेशन चैटबॉट के लिए किया जा सकता है। हालांकि, क्योंकि इस मॉडल के गलत इस्तेमाल होने को लेकर भी संभावनाएं बनती हैं, इसलिए कंपनी इसे पब्लिकली लॉन्च नहीं करेगी।