Move to Jagran APP

एएमयू छात्र का शोध बनेगा गूगल के कान, शोर शराबे में भी बोलकर सही कर सकेंगे टाइप

गूगल पर स्पीकर से किसी शब्द को सर्च करना हो या वाट्सएप पर बोलकर कुछ लिखना, अक्सर शोर-शराबे में यह संभव नहीं हो पाता है।

By Edited By: Published: Mon, 24 Sep 2018 10:17 AM (IST)Updated: Tue, 25 Sep 2018 07:36 AM (IST)
एएमयू छात्र का शोध बनेगा गूगल के कान, शोर शराबे में भी बोलकर सही कर सकेंगे टाइप
एएमयू छात्र का शोध बनेगा गूगल के कान, शोर शराबे में भी बोलकर सही कर सकेंगे टाइप

अलीगढ़ (संतोष शर्मा)। गूगल पर स्पीकर से किसी शब्द को सर्च करना हो या वाट्सएप पर बोलकर कुछ लिखना, अक्सर शोर-शराबे में यह संभव नहीं हो पाता है। वह सही शब्द को सर्च नहीं कर पाता, मगर अब ऐसा नहीं होगा। अलीगढ़ मुस्लिम विश्वविद्यालय के शोध छात्र ने ऐसा  सॉफ्टवेयर तैयार किया है, जिसके जरिये गूगल पर किसी भी शब्द को बोलकर भी शोर शराबे में सर्च किया जा सकेगा। छात्र का शोधपत्र इंटरनेशनल जर्नल ऑफ स्पीच टेक्नोलॉजी व अर्काइव ऑफ अर्कास्टिक्स में प्रकाशित हो चुका है ।

prime article banner

विपरीत परिस्थिति में पहचानेगा व्यक्ति का आवाज
होलीगेट (मथुरा) निवासी यशवर्धन वाष्र्णेय ने एएमयू के इलेक्ट्रॉनिक इंजीनियरिंग डिपार्टमेंट से 'सिग्नल चैनल मिक्स स्पीच रिकॉगनाइजेशन में पीएचडी की है। उन्होंने उस सॉफ्टवेयर पर काम किया है, जो विपरीत परिस्थिति में भी व्यक्ति की आवाज को पहचान ले।

चार साल बाद मिली कामयाबी
यशवर्धन के अनुसार अभी तक ऐसा नहीं था। गूगल के स्पीकर पर अगर दो व्यक्ति एक साथ बोल दें तो सही शब्द सर्च नहीं होता था। चार साल पहले उन्होंने ऐसे सॉफ्टवेयर पर काम शुरू किया, जो शोर-शराबे में भी टारगेट स्पीच को पहचान ले।

ये तकनीक बनाई
यशवर्धन ने बताया कि उन्होंने नॉन निगेटिव मैट्रिक्स फैक्टराइजेशन (एनएफएफ) सॉफ्टवेयर तैयार किया है, जो किसी भी स्पीच सिग्नल को टाइम फ्रीक्वेंसी कंपोनेंट में बदलकर आधार वेक्टर को अलग कर लेता है। एक से अधिक बोलने वाले लोगों की आवाज के सिग्नल को अलग कर सर्च कर सकता है। छात्र का दावा है कि कई घुली हुई आवाजों को भी मशीन इस सॉफ्टवेयर से अलग कर सर्च कर सकती है।

बैठक की रिकार्डिंग करने में होगी आसानी
कई बैठकों में हर वक्ता के विचार महत्वपूर्ण होते हैं। कुछ का रिकार्ड रखना भी जरूरी होता है। इस तकनीक से बैठक में होने वाली हर वक्ता की बात को लिखित रूप में रिकॉर्ड किया जा सकेगा। छात्र का दावा है कि माइक्रोफोन के जरिए ही एक साथ बोल रहे सभी व्यक्तियों की बात अलग-अलग करके पहचानी जा सकती है।

चैटिंग करने का अनुभव आसान होगा
इस तकनीक के आने से आवाज को पहचान कर टाइप करने वाले सॉफ्टवेयर की क्षमता बढ़ेगी। यूजर्स का भीड़ वाले इलाके में बिना मोबाइल में टाइप किए चैटिंग करने का अनुभव आसान होगा। यह शोध उन्होंने प्रो. जिया अहमद अब्बासी व प्रो. एमआर आबिदी की देखरेख में पूरा किया है।

शोध को कराया जाएगा पेटेंट
इलेक्ट्रॉनिक्स इंजीनियरिंग विभाग के प्रो. जिया अहमद अब्बासी का कहना है कि यह सॉफ्टवेयर आवाजों को अलग-अलग पहचान लेता है। गूगल के स्पीकर किसी शब्द को सर्च करने में अतिरिक्त शोर बाधा डालता है। अब ऐसा नहीं हो सकेगा। शोध को पेटेंट भी कराया जाएगा।


Jagran.com अब whatsapp चैनल पर भी उपलब्ध है। आज ही फॉलो करें और पाएं महत्वपूर्ण खबरेंWhatsApp चैनल से जुड़ें
This website uses cookies or similar technologies to enhance your browsing experience and provide personalized recommendations. By continuing to use our website, you agree to our Privacy Policy and Cookie Policy.