एएमयू छात्र का शोध बनेगा गूगल के कान, शोर शराबे में भी बोलकर सही कर सकेंगे टाइप

गूगल पर स्पीकर से किसी शब्द को सर्च करना हो या वाट्सएप पर बोलकर कुछ लिखना, अक्सर शोर-शराबे में यह संभव नहीं हो पाता है।

By Edited By: Publish:Mon, 24 Sep 2018 10:17 AM (IST) Updated:Tue, 25 Sep 2018 07:36 AM (IST)

एएमयू छात्र का शोध बनेगा गूगल के कान, शोर शराबे में भी बोलकर सही कर सकेंगे टाइप

अलीगढ़ (संतोष शर्मा)। गूगल पर स्पीकर से किसी शब्द को सर्च करना हो या वाट्सएप पर बोलकर कुछ लिखना, अक्सर शोर-शराबे में यह संभव नहीं हो पाता है। वह सही शब्द को सर्च नहीं कर पाता, मगर अब ऐसा नहीं होगा। अलीगढ़ मुस्लिम विश्वविद्यालय के शोध छात्र ने ऐसा सॉफ्टवेयर तैयार किया है, जिसके जरिये गूगल पर किसी भी शब्द को बोलकर भी शोर शराबे में सर्च किया जा सकेगा। छात्र का शोधपत्र इंटरनेशनल जर्नल ऑफ स्पीच टेक्नोलॉजी व अर्काइव ऑफ अर्कास्टिक्स में प्रकाशित हो चुका है ।

विपरीत परिस्थिति में पहचानेगा व्यक्ति का आवाज
होलीगेट (मथुरा) निवासी यशवर्धन वाष्र्णेय ने एएमयू के इलेक्ट्रॉनिक इंजीनियरिंग डिपार्टमेंट से 'सिग्नल चैनल मिक्स स्पीच रिकॉगनाइजेशन में पीएचडी की है। उन्होंने उस सॉफ्टवेयर पर काम किया है, जो विपरीत परिस्थिति में भी व्यक्ति की आवाज को पहचान ले।

चार साल बाद मिली कामयाबी
यशवर्धन के अनुसार अभी तक ऐसा नहीं था। गूगल के स्पीकर पर अगर दो व्यक्ति एक साथ बोल दें तो सही शब्द सर्च नहीं होता था। चार साल पहले उन्होंने ऐसे सॉफ्टवेयर पर काम शुरू किया, जो शोर-शराबे में भी टारगेट स्पीच को पहचान ले।

ये तकनीक बनाई
यशवर्धन ने बताया कि उन्होंने नॉन निगेटिव मैट्रिक्स फैक्टराइजेशन (एनएफएफ) सॉफ्टवेयर तैयार किया है, जो किसी भी स्पीच सिग्नल को टाइम फ्रीक्वेंसी कंपोनेंट में बदलकर आधार वेक्टर को अलग कर लेता है। एक से अधिक बोलने वाले लोगों की आवाज के सिग्नल को अलग कर सर्च कर सकता है। छात्र का दावा है कि कई घुली हुई आवाजों को भी मशीन इस सॉफ्टवेयर से अलग कर सर्च कर सकती है।

बैठक की रिकार्डिंग करने में होगी आसानी
कई बैठकों में हर वक्ता के विचार महत्वपूर्ण होते हैं। कुछ का रिकार्ड रखना भी जरूरी होता है। इस तकनीक से बैठक में होने वाली हर वक्ता की बात को लिखित रूप में रिकॉर्ड किया जा सकेगा। छात्र का दावा है कि माइक्रोफोन के जरिए ही एक साथ बोल रहे सभी व्यक्तियों की बात अलग-अलग करके पहचानी जा सकती है।

चैटिंग करने का अनुभव आसान होगा
इस तकनीक के आने से आवाज को पहचान कर टाइप करने वाले सॉफ्टवेयर की क्षमता बढ़ेगी। यूजर्स का भीड़ वाले इलाके में बिना मोबाइल में टाइप किए चैटिंग करने का अनुभव आसान होगा। यह शोध उन्होंने प्रो. जिया अहमद अब्बासी व प्रो. एमआर आबिदी की देखरेख में पूरा किया है।

शोध को कराया जाएगा पेटेंट
इलेक्ट्रॉनिक्स इंजीनियरिंग विभाग के प्रो. जिया अहमद अब्बासी का कहना है कि यह सॉफ्टवेयर आवाजों को अलग-अलग पहचान लेता है। गूगल के स्पीकर किसी शब्द को सर्च करने में अतिरिक्त शोर बाधा डालता है। अब ऐसा नहीं हो सकेगा। शोध को पेटेंट भी कराया जाएगा।

WhatsApp चैनल से जुड़ें

एएमयू छात्र का शोध बनेगा गूगल के कान, शोर शराबे में भी बोलकर सही कर सकेंगे टाइप

यह भी पढ़े