वॉयस बायोमेट्रिक और स्पीकर रिकग्निशन के बारे में About Voice biometric and Speaker Recognition

वॉयस बायोमेट्रिक और स्पीकर रिकग्निशन के बारे में

बायोमेट्रिक्स किसी व्यक्ति के कुछ शारीरिक या व्यवहारिक माप होते हैं। इस तरह के बायोमेट्रिक्स या तो शारीरिक हो सकते हैं जैसे फ़िंगरप्रिंट, फेस, आइरिस, रेटिना, हैंड ज्योमेट्री, डीएनए, ईयर आदि या यह सिग्नेचर, वॉयस, गैट, कीस्ट्रोक्स आदि जैसे व्यवहारिक हो सकते हैं। वॉयस बायोमेट्रिक का उपयोग अब उच्च शोध में है-ए- दिन। वॉयस एकमात्र बायोमेट्रिक है जो उपयोगकर्ताओं को दूरस्थ रूप से प्रमाणित करने की अनुमति देता है। वॉयस बायोमेट्रिक उपयोग से संबंधित लाभ हैं जैसे i) गैर घुसपैठ, ii) व्यापक उपलब्धता और संचरण में आसानी, ii) कम लागत, छोटे भंडारण स्थान की आवश्यकता और iv) उपयोग में आसानी, माइक्रोफोन के साथ छोटे इलेक्ट्रॉनिक उपकरणों के लिए कॉम्पैक्ट आदि। इसके विपरीत, कुछ नुकसान भी हैं जैसे i) कम स्थायित्व, उम्र बढ़ने की समस्या, खांसी-जुकाम, भावनात्मक परिवर्तन, ii) उच्च पृष्ठभूमि और नेटवर्क शोर के साथ समस्याएं, iii) कमरे की ध्वनिकी और डिवाइस बेमेल आदि के प्रति संवेदनशीलता। एक व्यवहारिक बायोमेट्रिक होने के नाते, मानव आवाज मानव डीएनए की तरह अद्वितीय नहीं है। लेकिन फिर भी, सटीक रूप से डिज़ाइन किए गए दायरे और अनुप्रयोगों के साथ, हमारे नियमित दैनिक जीवन में विशिष्ट प्रमाणीकरण आवश्यकताओं के लिए इसका प्रयास किया जा सकता है। ये सभी केवल वॉयस बायोमेट्रिक का उपयोग करके किसी व्यक्ति की पहचान को पहचानने के चुनौतीपूर्ण कार्य के पीछे आधार या प्रेरणा बनाते हैं, जिसे स्वचालित स्पीकर पहचान के रूप में जाना जाता है। समस्या विनिर्देश के आधार पर, कार्य या तो स्वचालित स्पीकर पहचान (यह निर्धारित करना कि कौन बोल रहा है) या स्वचालित स्पीकर सत्यापन (यह सत्यापित करना कि वही व्यक्ति बोल रहा है जिसका दावा किया जा रहा है, या नहीं) हो सकता है।

उपलब्ध समाधान

CDAC कोलकाता कोर रिसर्च पहल के तहत, एडवांस्ड स्पीच प्रोसेसिंग सेक्शन ने ऑटोमैटिक स्पीकर रिकग्निशन सिस्टम (SRS) का एक प्रोटोटाइप विकसित किया है। यह मूल रूप से एक स्टैंडअलोन डेस्कटॉप आधारित व्यक्ति प्रमाणीकरण एप्लिकेशन है जो स्पीकर से माइक्रोफ़ोन भाषण इनपुट लेता है और वॉयस बायोमेट्रिक्स का उपयोग करके यह कर्मियों की पहचान को पहचानता है। इस प्रणाली में कॉर्पोरेट उपयोग के लिए पहचान के साथ-साथ सत्यापन के लिए दो अलग-अलग सॉफ्टवेयर शामिल हैं जैसे कर्मचारी उपस्थिति रिकॉर्डर और कार्यालय के भीतर प्रतिबंधित क्षेत्रों तक सुरक्षित पहुंच। यहां उपयोग की जाने वाली प्रमुख प्रौद्योगिकियां ध्वनिक सिग्नल प्रोसेसिंग हैं, जो बोले गए उच्चारणों से स्पीकर की विशिष्ट विशेषताओं को निकालने के लिए और कॉम्पैक्ट स्पीकर मॉडल और क्वेरी वॉयस पैटर्न के मिलान के लिए पैटर्न की पहचान करती हैं। इसके अलावा एक नया पिच आधारित डायनेमिक प्रूनिंग (पीबीडीपी) एल्गोरिथम खोज स्थान अनुकूलन और बड़े जनसंख्या आकार में बेहतर प्रदर्शन के लिए पेश किया गया है।

समाधान विशेषताएं:

पाठ और भाषा स्वतंत्र पहचान ->

कोई निश्चित या पूर्वनिर्धारित पाठ नहीं, नामांकन और परीक्षण के लिए अलग पाठ बोला जा सकता है। किसी भी भाषा के किसी भी वैध उच्चारण की अनुमति है।

कम बातचीत समय –> नामांकन भाषण के केवल एक मिनट और परीक्षण भाषण के पांच सेकंड (न्यूनतम पर) के साथ प्रदर्शन करने में सक्षम।

विविध वातावरण के लिए समर्थन -> कोई विशेष शोर-सबूत रिकॉर्डिंग संलग्नक की आवश्यकता नहीं है, सामान्य कार्यालय या प्रयोगशाला वातावरण में निम्न स्तर के शोर के साथ रिकॉर्डिंग की अनुमति है।

इनपुट परिवर्तनशीलता के लिए समर्थन ->

वाइड बैंड और नैरो बैंड इनपुट स्पीच सिग्नल दोनों के लिए समर्थन। तेजी से पहचान प्रक्रिया -> बड़े डेटाबेस आकार के लिए कुशल स्पीकर प्रूनिंग का उपयोग करता है।

अब तक की उपलब्धियां :

पेटेंट: विकसित प्रौद्योगिकी और प्रोटोटाइप प्रणाली के लिए 21 मई, 2014 को एक भारतीय पेटेंट (आवेदन संख्या 566/केओएल/2014 के साथ) दायर किया।

पुरस्कार: सीएसआई यंग आईटी प्रोफेशनल (वाईआईटीपी) पूर्वी क्षेत्र, नवंबर, 2011 में प्रथम उपविजेता।

कोलकाता, नई दिल्ली में एक कानून प्रवर्तन एजेंसी के क्षेत्रीय कार्यालय और मुख्यालय और राज्य अपराध रिकॉर्ड ब्यूरो, जयपुर, राजस्थान में फील्ड परीक्षण और सिस्टम की स्थापना। 16वें राष्ट्रीय एक्सपो, CDAC TechX’13 और प्रौद्योगिकी सम्मेलनों में प्रणाली का प्रदर्शन। पेपर प्रकाशन: अब तक कुल पांच सम्मेलन पत्र प्रकाशित हो चुके हैं।

हाल की गतिविधियां :

CDAC कोलकाता कोर फंडिंग के तहत, वर्तमान में शुरू में विकसित प्रोटोटाइप उत्पादीकरण प्रक्रिया के तहत है। फील्ड ट्रायल फीडबैक विश्लेषण के अनुसार, आवाज प्रमाणीकरण के लिए दो वक्ताओं की बातचीत पर विचार करने के लिए स्पीकर डायराइजेशन घटक को शामिल करने की पहल भी शुरू की गई है।

Leave a Reply

Your email address will not be published.