-
فناوری تشخیص گفتار
فناوری تشخیص گفتار به رایانهای که توانایی دریافت صدا را دارد (برای مثال به یک میکروفن مجهز است) این قابلیت را میدهد که صحبت کاربر را متوجه شود. این فناوری در تبدیل گفتار به متن و یا به عنوان جایگزینی برای ارتباط با رایانه کاربرد دارد.
برقراري ارتباط گفتاري با كامپيوترها به جاي استفاده از صفحه كليد و ماوس يكي از زمينههاي تحقيقاتي مهم چند دههي اخير بوده است و شركتهاي بزرگي چون IBM، ALIT، Philips و Microsoft سالانه هزينههاي هنگفتي را براي اين منظور پرداخت کرده و ميكنند.
به عنوان يک کاربر کامپيوتر، احتمالاً با قابليت گفتاري مجموعه آفيس به عنوان يكي از ويژگيهاي جذاب و تا حدي فانتزي برخورد كرده و يا با آن كار كردهايد. به کمک اين قابليت شما به جاي استفاده از صفحه كليد براي تايپ مطالبتان، به راحتي با خواندن متن مورد نظر و انتقال گفتارتان به كمك يك ميكروفون معمولي به کامپيوتر، آنرا در محيط Word تايپ شده ميبينيد. حتي براي ذخيره كردن، کپي کردن، گذاشتن عكس در متن و . . . به جاي كليكهاي پشت سر هم و گاهي با تعداد بالا، ميتوانيد فرمان مربوطه را به كمك گفتار به نرمافزار داده تا كار شما را انجام دهد.
جداي از اينكه توانايي درست كاركردن اين قابليت آفيس چقدر باشد، يك محدوديت بزرگ در سر راه استفاده از آن براي ما ايرانيان وجود دارد: اين قابليت فقط براي زبان انگليسي است. (البته زبانهاي چيني يا ژاپني را نيز ميتوان استفاده كرد!). ايجاد چنيني سيستمي كه آنرا تشخيص يا بازشناسي گفتار (Speech recognition) مينامند، در زبان فارسي، چندين سال از تحقيقات محققان، اساتيد و دانشجويان دانشگاههاي مختلف كشور را به خود اختصاص داده است. اما جديترين جهشي كه در حدود ده سال پيش در اين زمينه ايجاد شد، ايجاد دادگان گفتاري فارسدات و يك سيستم اوليه تشخيص گفتار فارسي در مركز هوشمند علائم بوده است.
در ادامه و در طي يکي-دو سال اخير، مهمترين دستاورد در اين تكنولوژي براي زبان فارسي، سيستمهاي تشخيص گفتار شركت عصرگويش پرداز (ASR Gooyesh Pardaz ) http://www.asr-gooyesh.com است. اين شركت که توسط گروهي از اساتيد و دانشجويان دانشگاه صنعتي شريف ايجاد شده است، تنها فعاليت تخصصي خود را در زمينه پردازش سيگنال گفتار و بويژه تشخيصخودكار آن قرار داده است و نرمافزارهايي را براي انجام كار تشخيص خودكار گفتار توسعه داده است.
نرمافزار نويسا كه براي ديكته خودكار ميباشد و نرمافزار نيوشا كه جهت تشخيص گفتار از پشت خط تلفن توسعه داده شده است، از دستاوردهاي آنهاست. از نظر فني، معيارهايي چون وابسته يا متعلق بوده به گوينده بودن سيستم، اندازه و تعداد واژگان، پيوسته يا گسسته بودن گفتار ورودي، استفاده از محدوديتهاي زباني و كارايي در محيطهاي واقعي توانمندي سيستمهاي تشخيص گفتار را مشخص ميكند.
در كاربردهايي مانند تشخيص گفتار تلفني، اطن سيستم لزوماً بايد مستقل از گوينده باشند اما سيستم ديكته ميتواند وابسته به گوينده خاص باشد و براي آن گوينده سيستم بهترين كارايي را داشته باشد. در كاربردهاي واقعي معمولاً سيستم را مستقل از گوينده ميسازند و موقع استفاده به صداي گوينده خاصي آنرا اصطلاحاً تطبيق ميكنند.
اين كار در قابليت گفتاري مجموعه آفيس به كمك خواندن متون اوليه در ويزارد سيستم انجام ميشود، چنين قابليتي در سيستم نويسا نيز وجود دارد. هر چه تعداد واژگاني كه سيستم ميتواند تشخيص دهد بيشتر باشد، شباهت ميان كلمات بيشتر شده و در نتيجه كارايي سيستم به علت افزايش اشتباهات كاهش پيدا ميكند.
از اينررو در كاربرداهاي واقعي معمولآً فقط واژگان متناسب با كاربرد مورد نظر را انتخاب ميكنند تا محدود شود. در قابليت گفتاري آفيس هم كه ادعا ميشود اكثر كلمات انگليسي را دارد، كارايي به شدت پايين است (كارايي پايين آن به علت اين است كه ما غيرانگليسي زبان هستيم!) ولي در محصولات محدودتر اين شركت مانند قابليت گفتار I-mate كارايي به مراتب بهتر است. گفتار كاربر ميتواند پيوسته و طبيعي و يا با مكث ميان كلمات همراه باشد، بديهي است كه حالت اول مطلوب هركاربري است. يكي از مشكلاتي كه محصولات نويسا و نيوشا تا حدي زيادي آن را حل كردهاند، استخراج و بهكارگيري قابليتهاي زباني، زبان فارسي در حد نسبتاً کاملي است.
اين اطلاعات زباني ميتواند در ساير نرمافزارهايي كه نياز به اطلاعات زباني دارند، مانند مترجمها و نرمافزارهاي OCR نيز بكار گرفته شود. اثر صداهاي اضافي و ناخواسته در كاربردهاي واقعي نرمافزارهاي تشخيص گفتار را در عمل دچار افت شديد كارايي مينمايد، در محصولات فارسي ارائه شده با رويكردهاي مختلفي اين نقصان تا حد زيادي جبران شده است.
Y@SiN
فعلا امضا نداريم.باشگاه داريم
برچسب برای این موضوع
مجوز های ارسال و ویرایش
- شما نمی توانید موضوع جدید ارسال کنید
- شما نمی توانید به پست ها پاسخ دهید
- شما strong>نمی توانید فایل پیوست ضمیمه کنید
- شما نمی توانید پست های خود را ویرایش کنید
-
قوانین انجمن