برقراری ارتباط صوتی کاربران با سیستمعامل رایانههای شخصی، تلفنهای همراه و … که از طریق آن، اجرای فرمانهای صوتی ارسالی از سمت کاربر توسط این وسائل امکانپذیر میشود، اتفاق تازهای نیست و مدتهاست که با این تکنولوژی در حوزه تعامل بین انسان و رایانه آشنا هستیم.
سیستم شمارهگیر صوتی تلفنهای همراه، سیستم تشخیص صدا برای ورود و خروج از دربهای امنیتی ساختمانها، فناوری تبدیل صوت به متن در نرمافزارهای رایانهای، کدهای امنیتی صوتی سرویسهای اینترنتی (Voice Captcha) و … برخی از کاربردهای این
API نرمافزاری هستند.
با ظهور نسخه پنجم زبان HTML و معرفی API صوتی موجود در این زبان، برقراری ارتباط صوتی بین کاربر و وبسایتهای اینترنتی بسیار سادهتر شد و تنها با به کارگیری
تگهای مربوط به این API، میتوان ارتباط بین ورودی صوت رایانهی کاربر (میکروفون) و سرویس تشخیص صدای موجود در وبسایتهای اینترنتی را برقرار نمود.
نسخه ۱۱ مرورگر گوگل کروم
و اینبار هم گوگل یکی از اولین شرکتهایی است که چنین فناوریهای جدیدی را در سرویسهای خود به کاربرانش معرفی میکند. به تازگی (در تاریخ ۲۷ آوریل ۲۰۱۱) که نسخه ۱۱ مرورگر کروم شرکت گوگل از حالت بتا (Beta Version) خارج شد و به صورت پایدار (Stable) برای دانلود در اختیار کاربران این مرورگر اینترنتی قرار گرفت، گوگل از اضافهشدن امکان پشتیبانی از Voice Input (که یکی از ویژگیهای جدید اضافه شده به زبان HTML5 است) در این مرورگر خبر داد. (
منبع)
برای پی بردن به اینکه آیا مرورگر شما از قابلیت API صوتی در HTML5 پشتیبانی میکند یا نه و امتحان کردن عملی کاربرد فرمانهای صوتی میتوانید به
این صفحه مراجعه نمایید.
در نسخه ۱۱ مرورگر گوگل کروم که برای سیستمعامل ویندوز، لینوکس، مکینتاش و کرومیوم به صورت پایدار عرضه شدهاست، کاربران میتوانند با استفاده از میکروفون و پس اتصال به اینترنت از سرویسهای صوتی ارائه شده در اینترنت به راحتی و بدون نصب هیچنرمافزار اضافهای استفاده کنند.
اولین سرویس اینترنتی که از این قابلیت پشتیبانی میکند، سرویس مترجم گوگل (
Google Translate) است. اگر مرورگر شما از قابلیت HTML5 Voice Input API پشتیبانی نماید، پس از ورود به صفحه سرویس مترجم گوگل، آیکون کوچکی را در باکس ورود متن خواهید دید که با کلیک بر روی آن، سرویس مترجم دریافت صدای شما را آغاز کرده و پس از ایستادن صدای گوینده و قطع صحبت، پردازش صدا و تبدیل آن به متن را در عرض چند ثانیه انجام میدهد.
دکمهای که قبل از صحبت باید بر روی آن کلیک کنید
البته گوگل اعلام کرده است که این، تنها سرویس مبتنی بر API صوتی زبان HTML5 در مرورگر Google Chrome نیست و به زودی سرویسهای جدیدی نیز به کاربران معرفی خواهد شد. علاوه بر این، در حال حاضر این فناوری فقط برای زبان انگلیسی فعال شده و گوگل قول داده است که به زودی پشتیبانی از باقی زبانهای مهم دنیا را نیز در این سرویس ارائه نماید.
ما هم برای اینکه دوستداران دنیای ارتباطات و فناوری اطلاعات و مخاطبین عزیز مجله اینترنتی گویا آیتی با این فناوری جذاب گوگل بیشتر آشنا شوند، ویدئویی را به زبان فارسی ضبط کردهایم که چگونگی عملکرد این سرویس را به نمایش میگذارد. برای دریافت این ویدئو با کیفیت عالی یا متوسط از لینک مستقیم سرور گویا آپ،بر روی یکی از تصاویر زیر کلیک نمایید.
6.64 مگابایت
2.5 مگابایت