سیستم زیرنویس خودکار یوتوب از این پس اصوات غیر گفتاری را نیز تشخیص می دهد

همانطور که می دانید یوتوب از سال ۲۰۰۹ میلادی سرویس اتوماسیون زیرنویس ویدیوهایش را راه اندازی کرده؛ سیستمی که به صورت خودکار محتوای گفتاری ویدیو را زیرنویس می کند و طی سال های اخیر پیشرفت های قابل توجهی به خود دیده، تا جایی که این روزها کمتر پیش می آید با غلط املایی یا تشخیص اشتباه عبارات در بخش زیرنویس روبرو شویم.

همانطور که می دانید یوتوب از سال 2009 میلادی سرویس اتوماسیون زیرنویس ویدیوهایش را راه اندازی کرده؛ سیستمی که به صورت خودکار محتوای گفتاری ویدیو را زیرنویس می کند و طی سال های اخیر پیشرفت های قابل توجهی به خود دیده، تا جایی که این روزها کمتر پیش می آید با غلط املایی یا تشخیص اشتباه عبارات در بخش زیرنویس روبرو شویم.

اما با این حال یوتوب دست از توسعه آن برنداشته و حالا خبر می دهد که از این پس تمام اصوات و صداهای غیر گفتاری نیز شامل زیرنویس می شوند؛ مثل (صدای خنده)، (پخش موسیقی) یا (تشویق جمعیت).

گفتنی است یوتوب مدعی شده این بخش هنوز در مراحل ابتدایی توسعه قرار دارد و به مرور زمان با ارتقائاتی همراه خواهد بود که حتی به افراد ناشنوا و یا کم شنوا نیز کمک شایانی خواهد کرد.

در آینده نزدیک مکانیزم شناخت صداهایی مانند (زنگ خوردن تلفن)، (پارس کردن سگ نگهبان) و (در زدن) نیز به پایگاه داده هوش مصنوعی زیرنویس خودکار اضافه خواهند شد. ناگفته نماند که این سیستم از همین حالا در اختیار میلیون ها کاربر یوتوب قرار گرفته است.

سیستم زیرنویس خودکار یوتوب از این پس اصوات غیر گفتاری را نیز تشخیص می دهد

خبرهای بیشتر در رابطه با یوتوب