توانایی های تشخیص گفتار فعلی آنطور که باید و شاید تکامل یافته نیستند و نیازمند حجم عظیمی از حاشیه نویسی و رونوشت هستند تا قادر به درک آنچه بیان می شود باشند. با این حال ممکن است راهکاری طبیعی تر برای این مشکل وجود داشته باشد: آموزش دادن تشخیص اشیا به الگوریتم ها به همان شکلی که به کودکان آموزش داده می شود.