سال 2016، سال یادگیریهای وسیع و عمیق بود. سال گذشته در زمینهی شبکههای عصبی الهام گرفته از مغز انسان، سرمایهگذاریهای بزرگی انجام شد و منابع گستردهای در اختیار این تحقیقات قرار گرفت.
در تحقیقات جدید که توسط محققان دانشگاه راجرز، دانشگاه کارولینای شمالی، دانشگاه لیهای و دانشگاه هنگکنگ صورت گرفته است، از شبکههای عصبی برای ساخت و تولید تصاویر با کیفیت بالا تنها از روی توضیحات متنی استفاده میشود.
هان ژانگ، محقق چینی در این مورد اظهار کرد که ساخت و تولید تصاویر واقعی از روی توضیحات متنی بسیار کاربردی است. راههای قبلی که برای این امر مورد استفاده قرار گرفته بودند، در تولید و ساخت تصاویر مشکلات عدیدهای دارند و در نمایش جزییات تصاویر ساختهشده و جداسازی و متمایز کردن اجسام تصویر موفق نبودند. StackGAN برای اولین بار یک تصویر 256 در 256 پیکسل را با جزییات واقعی تولید کرد.
Károly Zsolnai-Fehér، یکی از محققان این پروژه، در این مورد گفت:
ما برای سالیان متمادی به دنبال آموزش دادن شبکههای عصبی برای انجام کارهایی همچون تشخیص چهره، تشخیص علائم راهنمایی و رانندگی و یا تشخیص دستخط بودیم.به طور کلی با استفاده از میلیونهای نمونه آموزشی به شبکههای عصبی یاد دادیم که چگونه کاری را انجام دهند، چگونه از کاری که انجام دادند یاد بگیرند و از یادگیری خود برای رفتارهای بعدی در مورد کارهای مشابه استفاده نمایند. حال در مورد این تحقیقات جدید، یک تفاوت وجود دارد. ما از شبکههای عصبی انتظار داریم که پس از یادگیری بتوانند تصاویر جدید را تنها از روی یک متن توضیحی خلق کنند.این برنامه ما را به دنیای جدیدی از امکانات خواهد برد.
در گذشته به طور قطع برنامههایی در مورد خلاقیتهای این چنینی مانند ماشین کابوس (Nightmare Machine) و ساخت ویدئو از روی یک تصویر ثابت وجود داشته است. این تکنولوژی جدید میتواند بسیار جذاب و دیدنی باشد.همچنین به دلیل داشتن دو مرحله عملیات کشیدن و ساخت تصاویر، بسیار شبیه به ترسیم تصاویر توسط هنرمندان عمل میکند که آثار خود را در دو مرحله به پایان میرسانند.
به نظر میرسد که ما هنوز راه طولانی تا جایگزین کردن خلاقیت انسانی با رباتها داشته باشیم، اما ساخت تصاویر از روی توضیحات متنی توسط شبکه های عصبی میتواند گام بسیار بزرگی برای تحقق این امر باشد.