به گزارش تککرانچ، این مسیر در حوالی سال2020 به اوج خود رسید؛ زمانی که اوپنایآی مدل جیپیتی-3 را معرفی کرد و نشان داد که تنها با 100برابر بزرگتر کردن مدل، قابلیتهایی مانند برنامهنویسی و استدلال بدون نیاز به آموزش صریح بهدست میآید. این نقطه آغازی بود بر آنچه کیان کتانفروش، مدیرعامل و بنیانگذار پلتفرم عاملهای هوشمند Workera، آن را عصر مقیاسگذاری مینامد. دورهای که با باور به این تعریف میشود که محاسبات بیشتر، دادههای بیشتر و مدلهای ترنسفورمر بزرگتر بهطور اجتنابناپذیری به شکوفایی بزرگ بعدی در هوش مصنوعی منجر خواهند شد.
امروزه بسیاری از پژوهشگران معتقدند صنعت هوش مصنوعی در حال نزدیک شدن به محدودیتهای قوانین مقیاسگذاری است و دوباره وارد دورهای خواهد شد که محور آن پژوهش و نوآوری خواهد بود. یان لوکان، دانشمند ارشد پیشین هوش مصنوعی متا، سالهاست بر ضرورت کاهش اتکا به مقیاسگذاری تاکید کرده است و بر نیاز به توسعه معماریهای بهتر تاکید دارد. سوتسکِور نیز در مصاحبهای اخیر گفته است که مدلهای کنونی در حال رسیدن به سطح اشباع هستند و نتایج پیشآموزش تثبیت شدهاند که این موضوع نشاندهنده نیاز به ایدههای نوین است. کتانفروش گفت: «به نظر من محتملترین اتفاق در پنج سال آینده این است که معماری بهتری پیدا کنیم که نسبت به ترنسفورمرها پیشرفت قابلتوجهی داشته باشد و اگر چنین اتفاقی نیفتد نمیتوانیم انتظار پیشرفت زیادی در مدلها داشته باشیم.»
گاهی کم، بیشتر است
مدلهای زبان بزرگ در تعمیم دانش عملکرد فوقالعادهای دارند، اما بسیاری از کارشناسان معتقدند موج بعدی پذیرش هوش مصنوعی سازمانی با مدلهای زبان کوچکتر و چابکتر پیش خواهد رفت، مدلهایی که میتوان آنها را برای راهحلهای حوزهمحور بهطور دقیق تنظیم کرد.
مدلهای کوچک و دقیقشده (SLM) روند بزرگ آینده خواهند بود و در سال 2026 به یکی از ابزارهای اصلی شرکتهای پیشرفته هوش مصنوعی تبدیل میشوند، زیرا مزایای هزینه و عملکرد باعث ترجیح آنها نسبت به مدلهای بزرگ آماده بهکار خواهد شد. اندی مارکوس، مدیر ارشد دادههای شرکت AT&T گفت: «ما شاهد هستیم که کسبوکارها بیش از پیش روی مدلهای کوچک و دقیق حساب میکنند، چراکه اگر بهخوبی تنظیم شوند در دقت برای کاربردهای سازمانی با مدلهای بزرگ و عمومی برابری میکنند و از نظر هزینه و سرعت نیز عالی هستند.»
این استدلال پیشتر از سوی استارتآپ فرانسوی «میسترال» نیز مطرح شده است؛ آنها معتقدند مدلهای کوچک پس از تنظیم دقیق، در چند معیار عملکرد، حتی بهتر از مدلهای بزرگ عمل میکنند. جان نیسلی، استراتژیست هوش مصنوعی شرکت «اَبی» مستقر در آستین، میگوید: «کارایی، صرفهجویی در هزینه و تطبیقپذیری مدلهای کوچک، آنها را برای کاربردهای خاص و دقیق ایدهآل میکند.»
درحالیکه مارکوس معتقد است مدلهای کوچک و دقیق در عصر عاملها کلیدی خواهند بود، نیسلی میگوید طبیعت مدلهای کوچک باعث میشود آنها برای پیادهسازی روی دستگاههای محلی بهتر باشند، روندی که با پیشرفتهای محاسبات لبهای تسریع شده است.
یادگیری از طریق تجربه
انسانها تنها از طریق زبان یاد نمیگیرند. ما از تجربه نحوه عملکرد جهان نیز میآموزیم. اما مدلهای زبان بزرگ واقعا جهان را درک نمیکنند؛ آنها صرفا پیشبینی میکنند که کلمه یا ایده بعدی چه خواهد بود. به همین دلیل بسیاری از پژوهشگران معتقدند که جهش بزرگ بعدی از طریق مدلهای جهان رخ خواهد داد؛ سیستمهای هوش مصنوعی که یاد میگیرند چگونه اجسام در فضاهای سهبعدی حرکت و تعامل میکنند تا بتوانند پیشبینی کنند و اقدامات مناسبی انجام دهند.
نشانههایی وجود دارد که سال 2026 میتواند سال مهمی برای مدلهای جهان باشد. یان لوکان ، متا را ترک کرد تا آزمایشگاه مدلهای جهان خود را راهاندازی کند و گفته میشود به دنبال ارزشگذاری 5میلیارد دلاری است. شرکت دیپمایند گوگل نیز مشغول توسعه «جینی» است و در ماه اوت آخرین مدل خود را معرفی کرد که مدلهای جهان تعاملی و عمومی در زمان واقعی میسازد.
همراه با دموهای استارتآپهایی مانند «دکارت» و «اودیسه»، آزمایشگاه «ورلد لبز» به رهبری فیفی لی اولین مدل جهان تجاری خود «ماربل» را عرضه کرده است. تازهواردانی مانند General Intuition در اکتبر توانستند با جذب 134میلیون دلار سرمایه اولیه به آموزش استدلال فضایی به عاملها بپردازند و استارتآپ تولید ویدئو «رانوی» در دسامبر اولین مدل جهان خود GWM-1 را منتشر کرد.
اگرچه پژوهشگران پتانسیل بلندمدت این فناوری را در رباتیک و خودرانها میبینند، تاثیر کوتاهمدت احتمالا ابتدا در بازیهای ویدئویی مشاهده خواهد شد.
«پیچبوک» پیشبینی میکند بازار مدلهای جهان در بازیهای ویدئویی میتواند از 1.2میلیارد دلار در بازه 2022 تا 2025 به 276میلیارد دلار در سال 2030 برسد که این رشد ناشی از توانایی فناوری در تولید جهانهای تعاملی و شخصیتهای غیرقابلکنترل واقعگرایانهتر است.
پیم دِ ویت، بنیانگذار General Intuition گفت: «محیطهای مجازی نهتنها ممکن است بازیها را دگرگون کنند، بلکه به میدانهای آزمایشی حیاتی برای نسل بعدی مدلهای بنیادین تبدیل خواهند شد.»
ملت عاملمحور
عاملها در سال 2025 نتوانستند آنطور که انتظار میرفت عمل کنند، اما یکی از دلایل اصلی این شکست سخت بودن اتصال آنها به سیستمهایی است که واقعا کار در آنها انجام میشود. بدون دسترسی به ابزارها و زمینه کاری بیشتر عاملها در جریانهای آزمایشی محدود باقی ماندند.
پروتکل Model Context شرکت آنتروپیک (MCP) که به آن USB-C برای هوش مصنوعی میگویند و به عاملهای هوش مصنوعی امکان میدهد با ابزارهای خارجی مانند پایگاههای داده، موتورهای جستوجو و APIها ارتباط برقرار کنند، نقش اتصال گمشده را ایفا کرده و به سرعت در حال تبدیل شدن به استاندارد است.
اوپنایآی و مایکروسافت بهصورت علنی از MCP پشتیبانی کردهاند و آتروپیک اخیرا آن را به بنیاد «هوش مصنوعیِ لینوکس» اهدا کرده است تا به استانداردسازی ابزارهای عاملمحور متنباز کمک کند. گوگل نیز در حال راهاندازی سرورهای MCP مدیریتی خود برای اتصال عاملهای هوش مصنوعی به محصولات و خدماتش است.
با کاهش اصطکاک اتصال عاملها به سیستمهای واقعی توسط MCP سال 2026 احتمالا سالی خواهد بود که جریانهای کاری عاملمحور بالاخره از مرحله دمو به فعالیت روزمره منتقل شوند. راجیو دِهِم، شریک Sapphire Ventures، میگوید این پیشرفتها باعث خواهند شد راهکارهای مبتنی بر عامل نقشهای «سیستم ثبت رسمی» را در صنایع مختلف بر عهده بگیرند.
دهم میگوید: «همزمان که عاملهای صوتی وظایف «اند-تو-اند» مانند دریافت اطلاعات و ارتباط با مشتری را انجام میدهند شروع به شکلدهی به سیستمهای زیرساختی اصلی خواهند کرد. این روند را در بخشهای متنوعی مانند خدمات خانگی، فناوری املاک و سلامت و همچنین در عملکردهای افقی مانند فروش، آیتی و پشتیبانی مشاهده خواهیم کرد.»
تقویت انسان، نه خودکارسازی
کتانفروش گفت: «سال 2026 سال انسانها خواهد بود. متوجه خواهیم شد که هوش مصنوعی به اندازهای که فکر میکردیم مستقل عمل نکرده است و گفتوگو بیشتر حول این خواهد بود که چگونه هوش مصنوعی جریانهای کاری انسانی را تقویت میکند، نه اینکه جایگزین آنها شود.»
او افزود: «فکر میکنم بسیاری از شرکتها شروع به استخدام خواهند کرد»، و اشاره کرد که انتظار دارد نقشهای جدیدی در زمینه هوش مصنوعی، شفافیت، ایمنی و مدیریت دادهها ایجاد شود. «من نسبت به میانگین نرخ بیکاری زیر 4 درصد در سال آینده خوشبین هستم.»
در سال 2024 هر شرکت هوش مصنوعی پیشبینی میکرد که مشاغل را بدون نیاز به انسانها خودکار خواهد کرد. اما فناوری هنوز به آن مرحله نرسیده است و در اقتصادی ناپایدار این نوع گفتار محبوب نیست. پیم دِ ویت نیز گفت: «مردم میخواهند بالای API باشند نه زیر آن و فکر میکنم سال 2026 سال مهمی برای این موضوع خواهد بود.»
ورود به دنیای فیزیکی
به گفته کارشناسان پیشرفتهایی در فناوریهایی مانند مدلهای کوچک، مدلهای جهان و محاسبات لبهای امکان کاربردهای فیزیکی بیشتر یادگیری ماشین را فراهم میکند.
ویکرام تانجا، رئیس «ایتی-اند-تی ونچرز» گفت: «هوش مصنوعی فیزیکی در سال 2026 وارد جریان اصلی خواهد شد، زیرا دستههای جدیدی از دستگاههای مجهز به هوش مصنوعی از جمله رباتها، خودروهای خودران، پهپادها و گجتهای پوشیدنی وارد بازار میشوند.»
اگرچه خودروهای خودران و رباتها نمونههای آشکار کاربرد هوش مصنوعی فیزیکی هستند که بیتردید در سال 2026 رشد خواهند کرد، اما آموزش و پیادهسازی آنها هنوز هزینهبر است. از سوی دیگر، گجتهای پوشیدنی مسیر کمهزینهتری با پذیرش مصرفکننده ارائه میدهند. عینکهای هوشمند مانند ریبن متا اکنون دستیارهایی دارند که میتوانند به سوالات درباره آنچه میبینید پاسخ دهند و فرمهای جدیدی مانند حلقههای سلامت مجهز به هوش مصنوعی و ساعتهای هوشمند استفاده از تحلیلهای لحظهای و همیشگی روی بدن را عادی میکنند.
تانجا افزود: «ارائهدهندگان خدمات ارتباطی برای بهینهسازی زیرساخت شبکه خود به منظور پشتیبانی از این موج جدید دستگاهها تلاش خواهند کرد و آنهایی که انعطاف بیشتری در ارائه اتصال دارند بهترین موقعیت را خواهند داشت.»