چت‌بات‌ها را فراموش کنید؛ آینده در دست عوامل هوش مصنوعی است

استارت‌آپ‌ها و غول‌های فناوری در تلاشند تا تمرکزها را از چت‌بات‌هایی که از طریق متن به کمک افراد می‌آیند، به عوامل هوش مصنوعی که می‌توانند کارها را پیش ببرند، هدایت کنند. دموی اخیر، شامل یک کدگذار هوش مصنوعی به نام Devin و عواملی است که بازی‌های ویدیویی انجام می‌دهند.

غزال زیاری: این هفته، استارت‌آپی به نام Cogintion AI، با انتشار یک دمو از یک برنامه هوش مصنوعی حسابی سر و صدا به پا کرد.

این برنامه هوش مصنوعی، Devin نام دارد و کارهایی انجام می‌دهد که معمولا مهندسان نرم‌افزاری با درآمد بالا مشغول به انجام‌شان هستند. چت‌بات‌هایی مثل ChatGPT و Gemini اگر چه می‌توانند کد تولید کنند، اما دوین پا را فراتر از این مرزها گذاشته و برای حل یک مشکل، برنامه‌ریزی کرد، کد نویسی انجام داد و سپس آن را آزمایش و پیاده‌سازی کرد.

سازندگان دوین آن را به عنوان “توسعه‌دهنده نرم‌افزار هوش مصنوعی” معرفی می‌کنند. زمانی که از دوین خواسته شد تا نحوه عملکرد مدل زبان متن باز Llama 2 متا را در هنگام دسترسی به شرکت‌های مختلف میزبان، تست کند، دوین یک طرح گام به گام برای این پروژه ایجاد کرد. کدهای مورد نیاز برای دسترسی به APIها و اجرای تست‌های بنچ‌مارک را تولید کرد و سپس یک وب سایت ایجاد کرد و جمع‌بندی نتایج را در آن قرار داد.

حیرت مهندسان از عملکرد دوین

همیشه قضاوت درباره دموهای نمایشی سخت است؛ اما Cognition نشان داد که دوین طیف گسترده‌ای از وظایف حیرت‌انگیزی را انجام می‌دهد و همین باعث تعجب سرمایه‌گذاران و مهندسان شبکه اجتماعی X شده و تائیدهای زیادی را دریافت کرده و حتی الهام‌بخش چند الگوی رفتاری شده است (از جمله برخی پیش‌بینی‌ها که دوین به زودی منجر به موجی از اخراج‌های صنعت فناوری خواهد شد.)

هوش-مصنوعی.jpg

دوین آخرین و به روزترین نمونه از روندی است که مدتی است زیر ذره‌بین قرار گرفته (ظهور عوامل هوش مصنوعی که به جای ارائه پاسخ یا توصیه‌ای در مورد مشکل مطرح شده توسط انسان، می‌توانند برای حل آن اقدام کنند). چند ماه پیش، یک Auto-GPT که یک برنامه منبع‌باز است که تلاش می‌کند تا با انجام اقداماتی در رایانه شخصی و در وب‌سایت، کارهای مفیدی انجام دهد، مورد آزمایش قرار گرفت. اخیرا برنامه دیگری به نام vimGPT امتحان شد تا مشخص شود که چطور مهارت‌های بصری مدل‌های جدید هوش مصنوعی می‌تواند به این عوامل کمک کند تا وب‌سایت‌ها را با کارآیی بیشتری مرور کنند.

اشتباه و شکست

محققان به شدت تحت تاثیر آزمایش‌ها با این عوامل هوش مصنوعی قرار گرفتند. با این حال در شرایط فعلی و درست مثل مدل‌های زبانی که آنها را تقویت می‌کنند، این عوامل هم مرتکب اشتباهات زیادی می‌شوند و هنگامی که یک نرم‌افزار در حال انجام اقداماتی است (نه فقط تولید متن)، یک اشتباه ممکن است به منزله شکست کامل باشد و پیامدهای بالقوه پرهزینه و خطرناکی داشته باشد.

محدود کردن دامنه وظایفی که یک عامل می‌تواند انجام دهد (مثلا برای مجموعه خاصی از کارهای مهندسی نرم‌افزار) به نظر شیوه‌ای هوشمندانه برای کاهش میزبان خطاهاست؛ اما هنوز راه‌های بالقوه زیادی است که ممکن است منجر به شکست شوند.

انجام بازی‌های ویدیویی توسط عوامل هوش مصنوعی

البته این فقط استارت‌آپ‌ها نیستند که در حال ساخت عوامل هوش مصنوعی هستند. در اوایل این هفته، مطلبی درباره عاملی به نام SIMA نوشته شد که توسط Google DeepMind توسعه یافته بود. SIMA بازی‌های ویدیویی مختلفی را از جمله Goat simulator 3 انجام می‌دهد.

SIMA از تماشای بازی کردن بازیکنان انسانی یاد گرفت که چطور بیش از ۶۰۰ کار نسبتا پیچیده مثل قطع کردن یک درخت یا تیراندازی به سمت یک سیارک را انجام دهد. مهم‌تر از همه، می‌تواند بسیاری از این اقدامات را در یک بازی ناآشنا با موفقیت انجام دهد. Google DeepMind آن را یک ” generalist” می‌نامد.

گوگل امیدوار است که این نماینده‌ها در نهایت در خارج از دنیای بازی‌های ویدیویی مشغول شوند و شاید به کمک کاربران در استفاده از وب‌سایت‌ها یا نرم‌افزارها بیایند. اما بازی‌های ویدیویی هم با فراهم کردن محیط‌هایی پیچیده که می‌توان در آنها به آزمایش و خطا پرداخت و پیشرفت کرد، شرایط خوبی را برای توسعه و آزمایش عوامل فراهم می‌کنند. تیم هارلی، دانشمند محقق Google DeepMind در این باره گفت:« ما به شدت برروی دقیق‌تر کردن عوامل هوش مصنوعی کار می‌کنیم و ایده‌های مختلفی داریم.»

می‌توان در ماه‌های آینده در انتظار اخبار بیشتری درباره عوامل هوش مصنوعی بود. دمیس هاسابیس، مدیر عامل Google DeepMind در این باره گفته که قصد دارد مدل‌های زبان بزرگی را با کارهایی که قبلا شرکتش در زمینه برنامه‌های آموزشی هوش مصنوعی برای بازی‌های ویدیویی انجام داده ترکیب کند تا عوامل توانمندتر و قابل اعتمادتری را توسعه دهد. او در این باره گفت:« این حوزه بزرگی است و در این زمینه سرمایه‌گذاری زیادی می‌کنیم و تصور می‌کنم که دیگران هم مشغول همین کارند. این یک گام بزرگ در جهت تغییر در توانایی این سیستم‌هاست.»

منبع: wired

۲۲۷۲۲۷