مدل هوش مصنوعی جدید متا که قرار است به رقیب قدرتمند مدلهایی مثل GPT-3 شرکت OpenAI تبدیل شود فاش شد.
نسخهی متا از مدل زبان بزرگ (LLaMa) این شرکت که به انجمن بحثبرانگیز اینترنتی بهنام 4Chan راه یافت، برای استفادهی عمومی درنظر گرفته نشده بود. این برنامه در قالب نسخهی بتا برای آزمایش محققان و دولتها طراحی شده بود و این یعنی شخصی که دسترسی زودهنگام داشته، اطلاعاتی را درمورد مدل مذکور فاش کرده است.
ظاهراً این اولینباری است که جزئیاتی درمورد یک هوش مصنوعی اختصاصی قبل از انتشار رسمی آن در دسترس قرار میگیرد. متا مدل LLaMA را در اواخر ماه فوریه معرفی کرد. این شرکت در بیانیهی جدیدش فاش شدن جزئیات مربوط به هوش مصنوعی خود را رد نکرد. البته به گفتهی کلمنت دلانگ، رئیس شرکت هوش مصنوعی Huagging Face، متا سعی دارد از نشت اطلاعات جلوگیری کند و درخواستی برای حذف جزئیات فاش شده ارائه داده است.
متا در اعلامیهی مربوط به معرفی مدل زبانی بزرگ خود اشاره کرد که دموکراتیک کردن دسترسی به چنین فناوریهایی تا حدی برای جلوگیری از انواع خروجیهای نامناسبی است که قبلاً در هوش مصنوعیهای مختلف دیدهایم.
بهعنوان مثال سال گذشته چتبات هوش مصنوعی BlenderBot 3 متا بهسرعت و طی یک هفته پساز راهاندازی، رفتارهای نژادپرستانه از خود نشان داد. به گزارش فیوچریسم، این شرکت امیدوار است با ساخت جدیدترین هوش مصنوعی منبعباز خود، آن را قدرتمندتر سازد و از سرنوشت مشابه BlenderBot 3 جلوگیری کند.
در اطلاعیهی متا آمده است: «حتی با وجود همهی پیشرفتهای اخیر در مدلهای زبانی بزرگ، دسترسی کامل تحقیقاتی به آنها بهدلیل منابعی که برای آموزش و اجرای چنین مدلهای بزرگی نیاز است، محدودیت دارد. این دسترسی محدود توانایی محققان را برای درک چگونگی و چرایی کارکرد مدلهای زبانی کاهش داده و مانع پیشرفت تلاشها برای بهبود استحکام آنها و رفع مسائل شناختهشده مثل سوگیری، پاسخهای سمی و پتانسیل تولید اطلاعات نادرست میشود».
با توجه به جزئیات فاش شده از مدل زبانی بزرگ متا، برخی میگویند اگرچه این روش، راهکار ایدئالی برای عمومی شدن هوش مصنوعی مذکور نیست اما استفادهی گستردهتر به رشد آن کمک میکند.
بدینترتیب افرادی که در 4Chan به هوش مصنوعی متا دسترسی پیدا کردهاند شاید آن را با همان ترفندهای قدیمی آموزش دهند که از سالها قبل چتباتهای دیگر را درگیر کرده است.