سوندار پیچای، مدیرعامل گوگل هنگام معرفی هوش مصنوعی PalM 2 در کنفرانس Google I/O 2023، قدرت استدلال و منطق این مدل زبانی را بسیار قدرتمندتر از قبل نامید و گفت که این مدل براساس دادههای چندزبانه متشکل از بیش از ۱۰۰ زبان آموزش دیده است.
اسلاو پتروف، مدیر ارشد تحقیقاتی گوگل هم پیش از برگزاری کنفرانس به خبرنگاران گفت که عملکرد PaLM 2 «به طور قابل توجهی در مقایسه با PaLM 1 که در آوریل ۲۰۲۲ معرفی شد، بهبود یافته است.»
پتروف برای نشان دادن قابلیت چندزبانهی PaLM سراغ اصطلاحات زبان آلمانی رفت. مثلا عبارت «Ich verstehe nur Bahnhof» که ترجمهی تحتالفظی آن میشود «من فقط ایستگاه قطار را متوجه میشوم» بهدرستی بهصورت «من متوجه نمیشوم چه میگویید» یا معادل انگلیسی آن «it’s all Greek to me» ترجمه شد.
مهندسان گوگل در مقالهای پژوهشی در توصیف قابلیتهای PaLM 2 ادعا کردند که بهخاطر حجم چشمگیر متون غیرانگلیسی در دادههای این مدل، مهارت زبانیاش «برای آموزش آن زبان» کافی است. بهعبارت دیگر، افراد میتوانند بهکمک PaLM 2 به یادگیری زبانهای خارجی بپردازند، چون این مدل قادر است دربارهی اصطلاحات خاص هر زبان هم توضیح دهد.
البته PaLM 2 قرار نیست صرفا یک محصول واحد باشد؛ بلکه قرار است خانوادهای از محصولات با قابلیتهای مختلف را دربرگیرد. این سیستم در نسخههای مختلف برای کاربران و سازمانها عرضه خواهد شد و از نظر حجم دادهای که براساس آن آموزش دیده، بهترتیب از کوچکترین به بزرگترین، چهار نسخه بهنامهای Gecko، Otter، Bison و Unicorn را شامل میشود.
برای مثال، یکی از نسخههای PaLM بهنام «Med-PaLM 2» صرفا براساس دادههای پزشکی آموزش دیده و بهگفتهی گوگل، میتواند به سوالات مشابه آنچه در آزمون دریافت مجوز پزشکی ایالات متحده (USMLE) دیده میشود، در حد «متخصص» پاسخ دهد. البته پیشتر هم ChatGPT موفق شده بود با کسب میانگین نمرهی ۶۰ درصدی، در این آزمون قبول شود.
نسخهی دیگر PaLM موسومبه «Sec-PaLM 2» نیز براساس دادههای امنیت سایبری آموزش دیده و بهگفتهی پتروف، میتواند «رفتار اسکریپتهای مخرب را توضیح دهد و به کاربران در شناسایی کدهای حاوی بدافزار کمک کند.» هر دو مدل PaLM 2 از طریق گوگل کلاد و درمرحلهی اول، برای تعداد محدودی از کاربران در دسترس قرار خواهند گرفت.
نکتهی قابلتوجه PaLM 2 این است که سبکترین نسخهی آن، یعنی Gecko (بهمعنی مارمولک) آنقدر کوچک است که میتواند روی گوشیهای هوشمند اجرا شود و در هر ثانیه ۲۰ توکن، معادل حدودا ۱۶، ۱۷ کلمه را پردازش کند. البته گوگل نگفت این مدل را روی چه سختافزاری تست کرده و صرفا به گفتن «جدیدترین گوشیها» بسنده کرد.
درهرحال، اقدام گوگل به سبًک کردن مدلهای زبانی که کلمهی «بزرگ» را با خود یدک میکشند، کار بسیار قابلتوجهی است. این سیستمها که درحال حاضر در فضای ابری اجرا میشوند، هزینهی بسیار سنگینی را بردوش سازندگان میگذارند. درضمن، استفاده از مدلهای زبانی بهصورت محلی مزایای دیگری ازجمله حفظ حریم شخصی را برای کاربران به همراه دارد. فقط مشکل این مدلهای کوچک این است که توانایی آنها از مدلهای بزرگتر، محدودتر است.
اگرچه مدل زبانی PaLM 2 دستاورد بزرگی در برنامههای هوش مصنوعی گوگل بهشمار میرود، کماکان از مشکلات متعدد مربوط به این تکنولوژی رنج میبرد. ازجمله بحث کپیرایت و استفادهی غیرقانونی از دادههایی که در اینترنت منتشر شدهاند، بدون ذکر منبع و همچنین مشکل «هذیانگویی» یا همان چرندبافی مدلها که همانطور که در مقایسهی بارد با چتجیپیتی و بینگ چت دیدیم، چتبات گوگل بیشتر از رقبا به این معضل دچار میشود.
زوبین قهرمانی، معاون پژوهشی گوگل، در گفتوگویی به Verge گفت که PalM 2 به پیشرفت قابلتوجهی نسبت به مدلهای قبلی دست پیدا کرده، اما هنوز حوزهی هوش مصنوعی برای حل معضل تولید اطلاعات نادرست «راه درازی در پیش دارد.»