3 سال پیش / خواندن دقیقه

مدل زبانی PaLM 2 گوگل برای رقابت با GPT-4 معرفی شد؛ از متخصص سوالات پزشکی تا امنیت سایبری

مدل زبانی PaLM 2 گوگل که برای رقابت با GPT-4 بینگ چت معرفی شد هم‌اکنون در ۲۵ سرویس گوگل استفاده می‌شود و نسخه‌های مختلفی را دربرمی‌گیرد.

سوندار پیچای،‌ مدیرعامل گوگل هنگام معرفی هوش مصنوعی PalM 2 در کنفرانس Google I/O 2023، قدرت استدلال و منطق این مدل زبانی را بسیار قدرتمندتر از قبل نامید و گفت که این مدل براساس داده‌های چندزبانه متشکل از بیش از ۱۰۰ زبان آموزش دیده است.

اسلاو پتروف، مدیر ارشد تحقیقاتی گوگل هم پیش از برگزاری کنفرانس به خبرنگاران گفت که عملکرد PaLM 2 «به طور قابل توجهی در مقایسه با PaLM 1 که در آوریل ۲۰۲۲ معرفی شد، بهبود یافته است.»

پتروف برای نشان دادن قابلیت چند‌زبانه‌ی PaLM سراغ اصطلاحات زبان آلمانی رفت. مثلا عبارت «Ich verstehe nur Bahnhof» که ترجمه‌ی تحت‌الفظی آن می‌شود «من فقط ایستگاه قطار را متوجه می‌شوم» به‌درستی به‌صورت «من متوجه نمی‌شوم چه می‌گویید» یا معادل انگلیسی آن «it’s all Greek to me» ترجمه شد.

مهندسان گوگل در مقاله‌ای پژوهشی در توصیف قابلیت‌های PaLM 2 ادعا کردند که به‌خاطر حجم چشمگیر متون غیرانگلیسی در داده‌های این مدل، مهارت زبانی‌اش «برای آموزش آن زبان» کافی است. به‌عبارت دیگر، افراد می‌توانند به‌کمک PaLM 2 به یادگیری زبان‌های خارجی بپردازند، چون این مدل قادر است درباره‌ی اصطلاحات خاص هر زبان هم توضیح دهد.

البته PaLM 2 قرار نیست صرفا یک محصول واحد باشد؛‌ بلکه قرار است خانواده‌ای از محصولات با قابلیت‌های مختلف را دربرگیرد. این سیستم در نسخه‌های مختلف برای کاربران و سازمان‌ها عرضه خواهد شد و از نظر حجم داده‌ای که براساس آن آموزش دیده، به‌ترتیب از کوچک‌ترین به بزرگ‌ترین، چهار نسخه‌ به‌نام‌های Gecko، Otter، Bison و Unicorn را شامل می‌شود.

برای مثال، یکی از نسخه‌های PaLM به‌نام «Med-PaLM 2» صرفا براساس داده‌های پزشکی آموزش دیده و به‌گفته‌ی گوگل، می‌تواند به سوالات مشابه آنچه در آزمون دریافت مجوز پزشکی ایالات متحده (USMLE) دیده می‌شود، در حد «متخصص» پاسخ دهد. البته پیش‌تر هم ChatGPT موفق شده بود با کسب میانگین نمره‌ی ۶۰ درصدی، در این آزمون قبول شود.

نسخه‌ی دیگر PaLM موسوم‌به «Sec-PaLM 2» نیز براساس داده‌های امنیت سایبری آموزش دیده و به‌گفته‌ی پتروف، می‌تواند «رفتار اسکریپت‌های مخرب را توضیح دهد و به کاربران در شناسایی کدهای حاوی بدافزار کمک کند.» هر دو مدل PaLM 2 از طریق گوگل کلاد و درمرحله‌ی اول، برای تعداد محدودی از کاربران در دسترس قرار خواهند گرفت.

نکته‌ی قابل‌توجه PaLM 2 این است که سبک‌ترین نسخه‌ی آن، یعنی Gecko (به‌معنی مارمولک) آنقدر کوچک است که می‌تواند روی گوشی‌های هوشمند اجرا شود و در هر ثانیه ۲۰ توکن، معادل حدودا ۱۶، ۱۷ کلمه را پردازش کند. البته گوگل نگفت این مدل را روی چه سخت‌افزاری تست کرده و صرفا به گفتن «جدیدترین گوشی‌ها» بسنده کرد.

درهرحال، اقدام گوگل به سبًک‌ کردن مدل‌های زبانی که کلمه‌ی «بزرگ» را با خود یدک می‌کشند، کار بسیار قابل‌توجهی است. این سیستم‌ها که درحال حاضر در فضای ابری اجرا می‌شوند، هزینه‌ی بسیار سنگینی را بردوش سازندگان می‌گذارند. درضمن، استفاده از مدل‌های زبانی به‌صورت محلی مزایای دیگری ازجمله حفظ حریم شخصی را برای کاربران به همراه دارد. فقط مشکل این مدل‌های کوچک این است که توانایی آن‌ها از مدل‌های بزرگ‌تر، محدودتر است.

اگرچه مدل زبانی PaLM 2 دستاورد بزرگی در برنامه‌های هوش مصنوعی گوگل به‌شمار می‌رود، کماکان از مشکلات متعدد مربوط به این تکنولوژی رنج می‌برد. ازجمله بحث کپی‌رایت و استفاده‌ی غیرقانونی از داده‌هایی که در اینترنت منتشر شده‌اند، بدون ذکر منبع و همچنین مشکل «هذیان‌گویی» یا همان چرندبافی مدل‌ها که همان‌طور که در مقایسه‌ی بارد با چت‌جی‌پی‌تی و بینگ چت دیدیم، چت‌بات گوگل بیشتر از رقبا به این معضل دچار می‌شود.

زوبین قهرمانی، معاون پژوهشی گوگل، در گفت‌وگویی به Verge گفت که PalM 2 به پیشرفت قابل‌توجهی نسبت به مدل‌های قبلی دست پیدا کرده، اما هنوز حوزه‌ی هوش مصنوعی برای حل معضل تولید اطلاعات نادرست «راه درازی در پیش دارد.»

0 نظر

پلاس وی

هر آنچه میخواهید در اینجا بخوانید

مدل زبانی PaLM 2 گوگل برای رقابت با GPT-4 معرفی شد؛ از متخصص سوالات پزشکی تا امنیت سایبری

منوی سریع