در چند ماه گذشته، گوگل روزهای پرتلاطمی را در حوزهی هوش مصنوعی تجربه کرد و به نظر میرسید رقابت را به مایکروسافت و جنجال تبلیغاتیاش بر سر چتجیپیتی باخته است. شرکتی که در ایجاد شبکهی عصبی ترنسفورمر که مدلهای زبانی بزرگ نظیر GPT برپایهی آن توسعه یافتهاند، نقش کلیدی داشت، حالا چنان از کارزار چتباتها و دیگر ابزار هوش مصنوعی مولد عقب مانده بود که حتی عرضهی بارد (Bard) هم نتوانست آن اعتباری را که مایکروسافت بهراحتی با ChatGPT و بینگ چت به دست آورده بود، به گوگل بازگرداند.
از ماجرای خطای علمی و سرقت ادبی بارد بگیر تا استعفای جفری هینتون، پدرخواندهی هوش مصنوعی، از گوگل پس از ۱۰ سال و هشدارش دربارهی خطرات این تکنولوژی؛ گوگل واقعا به تولدی دوباره در حوزهای که بیشتر از هر شرکت دیگر در آن سرمایهگذاری کرده بود (نزدیک ۴ میلیارد دلار)، نیاز داشت. و چه فرصتی بهتر از کنفرانس Google I/O؟ کنفرانسی با چنان تمرکزی بر هوش مصنوعی که حتی محصولات سختافزاری آن ازجمله گوشیها و تبلت پیکسل هم از قابلیتهای این تکنولوژی بیبهره نماندند.
شاید بهتر بود امسال نام Google I/O به Google AI تغییر مییافت. حقیقت این است که نمیتوان دربرابر هیجان و پتانسیل وسوسهانگیز هوش مصنوعی مقاومت کرد و وقتی گوگل وعده میدهد تا این تکنولوژی را «برای همه بهدردبخورتر و مفیدتر کند»، دلمان میخواهد حرفش را باور کنیم. اما آیا دنیا برای رویارویی با مدلهای زبانی که با سرعتی برقآسا درحال پیشرفت هستند و هرلحظه باهوشتر از قبل میشوند، آماده است؟ یا بهقول تریلر فیلم اوپنهایمر که دربارهی زندگی پدر بمب اتمی است، غولهای فناوری دارند به انسانها قدرت نابودی خودشان را میدهند و دنیا برای این تغییر آمادگی ندارد؟
باید منتظر ماند و دید.
۱۰ اتفاق مهمی که در کنفرانس Google I/O 2023 افتاد
۱- معرفی پیکسل فولد؛ تاشدنی گوگل با اندروید خالص و طراحی جذاب
پیکسل فولد اولین پروژهی گوگل در بازار گوشیهای تاشدنی است که فرمفکتورش گوشیهای سری گلکسی زد فولد سامسونگ را در ذهن تداعی میکند، اما از فولد ۴ باریکتر است.
مشخصات فنی گوشی تاشدنی Google Pixel Fold با برچسب قیمتی ۱٬۷۹۹ دلاری، این گوشی را به رقیبی جدید برای گلکسی زد فولد ۴ تبدیل کرده است؛ نمایشگر خارجی ۵٫۸ اینچی و نمایشگر داخلی ۷٫۶ اینچ، هر دو از نوع OLED با نرخ نوسازی ۱۲۰ هرتز با روشنایی حدود ۱۵۰۰ نیت. پردازندهی Tensor G2 که پیشتر در پیکسل ۷ و پیکسل ۷ پرو دیده بودیم؛ ۱۲ گیگابایت رم با ۲۵۶ یا ۵۱۲ گیگابایت حافظهی ذخیرهسازی؛ باتری ۴٬۸۰۰ میلیآمپرساعتی با توان شارژ ۳۰ وات؛ مجهز به پنج دوربین ازجمله دوربین اصلی ۴۸ مگاپیکسلی، دوربین فوق عریض ۱۰٫۸ مگاپیکسلی و دوربین تلهفوتوی ۱۰٫۸ مگاپیکسلی با بزرگنمایی پنج برابری.
گوگل میگوید بیشاز ۵۰ مورد از اپلیکیشنهایش را بهینهسازی کرده تا از مزایای نمایشگر داخلی بزرگ پیکسل فولد استفاده کنند. پیکسل فولد با اندروید ۱۳ از ماه آیندهی میلادی روانهی بازار میشود و تا پنج سال بهروزرسانی اندروید و بهروزرسانی امنیتی را دریافت خواهد کرد.
۲- معرفی پیکسل تبلت؛ تجربه دلپذیر اندروید خالص در نمایشگر بزرگتر
پس از فرازونشیبهای بسیار، گوگل سرانجام از تبلت پیکسل در رویداد I/O 2023 بههمراه داک شارژی که آن را تبدیل به یک نمایشگر هوشمند خانگی میکند، رسماً رونمایی کرد.
تبلت پیکسل گوگل از همان تراشهی تنسور G2 بهره میبرد و طراحیاش ما را یاد پیکسل ۳ با آن لبههای گرد میاندازد. نمایشگر ۱۰٬۹۵ اینچی LCD این تبلت رزولوشن ۱۶۰۰ × ۲۵۶۰ و حداکثر روشنایی ۵۰۰ نیت ارائه میدهد و با قلمهای استایلوس شرکتهای دیگر سازگاری دارد.
تفاوت کلیدی تبلت پیکسل گوگل با سایر تبلتهایی که تاکنون روانهی بازار کرده در این است که از این دستگاه میتوان بهعنوان Assistant Smart Display استفاده کرد و مدیریت بسیاری از کارهای محیطی بهخصوص در خانههای هوشمند را به آن سپرد.
تبلت پیکسل با رم ۸ گیگابایتی و حافظه ذخیرهسازی ۱۲۸ و ۲۵۶ گیگابایتی UFS 3.1 با برچسب قیمتی ۴۹۹ دلار و ۵۹۹ دلار، ۲۰ ژوئن (۳۰ خرداد ۱۴۰۲) عرضه خواهد شد.
۳- معرفی پیکسل 7a؛ میانرده گوگل با نمایشگر ۹۰ هرتزی و دوربین قدرتمند
پیکسل 7a گوگل، عضو ارزانقیمت سری پیکسل ۷ با برچسب قیمتی ۴۹۹ دلار امسال از سالهای قبل اندکی گرانتر است، اما درعوض چند ویژگی بالارده نظیر نرخ نوسازی ۹۰ هرتز و پشتیبانی از شارژ بیسیم ارائه میدهد.
پیکسل 7a همچنین از دوربینهای جدیدی بهره میبرد؛ دوربین اصلی ۶۴ مگاپیکسلی با حسگری ۷۲ درصد بزرگتر از نسل قبل و یک دوربین ۱۳ مگاپیکسلی اولتراواید همراه با دوربین سلفی ۱۳ مگاپیکسلی.
این گوشی ۶٫۱ اینچی هم از تراشهی تنسور G2 استفاده میکند و از ۸ گیگابایت رم و ۱۲۸ گیگابایت حافظهی ذخیرهسازی بهره میبرد.
۴- معرفی مدلزبانی PaLM 2؛ از متخصص سوالات پزشکی تا امنیت سایبری
مدل زبانی PaLM 2 گل سرسبد رویداد متمرکز بر هوش مصنوعی Google I/O بود. مدلی که از قدرت استدلال و منطقش از قبل بیشتر شده، براساس دادههای چندزبانه متشکل از بیش از ۱۰۰ زبان آموزش دیده و قرار است خانوادهای از محصولات با قابلیتهای مختلف را دربرگیرد.
این سیستم در نسخههای مختلف برای کاربران و سازمانها عرضه خواهد شد و از نظر حجم دادهای که براساس آن آموزش دیده، بهترتیب از کوچکترین به بزرگترین، چهار نسخه بهنامهای Gecko، Otter، Bison و Unicorn را شامل میشود.
برای مثال، یکی از نسخههای 2 PaLM بهنام «Med-PaLM 2» صرفا براساس دادههای پزشکی آموزش دیده و بهگفتهی گوگل، میتواند به سوالات مشابه آنچه در آزمون دریافت مجوز پزشکی ایالات متحده (USMLE) دیده میشود، در حد «متخصص» پاسخ دهد.
نسخهی دیگر 2 PaLM موسومبه «Sec-PaLM 2» نیز براساس دادههای امنیت سایبری آموزش دیده و میتواند «رفتار اسکریپتهای مخرب را توضیح دهد و به کاربران در شناسایی کدهای حاوی بدافزار کمک کند.»
سبکترین نسخهی PaLM 2 یعنی Gecko آنقدر کوچک است که میتواند روی گوشیهای هوشمند اجرا شود و در هر ثانیه ۲۰ توکن، معادل حدودا ۱۶، ۱۷ کلمه را پردازش کند. این مدل اگرچه قابلیتهای محدودتری از نسخههای بزرگتر ارائه میدهد، چون بهصورت محلی اجرا میشود، دغدغههای حریم شخصی کمتری بههمراه دارد.
۵- گوگل سرانجام چتبات هوش مصنوعی را به موتور جستجو آورد
گوگل با وجود آنکه هماکنون در حال توسعهی چتبات بارد است، بهاندازهی رقبا، به چتباتها علاقهی چندانی ندارد و به تبدیل صفحهی نتایج جستوجویش به چیزی شبیه به ChatGPT نیز تمایلی نشان نمیدهد، در عوض میخواهد AI را در دل نتایج جستوجو جای دهد؛ بهاین صورت که بالای نتایج سنتی، قسمت جدیدی بهنمایش درمیآید که پاسخ AI به سؤال کاربر را بهصورت خلاصه در دل خود دارد. سمت راست توضیحات AI سه لینک قرار خواهد گرفت که پاسخ تولیدشده را «تأیید میکنند».
گوگل پاسخ تولیدشده بهدست هوش مصنوعی در موتور جستوجویش را AI snapshot مینامد؛ تمام پاسخها بهکمک مدلهای بزرگ زبانی خود گوگل و با استفاده از منابع موجود در اینترنت تولید میشوند.
صفحهی نتایج گوگل نیز ظاهری جدیدی بهخود گرفته؛ طرحی رنگارنگ و با محوریت هوش مصنوعی. در صفحهی نتایج جدید بهویژه در نسخهی موبایل، AI snapshot تقریبا کل صفحهی اول را اشغال میکند. موتور جستوجوی گوگل اکنون از چند مدل بزرگ زبانی پیشرفتهی گوگل از جمله مدل چندمنظوره و جدید PaLM2 و Multitask Unified Model قدرت میگیرد.
در حال حاضر برای دسترسی به پاسخهای AI، باید در برنامهای موسوم به Search Generative Experience عضویت داشته باشید. صف انتظار برای دسترسی به هوش مصنوعی مولد در Google Search از امروز در اپلیکیشن Google و صفحهی Google.com روی مرورگر کروم آغاز میشود و نخستین کاربران آزمایشی طی هفتههای آتی پذیرش خواهند شد.
۶- Magic Editor؛ ویرایش حرفهای تصاویر با هوش مصنوعی
ابزار هوش مصنوعی Magic Editor که برای Google Photos معرفی شده، بهکمک هوش مصنوعی مولد که نمونهای از آن را در مولد تصویر Dall-E و Midjourney دیدهایم، ویرایش حرفهای تصاویر را در حد فوتوشاپ برای کاربر انجام میدهد.
از دمویی که گوگل از تواناییهای Magic Editor به نمایش گذاشت میتوان گفت که این ابزار قابلیتهای متعددی ازجمله جابهجایی سوژه به نقطهای بهتر در تصویر، تغییر اندازهی سوژه، تغییر رنگ و میزان ابرها در آسمان یا پاک کردن موارد زاید از تصاویر را ارائه میدهد.
گوگل اعلام کرد Magic Editor اواخر سال میلادی جاری برای برخی از گوشیهای پیکسل عرضه خواهد شد تا از فیدبک کاربران برای بهبود این ابزار استفاده کند.
۷- اضافه شدن موقعیتیابی با نمایش واقعگرایانه و زنده مسیر به گوگل مپ
گوگل سال گذشته با افزودن ویژگی Immersive View به گوگل مپ، شرایطی را مهیا کرد تا کاربران این اپلیکیشن بتوانند چشماندازی از مقصد موردنظر خود کسب کنند. بهزودی این ویژگی به مسیریابی روزانه اضافه خواهد شد تا کاربران جزئیات بیشتری را از مسیر پیشروی خود دریافت کنند.
ویژگی مذکور نهتنها میتواند مسیر حرکت را زیباتر جلوه دهد، بلکه میتواند با نمایش پرجزئیاتترِ مسیر، شِمایی کلی از جاذبههای گردشگری و دیگر بخشهایی که میتواند برایتان جذاب باشد را نمایش دهد. هدف اصلی Immersive View، نمایش جزئیاتی است که احتمالا در خلال یک سفر تفریحی برایتان مهم و کاربردی خواهد بود.
گوگل درنظر دارد تا Immersive View را تا آخر سال به بیش از ۱۵ شهر اضافه کند. این ویژگی با استفاده از هوش مصنوعی و توان محاسباتی عظیم کامپیوتری، میلیاردها تصاویر هوایی و تصاویر ثبت شده از طریق Street View را برای ساخت تصویری سهبعدی با یکدیگر ترکیب میکند.
۸- انتشار عمومی گوگل بارد برای بیشاز ۱۸۰ کشور همراه با پشتیبانی از زبان فارسی
یکی از مهمترین دلایلی که باعث شکست بارد از بینگ چت و چتجیپیتی میشد، محدودیت استفاده از آن و نبود پشتیبانی از زبان فارسی بود. گوگل در کنفرانس I/O 2023 اعلام کرد که کاربران بیشاز ۱۸۰ کشور برای دسترسی به این چتبات دیگر نیازی به ثبتنام و قرارگرفتن در لیست انتظار ندارند. این چتبات تاکنون تنها برای کاربران ایالات متحده و بریتانیا دردسترس قرار داشت.
گوگل میگوید که بارد افزونبر انگلیسی، اکنون از زبانهای کرهای و ژاپنی نیز پشتیبانی میکند و در آینده پشتیبانی از ۴۰ زبان برتر دنیا که خوشبختانه فارسی را نیز شامل میشود به آن اضافه میشود.
تغییر مدل زبانی بارد به PaLM 2 تواناییهای این چتبات هوش مصنوعی را در زمینهی استدلال، ریاضیات و مهارتهای کدنویسی افزایش داده است. هماکنون ۲۰ زبان برنامهنویسی پراستفاده توسط پایگاه داده این چتبات پشتیبانی میشود و کاربران میتوانند برای اعمالی چون کدنویسی، دیباگ یا صادرکردن کد به پلتفرمهای مختلفی چون Google Colab از بارد کمک بگیرند.
۹- همکاری گوگل با ادوبی FireFly برای آوردن مولد تصویر به بارد
در رویداد Google I/O، اهالی مانتنویو همکاری خود با ادوبی برای افزودن ویژگیهای FireFly به چتبات Bard را اعلام کردند تا به رقابت جدی با بینگ چت مجهز به مولد تصویر Dall-E بپردازند. کاربران میتوانند با استفاده از این ویژگی مستقیما با استفاده از خطفرمان چت بات عکسهای موردنظر خود را تولید و ویرایش کنند و با دیگر افراد بهاشتراک بگذراند.
باتوجه به گزارشهای منتشر شده، خروجی تصاویر تولید شده در Bard از همان کیفیتی برخوردارند که کاربران نسخه بتا FireFly تجربه کرده بودند؛ چراکه سرویس FireFly به منبع تصاویر باکیفیت Adobe Stock متصل است و کاربران میتوانند تمامی محتواهای تولید شده را آزادانه با دیگران بهاشتراک بگذارند.
امکان استفاده از FireFly در هفتههای آینده دراختیار کاربران Bard قرار خواهد گرفت.
۱۰- اضافه شدن ابزار هوش مصنوعی مولد به Workspace
گوگل قرار است تحت عنوان Duet AI for Workspace، تمام اپلیکیشنهای Workspace ازجمله داکس، شیتس و اسلایدز را به هوش مصنوعی مولد مجهز کند.
کاربران میتوانند از Duet AI برای نوشتن شرح شغل، داستانهای خلاقانه یا تولید خودکار صفحات گسترده برای مدیریت دادهها استفاده کنند. این ابزار همچنین میتواند پاورپوینتهای کامل ایجاد کند، برای اسلایدها متن پیشنهاد دهد یا بلافاصله عناصر بصری سفارشی تولید کند.
بهنظر میرسد Duet AI پاسخ گوگل به 365 Copilot مایکروسافت باشد که از برخی از ابزارهای مولد این شرکت برای خلاقانهتر و کاربردیتر کردن نرم افزار آفیس استفاده می کند.
بهروزرسانیهای مبتنی بر هوش مصنوعی گوگل برای مجموعه نرمافزاری رایگان این شرکت بهزودی در دسترس مصرفکنندگان قرار خواهد گرفت.
نظر شما دربارهی عملکرد گوگل در کنفرانس I/O امسال چیست؟ به نظرتان سیر تحول تکنولوژی هوش مصنوعی در دستان غولهای فناوری دارد دنیا را به جای بهتری هدایت میکند یا آخرالزمان رباتها در پیش است؟