بخش زیادی از کنفرانس گوگل I/O 2024 به قابلیتهای هوش مصنوعی Gemini و سایر محصولات این شرکت اختصاص داشت. مدل هوش مصنوعی جمینای 1.5 فلش، Project Astra، هوش مصنوعی «Veo» برای ساخت ویدیو و امکان ساخت چتباتهای سفارشی از جمله اطلاعیههای جدید گوگل در این رویداد بودند.
خبرآنلاین، شرکت گوگل کنفرانس سالانه توسعهدهندگان خود را موسوم به I/O با معرفی هوش مصنوعی جدید خود، Gemini 1.5 Flash AI آغاز کرد که گفته میشود سبکتر از مدل Gemini Pro و در دسترستر است.
Gemini 1.5؛ سریعتر و ارزانتر
مدل Gemini 1.5 Flash بهگونهای طراحی شده است که سرعت بالاتر و تأخیر کمتری داشته باشد. مدیرعامل دیپمایند میگوید که گوگل مدل Gemini 1.5 Flash را به آن دلیل ساخته که توسعهدهندگان به مدل سبکتر و ارزانتری از نسخه پرو نیاز داشتند. نسخه فلش در جایگاهی میان جمینای 1.5 پرو و جمینای 1.5 نانو قرار میگیرد.
جمینای 1.5 فلش البته برای مصرفکنندگان معمولی ساخته نشده است. این مدل هوش مصنوعی توسعهدهندگانی را هدف قرار داده است که میخواهند محصولات و سرویسهای مبتنی بر هوش مصنوعی بسازند.
موتورجستوجوی گوگل با هوش مصنوعی Gemini متحول میشود
هوش مصنوعی Gemini گوگل در جدیدترین رویداد این شرکت با تحولات قابلتوجهی در زمینه جستوجوی هوشمند مواجه شده است. این تحولات میتوانند یکی از مهمترین نقاط قوت هوش مصنوعی گوگل طی چند وقت اخیر باشند.
گوگل جمینای حالا به بخشی از گوشیهای اندرویدی تبدیل شده و با نصب اپ اختصاصی آن، میتوانید بهصورت یکپارچه از این هوش مصنوعی استفاده کنید. گوگل با هماهنگسازی اپ جمینای و سیستمعامل اندروید، به کاربر اجازه میدهد تا بهسادگی بخشهای مختلف گوشی هوشمند خود را جستوجو و اطلاعات مورد نظر خود را پیدا کند.
یکی از ویژگیهای جذابی که گوگل برای اپلیکیشن Gemini معرفی کرد، قابلیت Live یا «زنده» است. در کنفرانس توسعهدهندگان گوگل اعلام شد که Gemini Live میتواند قابلیت گفتوگوی طبیعی با این مدل هوش مصنوعی را فراهم کند تا تعامل صوتی بهتری با این فناوری داشته باشید.
قابلیت Gemini Live از طریق آیکون صدا در اپلیکیشن Gemini در اندروید و iOS در دسترس خواهد بود. زمانی که روی این آیکون بزنید، با پنجرهای تمامصفحه روبهرو میشوید که افکت موجی جذابی را هم به شما نشان میدهد. در این حالت میتوانید با هوش مصنوعی دیالوگ دوطرفه داشته باشید و پاسخ سؤالات خود را در کمترین زمان بگیرید.
چتباتهای سفارشی خود را تولید کنید
گوگل از چندین ویژگی جدید برای هوش مصنوعی Gemini خود رونمایی کرد که یکی از قدرتمندترین آنها قابلیتی به نام «Gems» است که به کاربران اجازه میدهد نسخههای سفارشی دستیار Gemini خود را با شخصیتهای مختلف ایجاد کنند.
قابلیت Gems به شما اجازه میدهد تا چتباتهای گفتگومحور خود را ایجاد کنید که میتوانند وظایف خاصی را انجام دهند. همچنین چتباتهای هوش مصنوعی که با این قابلیت ساخته میشوند، میتوانند دارای ویژگیهای شخصیتی منحصر به فرد خود باشند.
قابلیتهای هوش مصنوعی جدید اندروید
گوگل اعلام کرد که قابلیت جستوجوی مبتنی بر هوش مصنوعی به گوشیهای هوشمند اندرویدی اضافه خواهد شد و Gemini دستیار جدید هوش مصنوعی کاربران میشود تا وظایف مختلفی را انجام دهد. پردازش روی دستگاه هوش مصنوعی نیز در راه است. گوگل توضیحات خود را با قابلیت Circle to Search آغاز کرد که به گفته آن، اکنون دستیار آموزشی همهجانبهای برای دانشآموزان است.
گوگل میگوید که این قابلیت در دستگاههای اندرویدی بهزودی میتواند مسائل بسیار پیچیده و چندبعدی را درک و حل کند. همچنین تا پایان سال ۲۰۲۴، بیش از ۲۰۰ میلیون دستگاه به آن مجهز خواهند شد.
قدرتمندترین AI تصویرساز گوگل
مدل هوش مصنوعی Imagen 3، مولد تصویری است که بهادعای اهالی مانتینویو، قدرتمندترین هوش مصنوعی تصویرساز این برند محسوب میشود. ظاهراً گوگل آماده شده تا بیشاز پیش در زمینه تولید تصاویر با پرامپت قدرتنمایی کند.
گوگل این مولد تصویر هوش مصنوعی را بهزودی در دسترس توسعهدهندگان و مشتریان سازمانی قرار خواهد داد. ظاهراً این شرکت در نظر دارد که در فاز بعدی، هوش مصنوعی Imagen 3 را برای عموم افراد نیز منتشر کند.
هوش مصنوعی «Veo»؛ ساخت ویدیوهای خیرهکننده با دستورات متنی
هوش مصنوعی ویدیوساز پیشرفته «Veo»، میتواند ویدیوهای فول اچدی را بر اساس پرامپت متنی بسازد یا پس از ساخت ویدیو، با دستورات متنی آنها را تغییر دهد. این هوش مصنوعی پیشرفته دراصل پاسخ این شرکت به هوش مصنوعی Sora از OpenAI است.
گوگل ادعا میکند که Veo درکی پیشرفته از زبان و مفاهیم بصری دارد تا بتواند هر ویدیویی را که کاربر در ذهن خود دارد، ایجاد کند. ویدئوهای تولیدشده با این هوش مصنوعی، تکنیکهای سینمایی و بصری مانند مفهوم تایملپس را بهنمایش میگذارند.
هوش مصنوعی ویدیوساز Veo در بخش VideoFX گوگل برای برخی از سازندگان در دسترس خواهد بود و این شرکت میگوید که به YouTube Shorts و سایر محصولات نیز میآید. اگر Veo درنهایت به این بخش از یوتیوب اضافه شود، این ویژگی میتواند برتریهایی برای یوتیوب ایجاد کند.
پاسخ مستقیم گوگل به قابلیتهای جدید ChatGPT
در این کنفرانس همچنین از Astra بهعنوان «هوش مصنوعی جهانی» یاد شد که «میتواند در زندگی روزمره مفید باشد.» بهنظر میرسد که پروژه جدید گوگل پاسخ مستقیمی به قابلیتهای جدید ChatGPT است که یک روز قبل از رویداد گوگل، توسط OpenAI معرفی شده بود.
ظاهراً Project Astra اپلیکیشنی است که به دوربین دستگاه دسترسی دارد و از طریق آن میتواند به برخی سوالات توضیح دهد. در این ویدیو، Astra از طریق دوربین میتواند به محیط اطراف کاربر نگاه کند و آن را توصیف کند. نکتهای که در کنفرانس گوگل موردتوجه خبرنگاران و افراد حاضر قرار گرفت، سرعت عمل Astra در ارائه پاسخها است. به گفته گوگل، Astra نه تنها دادههای بصری را در زمان واقعی پردازش میکند، بلکه هرچیزی را که میبیند، میتواند به خاطر بیاورد و از اطلاعات ذخیرهشده خود نیز استفاده میکند.
ویژگی «AI Overviews» و قابلیتهای آن
گوگل درجریان رویداد Google I/O 24 از ویژگی «AI Overviews» نیز برای موتور جستوجوی خود رونمایی کرد. این ویژگی در تجربه جستوجوی کاربران، تغییراتی اساسی ایجاد میکند.
گوگل سال گذشته از ویژگی هوش مصنوعی جدیدی برای تجربه SGE مرورگر کروم رونمایی کرد که کاربران با کمک آن میتوانند مقالات موجود در وب را خلاصه کنند. باتوجه به اسکرینشاتهایی که در رویداد بهنمایش گذاشته شد، بهنظر میرسد ویژگی AI Overviews میتواند بهشکل موثری همان «SGE» با نامی جدید باشد.
Ask Photos؛ ویژگی جدید هوش مصنوعی
گوگل همچنین درجریان این رویداد از ویژگی جدیدی برای گوگل فوتوز رونمایی کرد. این ویژگی به صورت آزمایشی در دسترس کاربران قرار دارد و با هوش مصنوعی جمینای گوگل پشتیبانی میشود. این ویژگی اواخر تابستان عرضه خواهد شد.
نسل ششم پردازنده تنسور با نام Trillium
غول فناوری مستقر در ماونتین ویو یکی از معدود شرکتهایی است که پردازندههای خود را بهعنوان جایگزین پردازندههای انویدیا ارائه میکند. پردازنده جدید Trillium نیز ساخته شده که توان لازم را برای تولید متن و دیگر فایلهای رسانهای از مدلهای بزرگ هوش مصنوعی فراهم کند. این پردازنده نهتنها حدود ۵ برابر قویتر از پردازنده نسل قبلی یعنی v5e است، بلکه ۶۷ درصد در مصرف انرژی بهینهتر عمل میکند. سوندار پیچای میگوید پردازنده تنسور جدید آنها بهینهترین TPU تاریخ گوگل است.
مهندسان گوگل در طراحی این واحد پردازشی تنسور با افزایش ظرفیت حافظهای که پهنای باند بالا دارد، توانایی این پردازنده را ارتقا دادهاند. مدلهای هوش مصنوعی معمولاً به مقدار زیادی حافظه نیاز دارند که میتوانند گلوگاه عملکرد این سیستمها باشند. گوگل همچنین واحدهای MXU را در این پردازنده گسترش داده و مجموع سرعت کلاک را بالا برده است.
پردازنده Trillium از نسل سوم SparseCore استفاده میکند که گوگل آن را بهعنوان شتابدهندهای تخصصی برای رتبهبندیهای پیشرفته و کارهای مربوط به توصیه محتوا توصیف میکند. این شرکت میگوید با این کار، Trillium میتواند مدلها را سریعتر آموزش بدهد و تأخیر کمتری داشته باشد.
LearnLM؛ یادگیری بهتر با هوش مصنوعی
یکی از مدلهای هوش مصنوعی معرفی شده گوگل، LearnLM نام دارد که بر مبنای مدل جمینای ساخته شده و برای یادگیری بهینهسازی شده است. گوگل درحال همکاری با معلمان است تا این مدلها را وارد کلاسهای درس کند. این شرکت اعتقاد دارد که این هوش مصنوعی میتواند در یادگیری و برنامهریزیهای درسی کاربردهای زیادی داشته باشد.
گوگل در این باره اعلام کرده است که با متخصصانی از کالج معلمان کلمبیا، دانشگاه ایالتی آریزونا، دانشگاه نیویورک تیش و خان آکادمی نیز همکاری خواهد کرد تا این فناوری را آزمایش کند و بهبود ببخشد.
مدل زبانی با ۲۷ میلیارد پارامتر!
گوگل در کنفرانس سالانه توسعهدهندگان Google I/O 2024 از نسل بعدی مدلهای زبانی Gemma رونمایی کرد. نسخه متنباز Gemma 2 با ۲۷ میلیارد پارامتر در ماه ژوئن عرضه میشود.
در حال حاضر PaliGemma، یک نوع Gemma از پیشآموزشدیده است که گوگل آن را بهعنوان «نخستین مدل زبان بینایی در خانواده Gemma» برای شرح تصاویر، برچسبگذاری تصویر و موارد استفاده بصری پرسش و پاسخ توصیف میکند.
ظاهرا گوگل این مدل ۲۷ میلیارد پارامتری را برای اجرا روی پردازندههای گرافیکی نسل بعدی انویدیا، میزبان Google Cloud TPU و سرویس مدیریتشده Vertex AI بهینه کرده است.
گوگل در حاشیه این کنفرانس اعلام کرد که امروز (چهارشنبه، ۲۶ اردیبهشت) دومین نسخه بتا از سیستم عامل اندروید 15 منتشر میشود.
گوگل هنوز بهطور دقیق مشخص نکرده که این آپدیت جدید شامل چه ویژگیهایی میشود، اما شاید برخی قابلیتهای هوش مصنوعی جدید نیز در آن مورد آزمایش قرار بگیرند. احتمالاً طی چند روز آینده، گزارشهای بیشتری در این رابطه منتشر خواهد شد.
گزینه جدید Web در نوار جستجوی گوگل
گفته میشود که گزینه Web تقریباً تمام بلوکهای محتوایی را که گوگل در صفحه نتایج جستوجو قرار میدهد، فیلتر میکند و تنها لینکها و متن ساده وبسایتها را خواهید داشت. همچنین گزینه Web قابلیت جدید جستوجوی هوش مصنوعی این شرکت را نیز مسدود خواهد کرد. این قابلیت هنوز برای تمامی کاربران فعال نیست و بهمرور در دسترس قرار خواهد گرفت.
البته این گزینه جدید، شاید برای برخی کاربران چندان کاربردی نباشد. چون که بلوک و ماژولهای پیشنهادی گوگل در بالای صفحه معمولا مفید واقع میشود. همچنین بعید است که غول فناوری تنها با فشردن دکمه Web از تبلیغات خود دست بکشد. بههرحال در مواقعی که بهدنبال پاسخ ساده و مشخصی هستید، ماژولهای گوگل میتوانند به سرعت چنین پاسخی را برای شما فراهم کنند و نیازی به گزینه Web نخواهید داشت.
گوگل در مراسم I/O ظاهراً عینک هوشمند جدید خود را هم نشان داد
به نظر میرسد که گوگل در خلال مراسم I/O خود، نمونه اولیه عینک هوشمند آیندهاش را نیز برای چند لحظه نشان داده باشد. این پروژه ممکن است با کمک سامسونگ و شاید حتی کوالکام ساخته شود.
هنوز مشخص نیست که آیا گوگل واقعاً چنین عینکی را عرضه خواهد کرد یا خیر، اما احتمال دارد گوگل قصد داشته باشد عینک هوشمندی با نمایشگرهای AR ارائه دهد. همچنین در توضیحات یوتوب ویدیوی Project Astra، گوگل میگوید که دومین قسمت از دموی این پروژه روی «نمونه اولیه یک عینک» اجرا میشود.
البته گوگل سابقهای نسبتاً طولانی در ساخت عینکهای AR دارد. «گوگل گلس» این شرکت با شیشههای کوچک چند سال پیش رونمایی شد، اما چندان مورد پسند کارشناسان و کاربران قرار نگرفت. بااینحال، اکنون با رویکارآمدن هوش مصنوعی مولد، مخصوصاً با قابلیتهای صوتی و بصری آن، شاید بتوان گفت که با این فناوری جدید، در آینده گوگل گلس احیا خواهد شد.
۵۴۳۲۳