От подобрен Gemini до AI функции за търсене: Какво ново ни предлага Google?
Много от функциите и инструментите, представени по време на I/O Google все още са във фаза на тестване
Във вторник Google проведе годишната си конференция за разработчици I/O и представи редица продукти с изкуствен интелект - от нови функции за търсене и чат до хардуер за клиентите на облачни услуги. Съобщенията подчертават фокуса на компанията върху изкуствения интелект в стремежа ѝ да не изостава от конкуренти като OpenAI.
Много от функциите и инструментите, които Google представи, са само във фаза на тестване или с ограничен достъп само за разработчици, но те дават представа за това как технологичният гигант гледа на нашумялата технология и в кои нейни подсектори инвестира. Google печели пари от AI, като таксува разработчиците, които използват нейните модели, и от клиентите, които плащат за Gemini Advanced - конкурента на ChatGPT, който струва 19,99 долара на месец и помага на потребителите да обобщават PDF файлове, Google Docs и др.
Съобщенията от вторник следват подобни на различни конкуренти на технологичния гигант на полето на AI. По-рано подкрепяната от Amazon Anthropic обяви първата си оферта за предприятия, безплатно приложение за iPhone и стъпване на европейския пазар. Междувременно в понеделник OpenAI пусна нов модел и десктоп версия на ChatGPT, както и нов потребителски интерфейс.
CNBC прави предглед на всички иновации, които представи Google по време на най-голямата си годишна конференция.
Актуализации на Gemini AI
Google представи актуализации на Gemini 1.5 Pro, своя модел за изкуствен интелект, който скоро ще може да обработва още повече данни - например, да обобщава 1500 страници текст, качени от потребител. Налице е и нов модел Gemini 1.5 Flash AI, който според компанията е по-рентабилен и е предназначен за по-малки задачи като бързо обобщаване на разговори, създаване на заглавия на изображения и видеоклипове и извличане на данни от големи документи.
Главният изпълнителен директор на Google Сундар Пичай акцентира върху подобренията в преводите на Gemini, като добави, че той ще бъде достъпен за всички разработчици по света на 35 езика. В рамките на Gmail Gemini 1.5 Pro ще анализира прикачени PDF файлове и видеоклипове, като дава резюмета и други аналитични извадки, разкри още Пичай. Това означава, че ако сте пропуснали дълга тема от имейли по време на отпуск, Gemini ще може да я обобщи заедно с всички прикачени файлове.
Новите актуализации на Gemini са полезни и за търсене в Gmail. Компанията даде пример със следната ситуация: Ако сте сравнявали цените на различни изпълнители за ремонт на покрива ви и търсите обобщение, което да ви помогне да решите кого да изберете, Gemini може да върне три оферти заедно с очакваните дати за започване на работа, предложени в различните предложения.
Gemini в крайна сметка трябва да замени Google Assistant в телефоните с Android, което предполага, че ще бъде по-мощен конкурент на Siri на Apple в iPhone.
Audio Overviews, Google Veo, Imagen 3
Google обяви и Veo, най-новия си модел за генериране на видео с висока разделителна способност, както и Imagen 3, най-висококачествения си модел за преобразуване на текст в изображение, който обещава реалистични картини и „по-малко разсейващи визуални артефакти в сравнение с предишните ни модели“.
Инструментите ще бъдат достъпни за избрани създатели на съдържание в понеделник и ще акостират във Vertex AI - платформата за машинно обучение на Google, която позволява на разработчиците да обучават и внедряват приложения с изкуствен интелект.
Компанията също така представи Audio Overviews - инструмент, който дава възможност за генериране на аудио дискусии въз основа на въведен текст. Например, ако даден потребител качи план на урок, чатботът може да изговори резюме за него. Или ако поискате пример за научен проблем в реалния живот, той може да го направи чрез интерактивно аудио.
Отделно от това компанията представи AI Sandbox - набор от инструменти с генеративен изкуствен интелект за създаване на музика и звуци от нулата въз основа на потребителски подкани.
Google смята да продължи да печели предимства и благодарение на факта, че генеративните AI инструменти като чатботове и генераторите на изображения продължават да имат проблеми с точността. Шефът на търсачката на Google Прабхакар Рагаван акцентира, че конкурентите „може да имат нова джаджа, с която хората обичат да си играят, но те все още идват в Google, за да проверят това, което виждат там, защото тя е надеждният източник, а това става все по-критично в тази ера на генеративен AI“.
Самият технологичен гигант обаче също се сблъсква с този проблем. По-рано тази година Google представи генератор на изображения, задвижван от Gemini. Потребителите откриха исторически неточности, които се разпространиха онлайн, и компанията изтегли функцията, като заяви, че ще я възобнови през следващите седмици. Функцията все още не е пусната отново.
Нови функции за търсене
Лиз Рийд, ръководител на Google Search, разкри, че компанията е стартирала, засега само в САЩ, AI Overviews в своята основна интернет търсачка. AI Overviews показва бързо обобщение на отговорите на най-сложните въпроси за търсене. Например, ако потребителят търси най-добрия начин за почистване на кожени ботуши, страницата с резултатите може да покаже AI Overview в горната част с многоетапен процес на почистване, извлечен от информация, синтезирана от цялата мрежа.
Компанията заяви, че планира да въведе възможности за планиране, подобни на тези на асистента ѝ, директно в рамките на търсачката си. Рийд обясни, че потребителите ще могат да задават команди като: “Създай 3-дневен план за хранене за група, който е лесен за приготвяне“, получавайки отговор, базиран на широк набор от рецепти от цялата мрежа.
Що се отнася до напредъка в предлагането на „мултимодалност“ или интегрирането на повече изображения и видео в инструментите за генеративен изкуствен интелект, Google заяви, че ще започне да тества възможността потребителите да задават въпроси чрез видео, като, например, да заснемат проблем с продукт, който притежават, да го качат и да поискат от търсачката да го реши. В един от примерите Google показа как някой е заснел счупен грамофон, питайки защо не работи. Търсачката отговаря, че най-вероятно това се случва, защото плочата не е балансирана правилно.
Друга нова функция, която се тества, се нарича AI Teammate. Тя се очаква да бъде интегрирана в Google Workspace и ще може да претърсва множество имейли и съобщения, анализирайки PDF файлове и документи. Например, ако искате да създадете нова компания и попитате AI Teammate: „Готови ли сме за стартиране?“, асистентът ще предостави анализ и обобщение въз основа на информацията, до която има достъп в Gmail, Google Docs и други приложения на Workspace.
Project Astra
Project Astra е най-новият проект на Google към неговия AI асистент, който се изгражда от звеното за изкуствен интелект DeepMind. Засега това е само прототип, но можете да мислите за него като за стремеж на Google да разработи своя версия на J.A.R.V.I.S., всезнаещия AI асистент на Тони Старк от вселената на Marvel. В демонстрационния видеоклип, представен по време на Google I/O, асистентът - чрез видео и аудио, а не чрез чатбот интерфейс - показва как помага на потребител да си спомни къде е оставил очилата си.
Според Google един наистина полезен чатбот трябва да позволява на потребителите „да разговарят с него естествено и без забавяне или закъснение“. Разговорът в демонстрационното видео се провежда в реално време, без забавяне.
Главният изпълнителен директор на DeepMind Демис Хасабис коментира, че „да се намали времето за реакция до нещо, което да е подходящо за разговор, е трудно инженерно предизвикателство“.
Очаква се Project Astra да стартира в Gemini по-късно тази година.
Хардуер за изкуствен интелект
Google обяви и Trillium, шестото си поколение TPU, или тенорен процесор - част от хардуера, изключително важна за изпълнението на сложни операции с изкуствен интелект - който ще бъде на разположение на клиентите на облачната инфраструктура на компанията в края на 2024 г.
TPU не са предназначени да се конкурират с други чипове, като графичните процесори на Nvidia. Пичай отбеляза по време на I/O, че Google Cloud ще започне да предлага графичните процесори Blackwell на Nvidia в началото на 2025 г.
През март Nvidia също заяви, че Google ще използва платформата Blackwell за „различни вътрешни внедрявания и ще бъде един от първите доставчици на облачни услуги, които ще предлагат инстанции, задвижвани от Blackwell“, както и че достъпът до системите на Nvidia ще помогне на технологичния гигант да предложи широкомащабни инструменти за корпоративни разработчици, изграждащи големи езикови модели.
В речта си Пичай изтъкна „дългогодишното партньорство на Google с Nvidia“. Компаниите работят заедно от повече от десетилетие, като Пичай очаква това сътрудничество да продължи още поне толкова.