Запознайте се с Gemini: Най-мощният изкуствен интелект на Google
Google обяви официалния старт на проекта, който определя като най-мощен и способен модел за изкуствен интелект.
Езиковият модел се нарича Gemini и ще включва набор от три различни размера: Gemini Ultra - най-голямата и най-способна категория; Gemini Pro, който се използва за широк спектър от задачи; Gemini Nano, който ще се използва за специфични задачи и мобилни устройства, съобщава CNBC.
Засега компанията планира да лицензира Gemini за клиенти чрез Google Cloud, които да го използват в своите приложения.
От 13 декември разработчиците и корпоративните клиенти могат да получат достъп до Gemini Pro чрез Gemini API в Google AI Studio или Google Cloud Vertex AI.
Разработчиците на Android също ще могат да създават с Gemini Nano.
Gemini ще се използва и за захранване на продукти на Google, като чатбота Bard и Search Generative Experience, който се опитва да отговаря на заявки за търсене с текст в разговорен стил (SGE все още не е широко достъпен).
Gemini Ultra е първият модел, който превъзхожда човешките експерти в MMLU (масивно многозадачно разбиране на езика), което използва комбинация от 57 предмета като математика, физика, история, право, медицина и етика за проверка както на познанията за света, така и на способностите за решаване на проблеми, заяви компанията в нова публикация в официалния си блог. Предполага се, че той може да разбира нюансите и аргументацията в сложни теми.
"Gemini е резултат от мащабни съвместни усилия на екипи в Google, включително на колегите ни от Google Research", пише главният изпълнителен директор Сундар Пичай в публикацията от днес (6 декември).
"Тя е създадена от самото начало, за да бъде мултимодална, което означава, че може да обобщава и безпроблемно да разбира, да работи и да комбинира различни видове информация, включително текст, код, аудио, изображение и видео."
От днес чатботът Bard на Google ще използва Gemini Pro, за да помага с разширени разсъждения, планиране, разбиране и други възможности.
В началото на 2024 г. ще бъде пуснат "Bard Advanced", който ще използва Gemini Ultra, съобщиха ръководителите на компанията по време на разговор с медии във вторник. Това е най-голямата актуализация на чатбота Bard, конкурент на ChatGPT.
Актуализацията идва 8 месеца след като технологичният гигантът пусна за първи път Bard и година след като OpenAI пусна ChatGPT на GPT-3.5. През март тази година ръководеният от Сам Алтман стартъп пусна GPT-4.
От Google заявиха, че Gemini Pro е постигнал по-добри резултати от GPT-3.5, но избегнаха въпроси за това как се справя с GPT-4.
На въпроса дали Google планира да събира такси за достъп до "Bard Advanced", генералният мениджър на Google за Bard заяви, че компанията е фокусирана върху създаването на добро изживяване и все още няма подробности за монетизацията.
На въпрос дали Gemini има нови възможности в сравнение с текущото поколение LLM, Ели Колинс, вицепрезидент на продуктовия отдел в Google DeepMind, отговори: "Подозирам, че има".
Според отделни съобщения, Google е отложила пускането на Gemini, тъй като не е била готова. Множество репортери попитаха за забавянето, на което Колинс отговори, че тестването на по-усъвършенстваните модели отнема повече време. Тя допълни, че Gemini е най-тестваният модел на AI, който компанията е създала и че той има "най-изчерпателните оценки на безопасността" от всички модели на Google.
Колинс подчерта, че въпреки че е най-големият модел, Gemini Ultra е значително по-евтин за обслужване.
"Той е не просто по-способен, а и по-ефективен. Все още ни трябват значителни изчисления за обучението на Gemini, но ставаме много по-ефективни по отношение на способността ни да обучаваме тези модели."
По-рано тази година CNBC установи, че големият езиков модел PaLM 2 на Google, най-новият по онова време модел на изкуствения интелект, използва почти пет пъти повече текстови данни за обучение, отколкото предшественикът му LLM.
Също днес, Google представи нов процесор от следващо поколение за обучение на модели с изкуствен интелект.
Чипът TPU v5p, който Salesforce и стартъпът Lightricks започнаха да използват, предлага по-добра производителност за цената от TPU v4, обявен през 2021 г., заявиха от Google. Но компанията не предостави информация за производителността в сравнение с пазарния лидер Nvidia.
Съобщението за чипа идва седмици след като конкурентите в облака Amazon и Microsoft показаха персонализиран силиций, насочен към AI.
През август Google стартира "ранен експеримент", наречен Search Generative Experience (SGE), който позволява на потребителите да видят как би изглеждало едно генериращо преживяване с изкуствен интелект при използване на търсачката - търсенето все още е основен център на печалба за компанията.
Инвеститорите искат график за SGE още от май, когато компанията за първи път обяви експеримента на годишната си конференция за разработчици Google I/O.
В съобщението за Gemini в сряда почти не се споменава SGE, а ръководителите не са категорични относно плановете за стартиране за широката общественост, като казват, че Gemini ще бъде включен в нея "през следващата година".
"Тази нова ера на моделите представлява едно от най-големите научни и инженерни усилия, които сме предприемали като компания", заяви още Сундар Пичай.
"Искрено се вълнувам за това, което предстои, и за възможностите, които Gemini ще разкрие за хората навсякъде", допълни директорът на Google.