Нейросеть Google Gemini: почему она лучше ChatGPT и как её использовать
Google представила нейросеть Gemini, которая круче ChatGPT. Рассказываем, что это за нейросеть, что она умеет и как ее использовать в России.
19К открытий27К показов
Google представила нейросеть Gemini, которая должна стать главным конкурентом ChatGPT. Она распознает предметы на видео в реальном времени и отвечает на голосовые запросы.
Рассказываем, что это за нейросеть, что она умеет и как ее использовать в России.
Сможет ли Google обогнать OpenAI?
Да, уже обогнала
Нет, OpenAI сможет вырваться вперед, как и всегда
Что такое Gemini
Гендиректор Google Сундара Пичаи во время презентации Gemini рассказал, что эта нейросеть открывает новую веху в истории искусственного интеллекта.
Gemini по большому счету является надстройкой к ранее существовавшей нейросети Google Bard, которая умела кодить на 20 языках программирования и знала 40 языков. Bard был интегрирован в продукты компании, к примеру, в Google Colab. Также Bard планировали внедрить в другие сервисы вроде Docs и Gmail.
У Gemini есть три версии:
- Gemini Nano разработана для того, чтобы ее можно было разворачивать на маломощным устройствах, к примеру, на смартфонах. Известно, что Nano будет доступна для Android. Google пообещала встроить нейросеть на свой смартфон Pixel 8 Pro.
- Gemini Pro предназначена для повседневного использования на ПК. Это более мощная версия нейросети, которая позиционируется как главный оппонент ChatGPT. Ее можно будет тестировать через Google Generative AI Studio и Vertex AI в Google Cloud. Gemini Pro будет доступна с 13 декабря.
- Gemini Ultra считается самой сильной моделью, которая будет использоваться для анализа больших данных и интеграции в коммерческие продукты.
Google не скрывает, что сравнивала свою нейросеть в первую очередь с GPT-4. Компания утверждает, что им удалось обогнать OpenAI по 30 показателям из 32.
Мы провели очень тщательный сравнительный анализ систем. Я думаю, что мы существенно опережаем конкурента по 30 из 32 показателей.
В чем Google Gemini превзошла ChatGPT
Если верить результатам теста выше,
- Gemini выдает более точные ответы на элементарные математические и гуманитарные вопросы по бенчмарку MMLU (Measuring Massive Multitask Language Understanding). Это тест для измерения многозадачной точности моделей текстового понимания. Этот тест охватывает 57 задач, включая элементарную математику, историю США, информатику, право и многое другое.
- Gemini лучше решает сложные для ИИ задачи. BIG-Bench Hard (BBH) – это набор задач, который включает 200 вопросов, от рекомендации фильмов до решения сложных логических и математических задач.
- Gemini лучше понимает текст. Бенчмарк DROP создан для оценки точности моделей машинного обучения в решении сложных задач по пониманию текста.
- Нейросеть лучше решает арифметические задачи, исходя из условия задачи. Бенчмарк GSM8K является стандартом оценки качества обработки естественного языка (NLP). Он состоит из 8,000 вопросов на нескольких языках, предназначенных для измерения точности моделей обработки естественного языка в контексте вопросно-ответных задач.
- Лучше решает алгебраические и геометрические задачи.
- Лучше пишет код на Python. Видимо, здесь имеется в виду, что результаты кода лучше соответствует запросу пользователя. Бенчмарк HumanEval используется для оценки качества NLP моделей и их способности производить результаты, которые соответствуют человеческому восприятию.
- Лучше преобразует промпт в код на Python. Бенчмарк Natural2Code разработан для проверки производительности моделей, которые предназначены для преобразования человеческих запросов на естественном языке в соответствующий программный код.
При этом Gemini хуже ChatGPT понимании социокультурного контекста. Задачи в бенчмарке HellaSwag просят сделать сложные предсказания, основываясь на понимании внешнего контекста и социокультурной информации.
Надо думать, если вы попросите Gemini прокомментировать предвыборную программу Трампа, она даст менее точный результат, потому что хуже понимает общий запрос или настроение пользователей / избирателей.
Что умеет Google Gemini
Прежде всего, Gemini делает все то же самое, что и ChatGPT, но лучше. Это значит, что Gemini умеет:
- Отвечать на вопросы, касающиеся культуры, науки и гуманитарного знания.
- Рассуждать на заданные темы, понимать прочитанное и причины и следствия.
- Решать математические задачи, включая алгебру и геометрию.
- Писать код. В презентации, правда, говорят только про Python.
А еще Gemini умеет то, чего не умеет ChatGPT. Среди таких навыков:
- Понимает, что находится на изображении, в реальном времени.
- Распознает текст на изображениях и в документах.
- Может распознавать инфографику и анализировать ее.
- Может рассуждать на математические темы последовательно и в реальном времени, глядя на изображение.
- Создавать точные субтитры к видео. Но пока только на английском языке.
- Отвечает на вопросы, заданные в видео.
- Переводит речь человека в реальном времени.
- Автоматически распознает речь человека.
Как использовать Gemini
Первым делом нужно изменить язык аккаунта Google на американский английский. Для этого пройдите по этой ссылке, выберите English в поиске и выберите страну USA. Также удалите дополнительные языки и отключите автоматический подбор языка.
После этого включите VPN и подключитесь к американскому серверу. Какой VPN выбрать, рассказали в этой статье.
Зайдите на Google Bard. Если все настроено верно, сверху появится окошко Bard has been updated in English with Gemini Pro
. Если такая надпись не появилась, очистите кэш браузера и перезапустите его.
19К открытий27К показов