Что такое проект AutoGPT и почему столько разговоров о нем
Проект AutoGPT выпущен в апреле 2023 года и за 2 месяца стал одним из лидеров среди ИИ. Он использует OpenAI GPT и стремится улучшить её.
1К открытий3К показов
Проект AutoGPT был выпущен в открытый доступ в апреле 2023 года в качестве хобби, и всего за 2 месяца стал одним из лидеров по популярности в области искусственного интеллекта. Он использует нейросеть OpenAI GPT и стремится улучшить ее результаты.
Как работает OpenAI GPT и что с ней не так
Существуют несколько обучающих типов моделей для нейросетей. В аббревиатуре GPT первая буква от слова “Generative”, что можно перевести как “порождающая” новый результат. Модель используется для создания новых текстов, музыки и изображений.
Для обработки текстов в OpenAI выделен отдельный продукт под названием ChatGPT. Он с легкостью создаст сказку о собаке, идущей в шляпе по Невским проспектом в Сантк-Петербурге, а может написать специализированный пост для блога, или преобразовать научный текст в доступный широкому кругу людей вариант, а также понять настроение пользователей по отзывам к продукту.
У ChatGPT есть три существенных ограничения
Первое, текст запроса и ответа ограничены так называемыми токенами. В самой распространенной версии сегодня, GPT-3.5, стоит общее ограничение в 4096 токенов, что примерно равносильно 2000-3000 слов. Например, 500 слов на запрос, и 1500 на ответ от сервиса. В недавно выпущенной версии GPT-4 можно будет использовать до 32 000 токенов, или примерно 16 000 слов. ChatGPT описывает 1000 токенов как 750 английских слов, но на практике русскими символами выходит только 500 слов, т.е. 1 буква занимает 1.5 – 2 токена.
Второе, OpenAI GPT модели натренированы на огромном массиве данных из научных статей, Википедии и других источников. Тем не менее, эта информация устаревшая. Так, последняя версия ChatGPT-4 ограничена данными сентября 2021 года.
Третье, для ChatGPT необходимо указывать очень точный запрос. А порой и делать несколько дополнительных запросов на основе предыдущих ответов, уточняя с каждым разом свои параметры, иначе говоря “чатиться” с нейросетью.
Аналогично поступают для обхода ограничений с токенами при запросах через ChatGPT API. Допустим необходимо сделать вывод о развитии болезни пациента по истории посещений в клинике. Тексты всех посещений в один запрос не помещаются. В качестве решения просят сделать вывод о каждом посещении отдельно, а потом на их основе сделать результирующий вывод. Конечно, часть информации при такой процедуре может быть не учтена или исказиться.
Чем хорош AutoGPT
AutoGPT отправляет запросы к OpenAI GPT для получения ответов, но при этом обходит ограничения с помощью:
1. Доступа к поисковом сайтам: Google, Bing, Википедия, и т.д.
2. Умению улучшать и разбивать на части запросы к OpenAI.
Как выглядит работа с AutoGPT
Предположим, что нам необходимо узнать “Сколько лет было человеку когда он впервые побывал в космосе?”.
Для работы с AutoGPT необходимо передать цели – описание алгоритма задачи, при котором создается новый микро AI агент. Чтобы не писать все цели вручную, существуют сервисы, такие как Godmode.space, которые умеют их описыаать на основе одного запроса, например:
Цель 1: Идентифицировать человека впервые побывавшего в космосе.
Цель 2: Узнать его дату рождения.
Цель 3: Узнать дату когда он впервые был в космосе.
Цель 4: Вычислить его возраст во время первого космического полета.
Далее нейросеть будет предлагать шаги-действия. Каждый шаг можно исправить, полностью изменить, или просто с ним согласиться.
Так, на первом этапе AutoGPT предложил сделать запрос в Google “Кто совершил первый полет в космос?”.
После ошибки обработки ответа от Google, поступило новое – отправить такой же поисковый запрос, но уже в Википедию.
Получив информацию о Юрие Гагарине, его дате рождения, дате первого полета, поступило еще одно предложение, на этот раз отправить точный запрос о вычислении возраста Гагарина в момент первого полета сразу в OpenAI ChatGPT. И в итоге сервис вернул правильный результат – 27 лет.
Нейросеть старается достичь правильного результата через итерации, то обращаясь к поисковым сайтам, то к OpenAI для обработки информации. В конечном итоге система AutoGPT стремится быть полностью автономной, отсюда и название, т.е. пытается дать точный ответ так, как бы это сделал человек, проведя небольшое исследование через поисковые сайты.
А так выглядит задача “найти актуальную цену для видеокарты Nvidia RTX 4090”.
Для того, чтобы полностью отключить контроль над поэтапными “предложениями” нейросети и довериться ее автономной работе существует специальный параметр “–continuous” или “continuous-mode”. Будьте внимательны так как данный параметр может очень быстро сьесть ваш бюджет.
Примеры использования AutoGPT
1. Используя AutoGPT создали сайт
2. Заказали пиццу
3. Создали “шуточный” проект ChaosGPT для уничтожения человечества.
4. Сделали базовый поиск конкуретнов, подрядчиков, и т.д. в определенном регионе. Поскольку информация берется из поисковиков без человеческого анализа, то данные могут быть совсем не точными. Тем не менее этот подход может испоьзоватьсядля агрегации новстей бизенес сферы, больших данных или поиска бизенс идей, например, запросы о количестве проданных iPhone в определенной стране или регионе, популярных продуктах, количесвте тендеров:
Что еще умеет AutoGPT
Помимо работы с текстовыми сообщениями, есть интеграция с сервисом OpenAI DALL-E, который позволяет создавать новые изображения и обрабатывать существующие.
Также есть большой выбор плагинов для подключения, например, обработка электронных писем и отправление авто-ответа, покупка или продажа акций, интеграция с Instagram, Telegram и другими сервисами.
Выглядит потрясающе, в чем минусы Auto-GPT?
У нейросети есть несколько неприятных моментов.
Продукт довольно “сырой” и находится в экспериментальной фазе.
Так, на запрос “Сколько лет мужу Эммы Уотсон?”, нейросеть может уйти в бесконечный цикл, так как кроме слухов в открытых источниках данной информации нет. AutoGPT попытается сделать поиск информации об актрисе в интернете, затем произведет поиск по новостям в Google, далее в Википедии, потом по публичной базе регистраций браков, и т.д. без остановки.
Довольно часто нейросеть не может распознать результат поиска сайтов и выдает ошибку. А иногда формирует не точные запросы к ChatGPT по заданным целям.
Не нужно забывать и о зависимости от платной платфомы OpenAI, на которую нужно обязательно зарегистрироваться. В OpenAI запрос в 500-750 слов стоит от $0.0015 (0.13 ₽) до t$0.12 (10 ₽). В качестве одной из защит против бесконечного поиска AutoGPT принято ставить ограничение ежемесячного бюджета в настройках OpenAI, и максимальное количество шагов для запросов.
Также будет необходимо оплатить частые поисковые запросы у одного из провайдеров (Google, Bing, Яндекс, и т.п.) или делать очередь бесплатных нечастых запросов.
Средние и большие модели потребуют ресурсоемкой обработки на отдельных серверах, либо придется воспользоваться одним из платных сервисов, таких как Pinecone или Redis Cloud. Все это удовольствие может оказаться не самым дешевым для средне- и высоконагруженных систем. Определенно потребуется тщательная планировка бюджета.
Выводы
Проект AutoGPT стремится вывести работу нейросетей на новый уровень, используя самую актуальную информацию из интернета, но пока находится в начале своего пути и работает нестабильно.
1К открытий3К показов