Что такое нейронные сети: простое объяснение для нетехнарей
Нейросети, машинное обучение, LLM, Deep Learning — все эти термины у каждого на слуху в последние пару лет. И на старте разобраться в них тяжеловато: значат ли они одно и то же или нет, в чем разница, как со всем этим работать. В Газпромбанке провели лекцию на эту тему. А мы сделали из нее простой, но закрывающий все базовые вопросы гайд.
361 открытий2К показов
Начнем с терминов: что такое Data Science, искусственный интеллект и машинное обучение
Искусственный интеллект. Система, которая может принимать решения и выполнять действия, подобно человеку, на основе больших данных. Базируется он на Data Science, который, в свою очередь, состоит в основном из математики и статистики, так что учить эти науки так же важно, как и программирование. Специалисты выделяют три типа искусственного интеллекта:
- Слабый искусственный интеллект — ИИ, разработанный для решения конкретных задач: скоринг, рекомендации, ответы на вопросы. Это все то, чем мы сейчас пользуемся. Например, ChatGPT, нейронки, которые делают картинки и видео, умные ленты и прочее.
- Сильный искусственный интеллект — ИИ, которые еще предстоит создать. Прогнозируется, что он сможет выполнить любую задачу так же хорошо, как и человек. Генеративные нейросети сильно приблизили его появление, так что увидеть мы его должны в 2030–2040 годах.
- Суперсильный ИИ, так называемый ASI, который превзойдет разум человека. Но пока до него далековато. Некоторые ученые предполагают, что если он появится, мы перестанем отличать искусственный интеллект от человеческого, поэтому очень важно уже на этапе слабого ИИ закладывать верную базу и этические принципы.
Машинное обучение. «Подраздел» искусственного интеллекта. Это собственно алгоритмы построения моделей, которые принимают решения и выполняют задачи.
Deep Learning. Вид машинного обучения, при котором искусственный интеллект сам находит алгоритмы для решения конкретной задачи.
LLM — большая языковая модель глубокого обучения, обученная на огромном количестве данных.
Как развивались искусственный интеллект и машинное обучение
Само понятие «нейросети» появилось в 1943 году: двое исследователей, Мак-Каллок и Питт, использовали его в публикации, чтобы описать систему, повторяющую устройство головного мозга. Но вплоть до 1958 года не было опубликовано ни одного крупного исследования на эту тему, потому что научное сообщество решило, что неэтично и невозможно повторить такое великое создание, как человек. Основной фокус остался на изучении математических и статистических моделей.
Бурный рост ИИ начинается примерно с 1990-х годов, появляется большое количество сетей: рекуррентных, с памятью и прочее. Стали широко распространяться алгоритмы, которые решали прикладные задачи: например, определяли надежность клиентов в плане возврата кредита или решали, стоит ли показать электронное письмо пользователю или можно убрать в спам.
Все это делалось с помощью довольно сложных алгоритмов, но в 2010-х появились GPU от компании NVidia и в сочетании с алгоритмами на Python, дали огромный прирост к эффективности выполнения задач, в первую очередь тех, что касались компьютерного зрения.
Компьютерное зрение лучше всего показывает, как стремительно развивался ИИ и как сильно он ошибался на ранних стадиях. Например, он не мог определить, где собака, а где — кекс, или отличить шарпея от полотенца.
Своеобразным водоразделом в сфере искусственного интеллекта стала статья Attention is all you need, вышедшая в 2017 году. Она рассказала про трансформеры — сети, основанные на технологии внимания, которые трансформируют информацию.
Технология внимания — это сложный механизм, основанный на перемножении матриц и способный обучаться, только при наличии больших мощностей, например, на суперкомпьютерах. Вот простой пример: у нас есть пять слов, которые нужно перемножить сами на себя. Сделав это, мы получим некоторую статистическую модель, благодаря которой можно вычислить, слово, которое с наибольшей вероятностью будет идти дальше, после предыдущего.
Так, начинается развитие трансформеров. В 2017 году выходят новые модели для перевода языков, выходит BERT, который примерно «понимает текст». В 2019 году выходит GPT-2, из которой уже в 2022 году вырастет всем нам известная GPT-3, которая подарила нам ChatGPT.
Как работают нейросети
Нейросети работают примерно одинаково:
- получают запрос (или промт);
- получают набор данных, на основе которых будут давать ответ на запрос;
- раскладывают данные на нейроны;
- переводят поток этих данных от нейрона к нейрону поток;
- на выходе дают какой-то результат.
Давайте посмотрим на самый простой пример — задачу на классификацию.
Справа вы видите два вида шариков, оранжевые и синие. Возьмем самую простую модель с двумя «нейронами» на входе и на выходе: она старается решить задачу, раскладывает данные, ведет их от нейрона к нейрону, но в синюю зону все равно попадают оранжевые шарики. Задача не решена. Чтобы это исправить, нам нужно изменить архитектуру модели и добавить больше нейронов. Например, четыре.
Запускаем обучение, видим, что данные текут и задача решается.
Некоторые модели, когда не могут решить задачу, начинают галлюцинировать, то есть неправильно оценивать полученные данные и, как следствие, давать неправильный результат (этим, например, грешит ChatGPT). Так происходит потому, что модель не умеет отказывать пользователю, даже если не знает верного решения.
Реальный и очень интересный кейс: пользователь попросил нейросеть написать рецепт салата — и та предложила добавить в блюдо камни.
Понять, какая модель эффективнее, можно на LLM Arena. Это сайт, на котором проводятся слепые тесты: мы даем задачу, две случайные, неизвестные нам нейросети ее решают, и мы оцениваем, какая справилась лучше. Такие тесты проходят огромное количество людей, благодаря чему у нас есть рейтинг лучших моделей. На момент, когда мы писали эту статью, лучшей моделью оставалась GPT-4о.
Как ИИ работает со специфическими запросами
Например, у вас задача, при решении которой очень важно учитывать контекст, или которую можно выполнить, только на основе специфических данных. Чтобы получить релевантный ответ, нужна особая технология — RAG (генерация с дополненной выборкой).
RAG — это процесс оптимизации запроса. Работает это так: любой запрос, перед тем как попасть в модель, «идет» по внутренним базам данных, где обрастает контекстом (параллельно сам промт обрастает дополнительными запросами), и только потом отправляется в LLM. Такой подход дает очень классные результаты и очень полезен компаниям, которые разрабатывают свои модели (потому что для работы с внутренними базами данных ChatGPT не прикрутишь).
Мы решили использовать RAG в работе и сделали классный хакатон с лидерами цифровой трансформации. На нем предложили задачу разработать сервис по генерации персональных маркетов предложений, исходя из того, что мы знаем о конкретном клиенте: пол, возраст, адрес, траты и прочее.
Где сегодня применяется ИИ
Теперь, когда мы разобрались, что такое искусственный интеллект и откуда он взялся, давайте обсудим, где его сегодня используют:
- Игры. В качестве примера возьмем AlphaGo, в которую еще в 2016 ИИ переиграл человека.
- В науке. Например, модель AlphaFold, которая анализирует и помогает предсказывать структуру белка и должна сильно помочь в разработке лекарств.
- В медицине. ИИ помогает анализировать КТ и рентгены и диагностировать заболевания.
- В генерации изображений и текстов.
- В создании голоса и музыки. ИИ может наложить голос одного исполнителя на треки другого, может генерировать мелодию, улучшить ритм или перевести голос в инструменты.
Генерация изображений и текстов сильно связаны, потому что и там, и там результат зависит от того, насколько хорошо вы напишете промпт.
Вместо вывода: что нам делать с ИИ
С точки зрения закона, искусственный интеллект — довольно спорная вещь. Тема, которая обсуждается особенно часто — замена реальных людей на нейросети.
Но бояться, что всех нас заменят машины, пока рано, потому что ИИ не может решать задачи так же хорошо, как и человек. Зато довольно сильно повышает производительность труда и позволяет реальным работникам сосредоточиться на сложных и творческих задачах.
Благодаря ИИ намечается новая промышленная революция, потому что человек, наконец, стал оптимизировать не только физический труд, но и интеллектуальный. Говорить о том, как этот инструмент изменит наш мир, пока рано, но к сильному толчку он точно приведет.
Другая опасность — авторское право, которое сейчас очень слабо регулируется государствами. Тут можно только посоветовать читать пользовательские соглашения и не полагаться на творчество ИИ на 100%.
Тем не менее правительства разных стран вводят ограничения на работу ИИ, чтобы предупредить возможные угрозы.
361 открытий2К показов