{"time":1723193841168,"blocks":[{"id":"pRbEw08Ilu","type":"paragraph","data":{"text":"Эффективное управление ресурсами является основой успеха в бизнесе. Однако многие бизнес-процессы требуют значительных человеческих ресурсов, которых часто не хватает для обеспечения необходимой оперативности и масштабируемости. Это ограничение может проявляться в увеличении времени выполнения задач и рисках, связанных с зависимостью от «фактора автобуса» — показателя, который отражает взаимозаменяемость членов команды."}},{"id":"3w-Zlpg4ga","type":"paragraph","data":{"text":"Здесь на помощь приходят интеллектуальные функции, обеспечиваемые технологиями машинного обучения, в частности, большими языковыми моделями (LLM). Наиболее популярные среди них — LLaMA, GigaChat, YaGPT 2 и ChatGPT. Однако для достижения новых уровней эффективности, инноваций и устойчивого развития бизнесу необходимо понимать все тонкости использования машинного обучения и генеративного ИИ."}},{"id":"5EOLtIE3oJ","type":"person","data":{"person":{"avatar":{"original":"https://media.tproger.ru/user-uploads/103688/2024-08-07/34d6aeda-8e1f-4ad1-9c8d-c5b41c401b11.jpg","alt":"Аватар эксперта Максим Милков","dimensions":{"width":80,"height":80},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/F1kwoynYXyoGnGCVSZAS5ZghE-Ehztj2h8BiCpfPeXA/rs:fit:80:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNy8zNGQ2YWVkYS04ZTFmLTRhZDEtOWM4ZC1jNWI0MWM0MDFiMTEuanBn","dpr":1,"width":80},{"url":"https://tproger.ru/signed_image/jPWgbNC7Q6LLW65AqH_qr_jZCMA6HJ-JwleWP1EFLe0/rs:fit:160:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNy8zNGQ2YWVkYS04ZTFmLTRhZDEtOWM4ZC1jNWI0MWM0MDFiMTEuanBn","dpr":1,"width":160}],"sizes":[{"media":"(min-width: 0px)","size":"80px"}]}},"name":"Максим Милков","description":"Лидер направления ИИ Softline Digital (ГК Softline)"},"sourceId":null,"sourceType":null,"update":false}},{"id":"R7nTDxEdAt","type":"person","data":{"person":{"avatar":{"original":"https://media.tproger.ru/user-uploads/103688/2024-08-07/25711079-9fba-4988-aa34-37a1d1a8fdb5.jpg","alt":"Аватар эксперта Дмитрий Зборошенко","dimensions":{"width":80,"height":80},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/vQgveEadi5HnCpN5RMKaIrlIhXx2gHdW6itxaaNHo_Y/rs:fit:80:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNy8yNTcxMTA3OS05ZmJhLTQ5ODgtYWEzNC0zN2ExZDFhOGZkYjUuanBn","dpr":1,"width":80},{"url":"https://tproger.ru/signed_image/BJNi0TMdzW8AOjnONbuayXoM0cmCwfmXlfwuDbudryk/rs:fit:160:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNy8yNTcxMTA3OS05ZmJhLTQ5ODgtYWEzNC0zN2ExZDFhOGZkYjUuanBn","dpr":1,"width":160}],"sizes":[{"media":"(min-width: 0px)","size":"80px"}]}},"name":"Дмитрий Зборошенко","description":"ML/AI архитектор Softline Digital (ГК Softline)"},"sourceId":null,"sourceType":null,"update":false}},{"id":"dfl5y9pV27","type":"header2","data":{"text":"Трансформация рутинных операций с большими языковыми моделями","level":2},"tunes":{}},{"id":"C6qd0Qu91V","type":"paragraph","data":{"text":"Одна из ключевых возможностей больших языковых моделей (LLM) — их способность автоматизировать рутинные операции, например, обработку текстовых документов с высокой точностью. Примечательно, что эффективность LLM может варьироваться в зависимости от сложности задачи. В некоторых случаях модель может решить задачу без дополнительного обучения, но иногда требуется настройка сложных инструкций или контекста для эффективного выполнения задачи."}},{"id":"13meCbdC26","type":"paragraph","data":{"text":"Существует множество подходов к обучению и применению языковых моделей в бизнесе. Например, можно применять как глобальные, так и локальные поисковые инструменты для предоставления модели релевантной информации или контекста для решения задачи. Это включает поиск соответствующей документации или использование поисковых движков."}},{"id":"fLJONwmm1i","type":"paragraph","data":{"text":"Основным преимуществом является возможность расширения функционала модели с помощью дополнительных инструментов и методов, таких как Longformer или LaMDA без необходимости написания большого объема кода. Это значительно сокращает время разработки: процессы, которые ранее могли занимать несколько месяцев, теперь могут быть завершены в течение одного дня."}},{"id":"VvwMPgV-Se","type":"header3","data":{"text":"Среди преимуществ LLM:","level":3},"tunes":{}},{"id":"vSZ2SasULT","type":"list","data":{"style":"unordered","items":["Ответные системы. Модель может быть помощником для специалистов, например, в технической поддержке, предоставляя ответы на вопросы на основе базы знаний.","Извлечение информации. Модель способна извлекать информацию из текстовых запросов и заполнять формы или предоставлять структурированные данные на основе заданных инструкций.
","Суммаризация текста. Модель может предоставлять краткое изложение текста, что полезно при анализе договоров или других длинных текстов.
"]}},{"id":"9HzeqyLeeL","type":"hint","data":{"text":"Исследование McKinsey показало, что компании, внедрившие технологии искусственного интеллекта, включая LLM, смогли повысить производительность на 40% и снизить затраты на 20%. Другой пример — Amazon, которая использует LLM для автоматизации обработки клиентских запросов, что позволило сократить время отклика на 50%.","fullWidth":true}},{"id":"rIgDCUrRRE","type":"paragraph","data":{"text":"Однако следует помнить, что модели не всегда могут решить задачу без дополнительного обучения или настройки. Иногда требуется тщательное тестирование и определение границ применения модели для конкретной задачи, что может потребовать дополнительной логики или доработки модели."}},{"id":"SS1DuCZWwg","type":"image","data":{"alt":"","title":"","caption":"","file":{"url":"https://media.tproger.ru/user-uploads/103688/2024-08-04/1283d4ce-b258-4ba1-86fb-b1c03ebba15c.jpg","id":35107},"stretched":false,"withBackground":false,"withBorder":false,"width":2119,"height":1414,"optimizedFile":{"original":"https://media.tproger.ru/user-uploads/103688/2024-08-04/1283d4ce-b258-4ba1-86fb-b1c03ebba15c.jpg","alt":"Будущее бизнеса — как большие языковые модели меняют правила игры 1","dimensions":{"width":2119,"height":1414},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/qE0I5Y_5NCT0b9DFmyQOJsq3FZXV0Bsp66M_OcgFXYk/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC8xMjgzZDRjZS1iMjU4LTRiYTEtODZmYi1iMWMwM2ViYmExNWMuanBn","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/HgCPks_4eLtZBo2LsgyGaHxWDddvPHHFf3h7Z59QAr8/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC8xMjgzZDRjZS1iMjU4LTRiYTEtODZmYi1iMWMwM2ViYmExNWMuanBn","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/UyhrIRNyrUFwDBaq4Y8utlloNhPBSHGNn2G7Hte6n5I/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC8xMjgzZDRjZS1iMjU4LTRiYTEtODZmYi1iMWMwM2ViYmExNWMuanBn","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/4mx9InRf285v0B6OaGthSWC9xsUr6OpeUapXmVueQKQ/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC8xMjgzZDRjZS1iMjU4LTRiYTEtODZmYi1iMWMwM2ViYmExNWMuanBn","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/Cz1G_wDpDr1d--zYFZAxgDNQxS3jBhrB_fTx7QfdmEU/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC8xMjgzZDRjZS1iMjU4LTRiYTEtODZmYi1iMWMwM2ViYmExNWMuanBn","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/Vh6NiXj2bFyFulWBzX4cdrDXJ5OoMosvyW_oTjiLzxU/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC8xMjgzZDRjZS1iMjU4LTRiYTEtODZmYi1iMWMwM2ViYmExNWMuanBn","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/fO29FdyyY6VFxxpNwfTKFPKzEONndZ_rZwmgrKXW1Xg/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC8xMjgzZDRjZS1iMjU4LTRiYTEtODZmYi1iMWMwM2ViYmExNWMuanBn","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/uWazWSVE-bZI19jj723LYvaQRRNEObxPg4-pG5NW7tc/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC8xMjgzZDRjZS1iMjU4LTRiYTEtODZmYi1iMWMwM2ViYmExNWMuanBn","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"id":"rzy9szsxzY","type":"header2","data":{"text":"Увеличение объема контекста в языковых моделях","level":2},"tunes":{}},{"id":"ZWeQYGZhVV","type":"paragraph","data":{"text":"Проблема объема контекста в языковых моделях является важной и актуальной, особенно при работе с большими текстовыми данными. Ранние версии языковых моделей имели ограничение на объем контекста в пределах 2000-3000 токенов — часто этого было недостаточно. Однако современные архитектурные решения позволяют значительно увеличить этот объем. Например, последний релиз от компании Anthropic включает модель под названием CLARA3, способную обрабатывать окно контекста до 200 000 токенов. Это эквивалентно значительному объему текста, что позволяет модели учитывать более обширные контексты при решении задач. "}},{"id":"ntPvzXzg6n","type":"paragraph","data":{"text":"Одной из серьезных проблем в использовании языковых моделей является галлюцинация, когда модель генерирует неправдоподобные или несуществующие ответы. Для борьбы с этой проблемой применяются различные подходы. Например, можно просить модель ссылаться на конкретные источники или добавлять контекст, чтобы ограничить ее ответы только теми данными, которые предоставлены. Также существуют методы, основанные на статистической погрешности, которые помогают снизить вероятность генерации неправдоподобных ответов."}},{"id":"wR3MI5oBuK","type":"paragraph","data":{"text":"Современные технологии позволяют эффективно бороться с проблемой объема контекста, увеличивая объем обрабатываемой информации и снижая вероятность генерации неправдоподобных ответов. Увеличение объема контекста способствует более точной и релевантной обработке данных, что, в свою очередь, повышает качество решений, принимаемых на основе таких моделей."}},{"id":"dKN2QaXU2G","type":"image","data":{"alt":"","title":"","caption":"","file":{"url":"https://media.tproger.ru/user-uploads/103688/2024-08-04/db2319ef-6215-4ff1-b669-f7b0dd2677aa.jpg","id":35108},"stretched":false,"withBackground":false,"withBorder":false,"width":2121,"height":1414,"optimizedFile":{"original":"https://media.tproger.ru/user-uploads/103688/2024-08-04/db2319ef-6215-4ff1-b669-f7b0dd2677aa.jpg","alt":"Будущее бизнеса — как большие языковые модели меняют правила игры 2","dimensions":{"width":2121,"height":1414},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/FVoMpJNz6biWMudd1HbJtSGCATE8NQrMI5193cttzgo/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC9kYjIzMTllZi02MjE1LTRmZjEtYjY2OS1mN2IwZGQyNjc3YWEuanBn","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/kM9RmGFknFo4PiCHovDsl_T2mgvqNtzwvH2FkLeA47I/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC9kYjIzMTllZi02MjE1LTRmZjEtYjY2OS1mN2IwZGQyNjc3YWEuanBn","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/L1djLJ_zW6Ww52fTEFC3TEe2AMuBtll7pNVTkUtyZ5c/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC9kYjIzMTllZi02MjE1LTRmZjEtYjY2OS1mN2IwZGQyNjc3YWEuanBn","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/qPXtmZk3xI2LhNDf2L16Ew4SVP9idVCNudyfMQuHU4M/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC9kYjIzMTllZi02MjE1LTRmZjEtYjY2OS1mN2IwZGQyNjc3YWEuanBn","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/fHtUQlq_NFNs9kK49xQIBPBYlWpsyy9CTn-eUrNTtMs/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC9kYjIzMTllZi02MjE1LTRmZjEtYjY2OS1mN2IwZGQyNjc3YWEuanBn","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/m3JTVUGgITF7poItUHnPa5Py1xq_OsrYR16AWl2dewY/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC9kYjIzMTllZi02MjE1LTRmZjEtYjY2OS1mN2IwZGQyNjc3YWEuanBn","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/H3JlqbyMGz8elj_b8WKTH5q5R49lK5psH2VXjzCFEwY/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC9kYjIzMTllZi02MjE1LTRmZjEtYjY2OS1mN2IwZGQyNjc3YWEuanBn","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/XFVYUyerUhe9px2j-wx8Z-APvNS5bDx8bELq3010pL0/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC9kYjIzMTllZi02MjE1LTRmZjEtYjY2OS1mN2IwZGQyNjc3YWEuanBn","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"id":"JFbG6Xgaaa","type":"paragraph","data":{"text":"Для обучения больших языковых моделей требуется значительное количество ресурсов, как финансовых, так и вычислительных. Например, обучение модели уровня ChatGPT может потребовать несколько десятков миллионов долларов и огромное количество вычислительных мощностей."}},{"id":"dYBrvxzT1i","type":"paragraph","data":{"text":"Модели могут разрабатываться как в академических, так и в корпоративных средах. Некоторые компании обладают достаточными ресурсами для разработки и обучения собственных моделей, в то время как другие могут получать финансирование на исследования и разработки от университетов или организаций, заинтересованных в развитии и применении искусственного интеллекта."}},{"id":"599141cf-9904-4cde-8afa-b1702772e872","type":"embed","data":{"data":{"id":253442,"name":"chto-takoe-nejronnye-seti--prostoe-obyasnenie-dlya-netehnarej","type":"post","title":"Что такое нейронные сети: простое объяснение для нетехнарей","author":84470,"parent":233204,"status":"publish","content":"

Начнем с терминов: что такое Data Science, искусственный интеллект и машинное обучение

\r\n\r\n

Искусственный интеллект. Система, которая может принимать решения и выполнять действия, подобно человеку, на основе больших данных. Базируется он на Data Science, который, в свою очередь, состоит в основном из математики и статистики, так что учить эти науки так же важно, как и программирование. Специалисты выделяют три типа искусственного интеллекта:

\r\n\r\n

Слабый искусственный интеллект — ИИ, разработанный для решения конкретных задач: скоринг, рекомендации, ответы на вопросы. Это все то, чем мы сейчас пользуемся. Например, ChatGPT, нейронки, которые делают картинки и видео, умные ленты и прочее.
Сильный искусственный интеллект — ИИ, которые еще предстоит создать. Прогнозируется, что он сможет выполнить любую задачу так же хорошо, как и человек. Генеративные нейросети сильно приблизили его появление, так что увидеть мы его должны в 2030–2040 годах.
Суперсильный ИИ, так называемый ASI, который превзойдет разум человека. Но пока до него далековато. Некоторые ученые предполагают, что если он появится, мы перестанем отличать искусственный интеллект от человеческого, поэтому очень важно уже на этапе слабого ИИ закладывать верную базу и этические принципы.

\r\n\r\n

\n \n \n \n

\r\n\r\n

Машинное обучение. «Подраздел» искусственного интеллекта. Это собственно алгоритмы построения моделей, которые принимают решения и выполняют задачи.

\r\n\r\n

Deep Learning. Вид машинного обучения, при котором искусственный интеллект сам находит алгоритмы для решения конкретной задачи.

\r\n\r\n

LLM — большая языковая модель глубокого обучения, обученная на огромном количестве данных.

\r\n\r\n

Как развивались искусственный интеллект и машинное обучение

\r\n\r\n

\n \n \n \n

\r\n\r\n

Само понятие «нейросети» появилось в 1943 году: двое исследователей, Мак-Каллок и Питт, использовали его в публикации, чтобы описать систему, повторяющую устройство головного мозга. Но вплоть до 1958 года не было опубликовано ни одного крупного исследования на эту тему, потому что научное сообщество решило, что неэтично и невозможно повторить такое великое создание, как человек. Основной фокус остался на изучении математических и статистических моделей.

\r\n\r\n

Бурный рост ИИ начинается примерно с 1990-х годов, появляется большое количество сетей: рекуррентных, с памятью и прочее. Стали широко распространяться алгоритмы, которые решали прикладные задачи: например, определяли надежность клиентов в плане возврата кредита или решали, стоит ли показать электронное письмо пользователю или можно убрать в спам.

\r\n\r\n

Все это делалось с помощью довольно сложных алгоритмов, но в 2010-х появились GPU от компании NVidia и в сочетании с алгоритмами на Python, дали огромный прирост к эффективности выполнения задач, в первую очередь тех, что касались компьютерного зрения.

\r\n\r\n

Компьютерное зрение лучше всего показывает, как стремительно развивался ИИ и как сильно он ошибался на ранних стадиях. Например, он не мог определить, где собака, а где — кекс, или отличить шарпея от полотенца.

\r\n\r\n

Своеобразным водоразделом в сфере искусственного интеллекта стала статья Attention is all you need, вышедшая в 2017 году. Она рассказала про трансформеры — сети, основанные на технологии внимания, которые трансформируют информацию.

\r\n\r\n

Технология внимания — это сложный механизм, основанный на перемножении матриц и способный обучаться, только при наличии больших мощностей, например, на суперкомпьютерах. Вот простой пример: у нас есть пять слов, которые нужно перемножить сами на себя. Сделав это, мы получим некоторую статистическую модель, благодаря которой можно вычислить, слово, которое с наибольшей вероятностью будет идти дальше, после предыдущего.

\r\n\r\n

\n \n \n \n

\r\n\r\n

Так, начинается развитие трансформеров. В 2017 году выходят новые модели для перевода языков, выходит BERT, который примерно «понимает текст». В 2019 году выходит GPT-2, из которой уже в 2022 году вырастет всем нам известная GPT-3, которая подарила нам ChatGPT.

\r\n\r\n

Как работают нейросети

\r\n\r\n

Нейросети работают примерно одинаково:

\r\n\r\n

получают запрос (или промт);
получают набор данных, на основе которых будут давать ответ на запрос;
раскладывают данные на нейроны;
переводят поток этих данных от нейрона к нейрону поток;
на выходе дают какой-то результат.

\r\n\r\n

Давайте посмотрим на самый простой пример — задачу на классификацию.

\r\n\r\n

\n \n \n \n

\r\n\r\n

Справа вы видите два вида шариков, оранжевые и синие. Возьмем самую простую модель с двумя «нейронами» на входе и на выходе: она старается решить задачу, раскладывает данные, ведет их от нейрона к нейрону, но в синюю зону все равно попадают оранжевые шарики. Задача не решена. Чтобы это исправить, нам нужно изменить архитектуру модели и добавить больше нейронов. Например, четыре.

\r\n\r\n

Запускаем обучение, видим, что данные текут и задача решается.

\r\n\r\n[video width=\"766\" height=\"431\" src=\"https://media.tproger.ru/user-uploads/100503/2024-12-12/af4e8e4a-682d-483e-adbc-fa8b945c8b7a.mp4\" data-id=\"43173\" data-original-width=\"1920\" data-original-height=\"1080\"][/video]\r\n\r\n

Некоторые модели, когда не могут решить задачу, начинают галлюцинировать, то есть неправильно оценивать полученные данные и, как следствие, давать неправильный результат (этим, например, грешит ChatGPT). Так происходит потому, что модель не умеет отказывать пользователю, даже если не знает верного решения.

\r\n\r\n

Реальный и очень интересный кейс: пользователь попросил нейросеть написать рецепт салата — и та предложила добавить в блюдо камни.

\r\n\r\n

Понять, какая модель эффективнее, можно на LLM Arena. Это сайт, на котором проводятся слепые тесты: мы даем задачу, две случайные, неизвестные нам нейросети ее решают, и мы оцениваем, какая справилась лучше. Такие тесты проходят огромное количество людей, благодаря чему у нас есть рейтинг лучших моделей. На момент, когда мы писали эту статью, лучшей моделью оставалась GPT-4о.

\r\n\r\n

Как ИИ работает со специфическими запросами

\r\n\r\n

Например, у вас задача, при решении которой очень важно учитывать контекст, или которую можно выполнить, только на основе специфических данных. Чтобы получить релевантный ответ, нужна особая технология — RAG (генерация с дополненной выборкой).

\r\n\r\n

RAG — это процесс оптимизации запроса. Работает это так: любой запрос, перед тем как попасть в модель, «идет» по внутренним базам данных, где обрастает контекстом (параллельно сам промт обрастает дополнительными запросами), и только потом отправляется в LLM. Такой подход дает очень классные результаты и очень полезен компаниям, которые разрабатывают свои модели (потому что для работы с внутренними базами данных ChatGPT не прикрутишь).

\r\n\r\n

Мы решили использовать RAG в работе и сделали классный хакатон с лидерами цифровой трансформации. На нем предложили задачу разработать сервис по генерации персональных маркетов предложений, исходя из того, что мы знаем о конкретном клиенте: пол, возраст, адрес, траты и прочее.

\r\n\r\n

Где сегодня применяется ИИ

\r\n\r\n

Теперь, когда мы разобрались, что такое искусственный интеллект и откуда он взялся, давайте обсудим, где его сегодня используют:

\r\n\r\n

Игры. В качестве примера возьмем AlphaGo, в которую еще в 2016 ИИ переиграл человека.
В науке. Например, модель AlphaFold, которая анализирует и помогает предсказывать структуру белка и должна сильно помочь в разработке лекарств.
В медицине. ИИ помогает анализировать КТ и рентгены и диагностировать заболевания.
В генерации изображений и текстов.

\r\n\r\n

\n \n \n \n О том, как Midjourney или DALL-E создают изображения, вы явно знаете, поэтому просто покажем, как сильно прокачались нейросети в генерации картинок, на примере Гарри Поттера.\n

\r\n\r\n

В создании голоса и музыки. ИИ может наложить голос одного исполнителя на треки другого, может генерировать мелодию, улучшить ритм или перевести голос в инструменты.

\r\n\r\n

Генерация изображений и текстов сильно связаны, потому что и там, и там результат зависит от того, насколько хорошо вы напишете промпт.

\r\n\r\n

Вместо вывода: что нам делать с ИИ

\r\n\r\n

С точки зрения закона, искусственный интеллект — довольно спорная вещь. Тема, которая обсуждается особенно часто — замена реальных людей на нейросети.

\r\n\r\n

Но бояться, что всех нас заменят машины, пока рано, потому что ИИ не может решать задачи так же хорошо, как и человек. Зато довольно сильно повышает производительность труда и позволяет реальным работникам сосредоточиться на сложных и творческих задачах.

\r\n\r\n

Благодаря ИИ намечается новая промышленная революция, потому что человек, наконец, стал оптимизировать не только физический труд, но и интеллектуальный. Говорить о том, как этот инструмент изменит наш мир, пока рано, но к сильному толчку он точно приведет.

\r\n\r\n

Другая опасность — авторское право, которое сейчас очень слабо регулируется государствами. Тут можно только посоветовать читать пользовательские соглашения и не полагаться на творчество ИИ на 100%.

\r\n\r\n

Тем не менее правительства разных стран вводят ограничения на работу ИИ, чтобы предупредить возможные угрозы.

\r\n\r\n","created_at":"2024-12-13T12:08:07.000+03:00","updated_at":"2024-12-13T12:08:07.000+03:00","created_at_gmt":"2024-12-13T09:08:07.000+03:00","updated_at_gmt":"2024-12-13T09:08:07.000+03:00"},"link":"https://tproger.ru/articles/chto-takoe-nejronnye-seti--prostoe-obyasnenie-dlya-netehnarej","type":"tproger","image":null,"title":"Что такое нейронные сети: простое объяснение для нетехнарей","subType":"tproger_post","viewDomain":"tproger.ru"}},{"id":"iEB9qDWL_3","type":"paragraph","data":{"text":"Процесс разработки и обучения больших языковых моделей является сложным и дорогостоящим, и в большинстве случаев требует значительных инвестиций. Это включает в себя значительные инженерные усилия и ресурсы для сбора, очистки и подготовки данных, а также для настройки и оптимизации вычислительной инфраструктуры."}},{"id":"AXN24R2dUO","type":"paragraph","data":{"text":"Современные архитектурные решения позволяют значительно увеличивать объем контекста, который могут обрабатывать языковые модели, что улучшает их способность решать сложные задачи. Одновременно с этим разработка и обучение таких моделей требуют значительных финансовых и вычислительных ресурсов, что делает этот процесс доступным преимущественно для крупных компаний и специализированных исследовательских организаций."}},{"id":"brcPFpfi72","type":"header2","data":{"text":"Демократизация доступа к языковым моделям","level":2},"tunes":{}},{"id":"VjIO8lP8aY","type":"paragraph","data":{"text":"Одним из главных ограничений для предприятий является доступ к ресурсам — как финансовым, так и человеческим. Обучение больших языковых моделей требует значительных инвестиций в вычислительные мощности и опытных специалистов. Эти затраты могут стать барьером для многих компаний, особенно небольших или стартапов."}},{"id":"P0qQ-PX0Xq","type":"paragraph","data":{"text":"Существует тенденция к упрощению процесса обучения моделей и увеличению их доступности. Несколько лет назад обучение моделей с большим количеством параметров казалось сложным и дорогостоящим процессом, однако сейчас это стало более доступным благодаря развитию технологий и фреймворков. Примером может служить распространение облачных сервисов, которые предоставляют необходимые вычислительные ресурсы по подписке."}},{"id":"d2668574-ad16-4107-95a3-e30916633305","type":"embed","data":{"data":{"id":254865,"name":"--copilot-vernul-razrabotchiku-iz-microsoft-ego-zhe-kod","type":"post","title":"🔥 Copilot вернул разработчику из Microsoft его же код","author":94744,"parent":72711,"status":"publish","content":"

Разработчик Microsoft Мао Пачеко столкнулся с неожиданным эффектом использования ИИ-ассистентов при программировании.

\r\n\r\n

Работая над новым проектом по интеграции ActivityPub в .NET, он решил использовать Copilot и другие ИИ-инструменты для оптимизации своего кода.

\r\n\r\n

Однако ответ ИИ заставил его пересмотреть своё отношение к этим технологиям.

\r\n\r\n

Как всё началось

\r\n\r\n

Пачеко, известный своими многочисленными сайд-проектами, запустил новый репозиторий в 1:00 ночи — по его словам, он просто не мог игнорировать внезапное вдохновение.

\r\n\r\n

Чтобы ускорить процесс, разработчик решил подключить Copilot, Claude, ChatGPT и GitHub Copilot. Он использует их не только для кодинга, но и для форматирования документов, исправления грамматики и даже планирования путешествий.

\r\n\r\n

Однако на этот раз Copilot его удивил — он вернул точную копию кода, который Пачеко написал сам.

\r\n\r\n

ИИ-кодинг: гордость или кризис доверия?

\r\n\r\n

\n \n \n\n
Я не просто получил похожий код — он выдал мою же версию со всеми теми же странными именами пространств, пропущенными реализациями и магическими строками.
\n \n
\n Мао Пачеко\n Разработчик Microsoft\n
\n

\r\n\r\n

Такое совпадение вызвало у него две противоречивые эмоции:

\r\n\r\n

Гордость — его код стал частью обучающих данных для ИИ, пусть даже в каком-то незначительном масштабе.
Экзистенциальный кризис — если ИИ просто воспроизводит его же ошибки, можно ли доверять ему улучшение кода?

\r\n\r\n

По его словам, Copilot напоминает джуниора, уверенного в своём ответе, но на деле плохо понимающего контекст задачи.

\r\n\r\n

Иногда он выдаёт отличные исправления, которые действительно лучше исходного кода, но иногда просто генерирует уверенно звучащую чушь.

\r\n\r\n

Выводы: ИИ — не волшебная палочка

\r\n\r\n

По мнению Пачеко, разработчики должны помнить, что ИИ — это всего лишь инструмент, а не абсолютный источник истины. Да, он может ускорять работу, но его ответы всегда нужно проверять.

\r\n\r\n","created_at":"2025-03-13T18:25:08.000+03:00","updated_at":"2025-03-13T18:25:08.000+03:00","created_at_gmt":"2025-03-13T15:25:08.000+03:00","updated_at_gmt":"2025-03-13T15:25:08.000+03:00"},"link":"https://tproger.ru/news/--copilot-vernul-razrabotchiku-iz-microsoft-ego-zhe-kod","type":"tproger","image":null,"title":"🔥 Copilot вернул разработчику из Microsoft его же код","subType":"tproger_post","viewDomain":"tproger.ru"}},{"id":"hx_TFSMzrb","type":"paragraph","data":{"text":"Основным способом использования языковых моделей является обращение к готовым моделям, разработанным крупными компаниями. Они предоставляют доступ к своим моделям через API, что значительно облегчает их интеграцию в различные приложения и сервисы. Такой подход позволяет компаниям быстро и эффективно внедрять передовые технологии, не тратя значительные ресурсы на разработку собственных решений."}},{"id":"XBnr05GAan","type":"image","data":{"alt":"","title":"","caption":"","file":{"url":"https://media.tproger.ru/user-uploads/103688/2024-08-04/605bba3c-64b2-46c2-aa9d-e5f210f35613.jpg","id":35109},"stretched":false,"withBackground":false,"withBorder":false,"width":2029,"height":1478,"optimizedFile":{"original":"https://media.tproger.ru/user-uploads/103688/2024-08-04/605bba3c-64b2-46c2-aa9d-e5f210f35613.jpg","alt":"Будущее бизнеса — как большие языковые модели меняют правила игры 3","dimensions":{"width":2029,"height":1478},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/cXynjIdxWNSB2lnkxcUv1J63Is2v92et0JA1vfI0L2c/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC82MDViYmEzYy02NGIyLTQ2YzItYWE5ZC1lNWYyMTBmMzU2MTMuanBn","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/s1jCMZkdARSHefIKu_PzxrHTv408_ccrVJw5HfPEkPw/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC82MDViYmEzYy02NGIyLTQ2YzItYWE5ZC1lNWYyMTBmMzU2MTMuanBn","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/9Qb4QWlyY8w2Ywc_fYUXryRzWkw5BxYxktNAgF2EqFw/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC82MDViYmEzYy02NGIyLTQ2YzItYWE5ZC1lNWYyMTBmMzU2MTMuanBn","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/LqvHEQ8n6FTKjnzqnxI9OjqH22HqrIIAlJ20bdypwqw/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC82MDViYmEzYy02NGIyLTQ2YzItYWE5ZC1lNWYyMTBmMzU2MTMuanBn","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/n3e8rjsAPk7MNDyp00wSwYDrHMY4KlQ4V4M1Zd96Ymk/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC82MDViYmEzYy02NGIyLTQ2YzItYWE5ZC1lNWYyMTBmMzU2MTMuanBn","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/La1nn538hru-JIz-mSjHoH0hAvS1xAtZpTDWlTeTEMY/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC82MDViYmEzYy02NGIyLTQ2YzItYWE5ZC1lNWYyMTBmMzU2MTMuanBn","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/xRfSs59HVHa1b9yuE-1Nlxmvx1IT7JxZitSEZhp5zqg/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC82MDViYmEzYy02NGIyLTQ2YzItYWE5ZC1lNWYyMTBmMzU2MTMuanBn","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/bL1gZuV3ZmEGCp2cEnn5Mo9kajC2SARE_9fuh7hJNls/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDM2ODgvMjAyNC0wOC0wNC82MDViYmEzYy02NGIyLTQ2YzItYWE5ZC1lNWYyMTBmMzU2MTMuanBn","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"id":"57HXpIimx-","type":"paragraph","data":{"text":"Некоторые компании предоставляют возможность обучения собственных моделей на основе предоставленных данных. Это может быть полезным для создания моделей, специализированных под конкретные задачи или области. Такие компании, как Hugging Face и OpenAI, предлагают платформы и инструменты для обучения моделей, что делает процесс более доступным и удобным."}},{"id":"D8Ur1wx8C0","type":"paragraph","data":{"text":"Обученные модели могут быть монетизированы путем предоставления доступа к ним через различные платформы или маркетплейсы. Это позволяет получать прибыль от инвестиций в обучение моделей и собранные данные. Примером может служить использование моделей для предоставления платных API-сервисов или лицензирования технологий другим компаниям."}},{"id":"ByEMivNQoh","type":"paragraph","data":{"text":"Некоторые компании предпочитают разворачивать модели локально, что может быть дешевле и более гибко, чем использование облачных сервисов. Локальное развертывание требует наличия соответствующей вычислительной инфраструктуры, но при этом обеспечивает контроль над данными и позволяет избежать зависимостей от внешних сервисов."}},{"id":"34bb80e8-eb22-42cd-a18f-a281a9d62269","type":"banner-blank","data":{}},{"id":"NyhpWWk3FC","type":"paragraph","data":{"text":"Процесс использования и развертывания больших языковых моделей становится все более доступным и удобным благодаря развитию технологий и инфраструктуры. Это открывает новые возможности для бизнеса, позволяя использовать передовые технологии для повышения эффективности и создания инновационных решений."}}],"version":"2.25.0"}

Ошибка в настройках сайта