Скин на НГ, перетяжка
Скин на НГ, перетяжка
Скин на НГ, перетяжка
Распознавание
Распознавание

Материалы, посвященные разработкам в области программного распознавания образов.

Tproger

Почему банки нанимают ученых для распознавания паспортов, а не open-source модели

Студент собирает распознавание паспортов за выходные, а банки платят миллионы за специальные решения. Разбираемся, почему бесплатные AI-модели не подходят для бизнеса и при чём здесь реальная наука

Почему банки нанимают ученых для распознавания паспортов, а не open-source модели
2930
Сергей Киприн

Как мы разрабатываем систему голосового управления презентациями на базе Whisper и GigaChat

Как создать инструмент, который позволяет переключать слайды с помощью голосовых команд и контекстного анализа речи. В статье разбирается микросервисная архитектура на React и Python (FastAPI), использование модели OpenAI Whisper для транскрибации в реальном времени и интеграция LLM GigaChat для интеллектуального ведения презентации. Также описываются проблемы нестабильности нейросетей в живых выступлениях и реализованные решения: режим байпаса и навигация по ключевым словам.

Как мы разрабатываем систему голосового управления презентациями на базе Whisper и GigaChat
10 017
Валерия Турчак для MCN Telecom

AI-агенты vs живые операторы: кто справился лучше (и дешевле)

Чем AI-агент отличается от обычного бота, посчитаем стоимость тикета (оператор vs AI), разберем два кейса с цифрами и дадим чеклист для техлидов по запуску и мониторингу.

AI-агенты vs живые операторы: кто справился лучше (и дешевле)
3622
Денис Кудерин для Tproger

Топ ИИ-инструментов для транскрибации митингов, видео и всех аудио форматов

Подборка сервисов для транскрибации аудио и видео в текст. Сравниваем точность, скорость работы, тарифы и фишки каждой платформы, чтобы упростить конспекты встреч, обработку интервью и работу с контентом.

Топ ИИ-инструментов для транскрибации митингов, видео и всех аудио форматов
10 597
СтудГид

Лучшие российские нейросети аналоги чата GPT, Chat-GPT на русском: ТОП-8 нейросетей, которые дают пользоваться западными нейросетями в России (GPT o4, Midjorney, Gemini, Dalle, Deepseek и др.)

В статье собраны 8 российских сервисов, которые предоставляют удобный доступ к популярным западным нейросетям — таким как ChatGPT (GPT-4), Midjourney, DALL·E, Gemini, Claude и другие. Обзор поможет разобраться, как воспользоваться этими инструментами из России без VPN и сложных настроек, какие функции доступны на каждой платформе и в каких сценариях они особенно полезны.

Лучшие российские нейросети аналоги чата GPT, Chat-GPT на русском: ТОП-8 нейросетей, которые дают пользоваться западными нейросетями в России (GPT o4, Midjorney, Gemini, Dalle, Deepseek и др.)
41 885