Картинка поста

На ежегодной корпоративной встрече работников, проходящей в Сан-Франциско, Mozilla, компания-создатель браузера Firefox, рассказала о планах по разработке новой платформы Scout. Ее особенность заключается в том, что все взаимодействие будет основываться на управлении голосом, а не клавиатурой и мышью. В компании говорят,...
Читать дальше

Картинка поста

На прошедшей конференции для разработчиков WWDC 2018 Apple анонсировала обновление фреймворка для создания приложений в области здоровья и медицины ResearchKit. Новая версия платформы получила пользовательский интерфейс в стиле iOS 12 и ряд тестов для сбора различных...
Читать дальше

Картинка поста

Ученые из Университета Стэнфорда Эйбел Пирсон (Abel Peirson) и Мелтем Толунай (Meltem Tolunay) опубликовали доклад о новой модели машинного обучения, способной создавать мемы. Для обучения использовался набор из 400 000 картинок на различные тематики с сайта memegenerator.net....
Читать дальше

Картинка поста

Социальная сеть «ВКонтакте» представила возможность подключать к чат-ботам клавиатуры для упрощения навигации и ускорения коммуникации с подписчиками. Теперь пользователь может выбрать один из предустановленных вариантов взаимодействия и задать интересующий вопрос — а бот вернется с ответом. Как подключить...
Читать дальше

Картинка поста

Томас Миддлдитч, исполнитель роли Ричарда Хендрикса в сериале «Кремниевая долина», объединился с режиссером Оскаром Шарпом и исследователем данных Россом Гудвином для создания фильма Zone Out. Этот фильм срежиссировала и поставила нейронная сеть по имени Benjamin....
Читать дальше

Картинка поста

Группа ученых из Массачусетского технологического института (MIT) создала распознающую нейросеть, которая генерирует текстовое описание к изображению. Только натренировали они ее на картинках с подписями из сообщества Reddit, посвященного разговорам о смерти. Так специалисты хотели продемонстрировать важность данных,...
Читать дальше

Картинка поста

В своем блоге команда Google AI рассказала о новом алгоритме AutoAugment, который дополняет данные для обучения моделей компьютерного зрения изображениями, созданными на основе существующих. Система трансформирует картинки путем отражения, обрезания или изменения цвета. Это...
Читать дальше

Картинка поста

Исследователи из Университета Торонто Авишек Бозе (Avishek Bose) и Пархам Аараби (Parham Aarabi) создали систему, корректирующую пиксели на портретном фото таким образом, чтобы алгоритмы распознавания лиц давали сбой. Идея создания По словам Бозе, с помощью...
Читать дальше

Картинка поста

Платформа NVIDIA Isaac, представленная на выставке Computex 2018, совмещает в себе аппаратное и программное обеспечение, а также виртуальную симуляцию для тестирования роботов. В компании надеются, что посредством Isaac разработчики смогут создавать роботов для различных задач...
Читать дальше

Картинка поста

Подразделение Uber Engineering в своем блоге рассказало о kepler.gl — наборе инструментов для широкомасштабной визуализации геоданных в виде интерактивных карт. По мнению разработчиков, исследователям и энтузиастам станет проще изучать большие объемы данных благодаря технологиям визуализации с открытым...
Читать дальше

Картинка поста

Американские разработчики представили алгоритм PrimNet, работающий на основе сверточной нейросети и распознающий особи 14 видов приматов. По словам исследователей, система поможет в спасении вымирающих видов животных. Как PrimNet работает? Для обучения алгоритма ученые собрали наборы...
Читать дальше

Картинка поста

Крис Лотт, специалист по искусственному интеллекту в Qualcomm, в общих чертах обрисовал программу распознавания голоса, над которой работает его команда. Это локальная система, не требующая облачных вычислений, а значит — подключения к Интернету. По словам Лотта, она правильно...
Читать дальше

Картинка поста

Международная группа исследователей из университетов Германии, США, Франции и Великобритании разработала нейронную сеть, реалистично переносящую выражение лица одного человека на другого между двумя видеозаписями. Разработчики планируют представить алгоритм, получивший название Deep Video, на конференции...
Читать дальше

Картинка поста

Руководство средней школы города Ханчжоу установило систему, которая определяет состояние человека по выражению лица. Таким образом оно решило проследить, насколько школьники сконцентрированы во время уроков. Как это работает? Установленные над учебной доской...
Читать дальше

Картинка поста

Лаборатория Исследований Carlsberg в Дании и Microsoft запустили совместный проект, направленный на создание сенсорной платформы для анализа оттенков вкуса и ароматов пива. Разработка поможет существенно уменьшить время, необходимое для создания новых сортов. Сейчас в лаборатории...
Читать дальше


Картинка поста

Аналог Alexa для врачей, который разрабатывается экс-менеджером Google и Motorola Пунитом Сони (Punit Soni), призван избавить врачей от бумажной работы и снизить риск их профессионального выгорания — его процент среди докторов в США вдвое выше, чем...
Читать дальше

Картинка поста

Исследователи из Вашингтонского университета нашли еще один способ обмануть системы распознавания объектов. Изменение параметров оттенков и насыщенности приводит к снижению точности предсказания на 90 %. Птицепес и грузовик-лягушка Важно, что изображение никоим образом не теряет в качестве, не становится...
Читать дальше

Картинка поста

DIY-наборы аппаратного обеспечения для работы с технологиями машинного обучения AIY Projects от Google получили «железное» обновление. Об этом компания написала в своем блоге. Сервис AIY Projects, запущенный весной 2017 года, ставит своей целью сделать технологии...
Читать дальше

Картинка поста

В рамках конференций NAB и SpeechTek разработчики из Google анонсировали крупное обновление вышедшего в 2016 году Cloud Speech API. Инструмент получил новое название — Cloud Speech-to-Text — и дополнительные встроенные функции. Что умеет Cloud Speech-to-Text? Создатели снабдили...
Читать дальше

Картинка поста

Сообщество iNaturalist разработало Seek — приложение для любителей природы. Программа, похожая на Shazam, по фотографиям определяет виды животных и растений, а также предоставляет пользователям информацию из Википедии. Возможности По задумке разработчиков, приложение призвано побуждать людей к изучению природы....
Читать дальше

Картинка поста

Microsoft рассказала, что инженеры компании разработали новый способ анализа человеческой речи одновременно с разговором специально для чат-ботов. Благодаря новой технологии боты могут предсказывать, что человек скажет дальше, когда нужно сделать паузу...
Читать дальше

Картинка поста

Команда разработчиков Google Brand Studio запустила браузерный эксперимент под названием Emoji Scavenger Hunt. Игра предлагает пользователям найти олицетворения разных emoji-символов в реальном мире и отсканировать их камерой смартфона. На поиск предметов дается ограниченное время,...
Читать дальше

Картинка поста

Международная группа ученых из Саратова вместе с коллегами из Центра биомедицинских технологий Технического университета Мадрида опубликовала доклад о создании нейронной сети, способной распознавать, когда человек сомневается в выборе. Как проходило обучение? Исследователи провели нейропсихологический...
Читать дальше

Картинка поста

Компания TypingDNA выпустила расширение для браузера Google Chrome, которое подтверждает личность пользователя на основе того, как он печатает. Сооснователь компании Рауль Попа (Raul Popa) считает, что традиционные методы двухфакторной аутентификации неудобны и сложны,...
Читать дальше

Картинка поста

Стандарты SSIM360 и 360VQM Facebook опубликовала в своем блоге 9 марта. SSIM360 служит для оценки качества отдельных компонентов кодировки и воспроизведения, в то время как 360VQM оценивает качество видео в целом. Исследователь Facebook в области VR Шэннон Чен (Shannon...
Читать дальше

Картинка поста

На симпозиуме NDSS в Сан-Диего ученые представили новую систему распознавания лиц, основанную на уникальности, с которой свет отражается от лица каждого человека, и на скорости передачи данных об отраженном свете. Система называется Face Flashing, и, помимо камеры, работает...
Читать дальше

Картинка поста

Стартап AISense запустил бесплатный сервис Otter для конвертирования голосовых сообщений в текст. Он предназначен для расшифровки интервью, лекций и личных заметок. Возможности и ошибки На основе приложения лежит технология Ambient Voice Intelligence. Она распознает устную...
Читать дальше

Картинка поста

Инженер из Нидерландов собрал устройство для распознавания своего кота. Изобретатель установил систему на балконе, чтобы получать уведомление, когда животное хочет войти в дом. Просто и доступно Девайс собран на основе мини-компьютера Raspberry Pi и оснащён камерой, ПО для...
Читать дальше

Картинка поста

В социальной сети «ВКонтакте» появились моментальные отметки на фото. Сервис автоматически распознаёт лица и предлагает пользователям отметить найденного на снимке друга. Отмечать пользователей на изображениях можно и без дополнительного подтверждения. Пока что алгоритм доступен только в веб-версии...
Читать дальше


Картинка поста

Немецкие разработчики научили робота PAL Robotics TIAGo приносить из холодильника пиво конкретной марки. Работу визуального модуля выполняет суперкомпьютер Jetson TX2. Проект участвует в конкурсе NVIDIA Jetson Developer Challenge. Код проекта разработчики опубликовали...
Читать дальше

Картинка поста

Компания Amazon представила новый WordPress-плагин Polly, конвертирующий тексты в аудиофайлы и подкасты. Аудиозаписи можно воспроизводить как с самой страницы с постом, так и через сервис работы с подкастами Pollycast. Особенности Плагин разработан командой Amazon AWS на основе...
Читать дальше

Картинка поста

Два программиста из Америки (Ор Флейшер и Дрор Эйлон) представили проект под названием Skeletron. Skeletron работает на основе TensorFlow, открытой библиотеки для машинного обучения, а также игрового движка Unity. Для отслеживания движений человека обычно требуются...
Читать дальше

Картинка поста

Разработчики Microsoft Research Asia представили технологию машинного чтения, которая показывает наиболее высокие результаты по тесту на наборе SQuAD (Stanford Question Answering Dataset). Этот набор состоит из пар вопрос-ответ, основанных на статьях из Википедии. Средний результат...
Читать дальше

Картинка поста

Команда исследователей из Facebook AI Research (FAIR) опубликовала на GitHub исходный код собственной системы распознавания речи, wav2letter. Он состоит из модулей к библиотеке глубинного машинного обучения Torch, написанных на языке...
Читать дальше

Картинка поста

Cloud Video Intelligence API от компании Google вышел из беты. В дополнение к существующим функциям регистрации смены кадров и поиска объектов в пределах видеоряда, добавилась возможность транскрибирования содержимого загруженного видео....
Читать дальше

Картинка поста

На прошедшей конференции AWS re:Invent компания Amazon сообщила о запуске Amazon Rekognition Video. Новый сервис работает как для загруженных видеофайлов, так и для потокового видео. Возможности сервиса В Amazon Rekognition уже существуют инструменты анализа...
Читать дальше

Материалы, посвященные разработкам в области программного распознавания образов.