Написать пост

Разработчик создал систему для общения жестами с голосовым помощником

Аватар Наташа Маркова

Алгоритм распознает жесты с помощью веб-камеры, преобразует их в голосовые команды, получает от помощника ответы и выводит на экран в виде текста.

Разработчик из США Абхишек Сингх (Abhishek Singh) создал программу, которая выступает посредником между глухонемым человеком и голосовым помощником Alexa. Система использует веб-камеру ноутбука, чтобы распознавать жесты, переводить их в голосовые команды для помощника, а полученные ответы выводить на экран в виде текста.

Принцип работы

Программа распознает жесты в реальном времени с помощью алгоритма глубинного обучения на фреймворке TensorFlow.js. Система синтеза речи озвучивает команды, колонка слышит их и дает голосовой ответ от компьютера, который алгоритм Сингха обрабатывает, затем преобразует в текст и выводит на экран.

Превью видео kS53y6GWm0w

Пока разработчик не раскрывает технические подробности проекта.

В мае 2018 года в браузере Google Chrome появилось расширение FacePause, которое отслеживает движение лица пользователей на основе FaceDetector.

Следите за новыми постами
Следите за новыми постами по любимым темам
505 открытий505 показов