В MIT создали нейросеть, распознающую объекты по голосовому описанию
Ученые соединили алгоритмы распознавания изображений и речи для создания нейросети, которая сопоставляет картинку и голос.
Материалы для программистов на тему «»
Ученые соединили алгоритмы распознавания изображений и речи для создания нейросети, которая сопоставляет картинку и голос.
Алгоритм анализирует изображения и отмечает на них интересующие объекты. При тестировании точность TbD-net составила 99,1 %.
Информация кодируется в вибрации разной частоты, которые генерирует гидролокатор. Ученые также создали алгоритм, который распознает их среди природных волн.
Он объединяет две техники: гомоморфного шифрования и искаженных схем — и позволяет обеспечить не только скорость вычислений, но и приватность данных.
Нейросеть помогла сократить частоту приёма препаратов до нескольких раз в год, вместо ежемесячного, а также уменьшить дозировку вдвое.
Специалисты MIT пришли к выводу, что глубинное обучение может быть эффективно для проведения терапии аутизма с использованием роботов.
По словам инженеров MIT, устройство можно интегрировать в дроны размером с ноготь или приборы, которым нужно работать несколько месяцев на одной батарейке.
Метод основан на том, что в любой из моментов времени данные может передавать только один источник. Технологию планируют применять в работе дронов.