На GitHub опубликована ML-модель для расщепления песни на дорожки с вокалом и отдельными инструментами

ИИ научился различать в песнях вокал и мелодию. Инструмент называется Spleeter, это внутренняя технология стримингового сервиса Deezer.

Spleeter умеет делить трек на несколько составляющих. Максимум их может быть пять: бас, ударные, пианино, вокал и весь остальной фон. Пользователь загружает аудио, а на выходе получает несколько файлов.

Spleeter работает на TensorFlow. По словам разработчиков, модель обучали на десятках тысяч песен. Пока она работает с перебоями, оставляет на дорожках артефакты.

Библиотека на основе нейросетей лежит на GitHub, она распространяется под лицензией MIT. Правда, чтобы пользоваться Spleeter, нужно минимально шарить в Python и TensorFlow. К тому же взаимодействие происходит через командную строку, интерфейса пока толком нет. Зато какие-то умельцы быстренько сделали веб-версию этой нейронки.

Source: блог Deezer на Medium

Не смешно? А здесь смешно: @ithumor