
Фото: ЛЕНЦ Мария | Архив КП.
Специалисты Новосибирского государственного технического университета разработали программное обеспечение для генерации аудиоконтента с помощью нейросетей. Система способна создавать музыку, вокал и звуковые эффекты по текстовому описанию.
Как сообщил ТАСС руководитель проекта Егор Антонянц, программа работает автономно и не требует подключения к зарубежным платформам. Она запускается на обычных компьютерах с объемом видеопамяти менее 6 ГБ и поддерживает популярные форматы — WAV, MP3 и FLAC.
Разработчики дообучили модель для трех типов контента: инструментальной музыки, песен с вокалом и звуковых эффектов. Это позволяет точнее соответствовать запросу пользователя и избегать смешения характеристик.
Система адаптирована для русскоязычных пользователей и показывает высокое качество генерации. Средняя оценка результата составила 4,1 балла из 5, что сопоставимо с коммерческими сервисами.
По словам разработчика Артура Хусаинова, процесс создания аудио проходит в несколько этапов: сначала формируется структура композиции, затем выполняется синтез звука, после чего файл экспортируется в нужный формат. В программе есть удобный интерфейс для управления проектами и предпрослушивания треков.
К ЧИТАТЕЛЯМ
Если вы стали очевидцем ЧП или чего-то необычного, сообщите об этом в редакцию
Редакция: (383) 289-91-00
Мессенджеры: 8-923-145-11-03
Почта kp.nsk@phkp.ru