Stability AI запустила модель Stable Audio для генерации музыки по текстовому описанию — SAMESOUND
По словам разработчиков, диффузионная модель Stable Audio обучалась на наборе из текстовых метаданных и коллекции из 800 000 аудиофайлов. Среди данных присутствовали как коммерческие записи и звуковые эффекты, так и отдельные партии инструментов. Отмечается, что общее количество аудиоматериалов превышает 19,5 тысяч часов. Stability AI заявляют , что Stable Audio отличается полной юридической прозрачностью. Так, например, данные для обучения были предоставлены компанией AudioSparx, владеющей внушительным каталогом музыки для коммерческого использования. Таким образом разработчики получили официальное право на использование защищённого копирайтом контента. Использование нейросети доступно как в платном, так и бесплатном формате. В рамках бесплатного тарифа платформа генерирует до 20 аудиофрагментов в месяц, при этом длительность каждого отрезка…
Читать далее