Stability AI представляє модель Audio 3.0 для створення пісень на пристрої

Stability AI запускає інноваційну модель генерації аудіо, здатну створювати розширені музичні треки. Дізнайтеся про нові можливості та функції пристрою.
Стабільний штучний інтелект оголосив про випуск революційної моделі генерації аудіо, розробленої для революції в тому, як творці створюють музичний вміст. Новий Stability Audio 3.0 є значним прогресом у створенні музики на основі штучного інтелекту, пропонуючи безпрецедентні можливості для музикантів, продюсерів і творців контенту в усьому світі. Ця остання ітерація аудіотехнології компанії демонструє швидку еволюцію генеративного штучного інтелекту в творчих галузях.
Основною особливістю цього випуску є можливість створювати розширені музичні композиції тривалістю кілька хвилин. Модель генерації аудіо може створювати доріжки тривалістю до шести хвилин, що значно довше, ніж попередні ітерації. Ця можливість збільшеної тривалості усуває серйозне обмеження, яке заважало попереднім версіям інструментів генерації музики зі штучним інтелектом, дозволяючи творцям створювати повніші музичні твори, не вимагаючи зшивання кількох сегментів.
Одним із найважливіших технічних досягнень Stability Audio 3.0 є його здатність запускатися безпосередньо на пристроях користувачів через варіант малої моделі. Ця можливість обробки на пристрої усуває потребу в постійному з’єднанні з хмарою, забезпечуючи користувачам більшу конфіденційність, швидший час обробки та меншу затримку. Двохвилинне створення доріжок на локальному апаратному забезпеченні відкриває нові можливості для творців, яким потрібен негайний відгук і повторення під час творчого процесу.
Наслідки цієї технології виходять далеко за межі простого створення музики. Дозволяючи моделям генеративного штучного інтелекту працювати локально на споживчому обладнанні, Stability AI демократизував доступ до складних інструментів створення аудіо. Раніше такі можливості вимагали значних обчислювальних ресурсів і хмарної інфраструктури, що робило їх недоступними для незалежних авторів і невеликих виробничих груп з обмеженими бюджетами.
Цей випуск вийшов у той час, коли індустрії музики та розваг борються з наслідками контенту, створеного штучним інтелектом. Можливості генерування музики, які пропонує Stability Audio 3.0, піднімають важливі питання щодо художньої автентичності, авторського права та майбутньої ролі людей-музикантів у створенні вмісту. Галузеві експерти очікують, що ці інструменти ставатимуть все більш поширеними в робочих процесах професійного виробництва, особливо для фонової музики, саундтреків ігор і мультимедійних проектів.
Здатність маленької моделі працювати на пристрої є технічним проривом у оптимізації та ефективності моделі. Замість того, щоб вимагати величезної обчислювальної потужності, інженери Stability AI успішно стиснули складні нейронні мережі у форм-фактор, який може працювати на стандартних споживчих комп’ютерах і мобільних пристроях. Це досягнення підкреслює постійні тенденції мініатюризації та оптимізації в розробці моделі AI.
Для творців контенту та музичних продюсерів практичне застосування стає очевидним одразу. Можливість генерувати двохвилинні треки на персональному обладнанні дозволяє швидко створювати прототипи та експериментувати. Тепер музиканти можуть тестувати музичні ідеї, генерувати фоновий акомпанемент і досліджувати нові звукові території, не залежачи від дорогого студійного часу чи хмарних служб, використання яких може мати обмеження чи витрати, пов’язані з генеруванням великої гучності.
Підхід Stability AI до створення аудіо базується на попередніх успіхах компанії в інших сферах творчості. Організація зарекомендувала себе як лідер у моделях штучного інтелекту з відкритим кодом, і цей аудіовипуск продовжує цю традицію робити передові технології доступнішими для широкої аудиторії. Зобов’язання надавати параметри як у хмарі, так і на пристрої демонструє детальне розуміння потреб користувачів у різних варіантах використання та технічних можливостях.
Технічна архітектура, що лежить в основі Stability Audio 3.0, включає в себе досягнення в розробці нейронних мереж і методології навчання. Модель оптимізовано для розуміння музичної структури, підтримки часової когерентності в розширених послідовностях і створення високоякісного аудіо, яке зберігає постійність стилю та інструментів протягом усієї тривалості треку. Ці технічні вдосконалення свідчать про значний прогрес порівняно з попередніми системами, яким було важко підтримувати узгодженість музики за межами коротких сегментів.
Шість хвилин повної моделі порівняно з двохвилинним варіантом на пристрої ілюструє постійні компроміси між обчислювальною ефективністю та якістю або довжиною виведених даних. Хмарна версія з розширеним терміном дії призначена для користувачів, які мають доступ до потужнішої інфраструктури та готові використовувати хмарні ресурси для більш амбітних проектів. Цей багаторівневий підхід гарантує, що технологія обслуговує різноманітні групи користувачів із різними технічними можливостями та вимогами.
Інтеграція Stability Audio 3.0 в існуючі творчі робочі процеси є важливою мірою для професійних користувачів. Модель має бездоганно взаємодіяти з цифровими аудіостанціями, програмним забезпеченням для виробництва музики та іншими творчими інструментами, на які сучасні продюсери покладаються щодня. ШІ стабільності враховує ці вимоги до інтеграції, гарантуючи, що згенероване аудіо можна легко експортувати та маніпулювати ним у стандартних середовищах виробництва.
Випуск цієї технології також піднімає важливі питання щодо майбутнього навчання та компенсації для музикантів-людей. Оскільки моделі ШІ стають все більш досконалими для створення переконливого музичного контенту, музичній індустрії потрібно буде розробити нові рамки для розуміння того, як ці інструменти мають регулюватися, ліцензуватися та компенсуватися. Ці обговорення вже ведуться між галузевими організаціями, власниками авторських прав і технологічними компаніями.
Заглядаючи вперед, Stability Audio 3.0 представляє важливу точку в еволюції творчості за допомогою ШІ. Компанія продовжує інвестувати в дослідження та розробки, щоб розширити можливості своїх аудіомоделей, і майбутні ітерації, ймовірно, включатимуть додаткові функції, такі як більш детальне керування стилем, краще оброблення складних музичних аранжувань і покращена можливість включати визначені користувачем музичні елементи та налаштування.
Доступність передової технології генерування аудіо як через хмару, так і через локальне розгортання робить Stability AI значним гравцем у середовищі творчих інструментів AI, що швидко розвивається. У міру того, як ці технології розвиваються та стають більш інтегрованими в професійні творчі робочі процеси, вони докорінно змінять спосіб створення, розповсюдження та споживання музики в усьому світі. Випуск Stability Audio 3.0 знаменує важливу віху в поточній трансформації креативних індустрій за допомогою штучного інтелекту.
Джерело: TechCrunch


