Estabilidade de startup de IA Ai tem lançado O estável Audio Open Small, um modelo de IA gerador de áudio “estéreo” que a empresa afirma ser a mais rápida do mercado-e eficiente o suficiente para ser executado em smartphones.
O Audio Aberto estável é o fruto de uma colaboração entre a AI e o braço de estabilidade, o fabricante de chips que produz muitos dos processadores dentro de tablets, telefones e outros dispositivos móveis. Embora vários aplicativos movidos a IA possam gerar áudio, como SUNO e Udio, a maioria depende do processamento em nuvem, o que significa que eles não podem ser usados offline.
A estabilidade também afirma que o conjunto de treinamento do estável Audio Open Small é composto inteiramente de músicas do arquivo de música livre de bibliotecas de áudio sem royalties e um soldado. Isso se opõe aos conjuntos de treinamento dos mencionados SUNO e UDIO, que supostamente contêm conteúdo protegido por direitos autorais, representando um risco de IP.
O AUDIO ESTABLE OPEN SPITY tem 341 milhões de parâmetros em tamanho e otimizado para ser executado nas CPUs do ARM. (Parâmetros, às vezes chamados de pesos, são os componentes internos de um modelo que orienta seu comportamento.) Projetado para gerar rapidamente amostras de áudio curtas e efeitos sonoros (por exemplo, tambor e riffs de instrumentos), o áudio estável aberto pequeno pode produzir até 11 segundos de áudio em um smartphone em menos de 8 segundos, a estabilidade de reivindicações.
Aqui está uma amostra gerada por áudio estável aberto pequeno:
E aqui está outro:
O modelo não está sem suas limitações. Estável áudio aberto pequeno apenas suporta solicitações escritas em inglês e notas de estabilidade em seu documentação que o modelo não pode gerar vocais realistas ou músicas de alta qualidade. O modelo também não tem um desempenho igualmente bom nos estilos musicais, alerta a estabilidade-uma conseqüência de seus dados de treinamento com tendência ocidental.
Em outra ruga em potencial para desenvolvedores, o Audio estável Open Small possui termos de uso um tanto restritivos. É gratuito para pesquisadores, entusiastas e empresas com menos de US $ 1 milhão em receita anual, mas desenvolvedores e organizações que ganham mais de US $ 1 milhão em receita precisam pagar pela estabilidade Licença corporativa.
A estabilidade, a empresa sitiada por trás do popular modelo de geração de imagens, difusão estável, arrecadou novo dinheiro no ano passado, como investidores, incluindo Eric Schmidt e o fundador do Napster, Sean Parker, procuraram mudar os negócios. Emad Mostaque, co-fundador e ex-CEO da Stability, supostamente estabilidade mal administrada em ruína financeira, levando a equipe a renunciar, uma parceria com o Canva a cair e os investidores a se preocuparem com as perspectivas da empresa.
Nos últimos meses, a estabilidade contratou um novo CEO, nomeou o diretor Titanic James Cameron para seu conselho de administração e lançou vários novos modelos de geração de imagens.