Novos Modelos de Geração de Imagens: Estabilidade AI Inova
Novos Modelos de Geração de Imagens da Startup de IA Stability AI
Após uma série de controvérsias relacionadas a problemas técnicos e mudanças de licenciamento, a startup de IA Stability AI anunciou sua mais recente família de modelos de geração de imagens. Os novos modelos da série Stable Diffusion 3.5 prometem ser mais personalizáveis e versáteis do que as tecnologias anteriores da Stability.
Customização e Versatilidade dos Modelos
A empresa afirma que os modelos Stable Diffusion 3.5 Large e 3.5 Large Turbo já estão disponíveis, enquanto o 3.5 Medium será lançado em 29 de outubro. A Stability destaca que os novos modelos devem gerar imagens mais diversas, representando pessoas com diferentes tons de pele e características, sem a necessidade de prompts extensivos.
Abordagem da Stability AI
O CTO da Stability AI, Hanno Basse, explicou que durante o treinamento, cada imagem é legendada com várias versões de prompts, priorizando prompts mais curtos para garantir uma distribuição mais ampla e diversificada de conceitos de imagem para uma descrição de texto dada.
Modelos Anteriores e Licenças
O modelo anterior da Stability, Stable Diffusion 3 Medium, foi criticado por seus artefatos peculiares e baixa aderência aos prompts. A empresa alerta que os novos modelos podem apresentar erros semelhantes devido a compensações de engenharia e arquitetura. Quanto às licenças, os modelos da série Stable Diffusion 3.5 são gratuitos para uso não comercial e podem ser comercializados sem custo por empresas com receita anual inferior a $1 milhão.
Uso dos Modelos e Controle de Dados
Os modelos Stable Diffusion 3.5 podem ser auto-hospedados ou utilizados via API da Stability e em plataformas de terceiros. A empresa planeja lançar os ControlNets para os modelos em breve. Quanto aos dados de treinamento, a Stability e outros fornecedores de IA argumentam que a doutrina de uso justo os protege de reivindicações de direitos autorais.
Referências
Fonte: TechCrunch