A empresa Stability AI está revolucionando a geração de imagens por Inteligência Artificial (IA) com o lançamento do Stable Diffusion XL 0.9 (SDXL 0.9). Trata-se do mais recente desenvolvimento na suíte de modelos de conversão de texto em imagem da Stable Diffusion. O SDXL 0.9, que sucede o bem-sucedido lançamento do Stable Diffusion XL beta em abril, apresenta uma melhoria significativa na qualidade da imagem e detalhamento da composição em comparação com seu antecessor.
O SDXL 0.9 destaca-se pela sua capacidade de gerar criações hiper-realistas para diversas aplicações como filmes, televisão, música e vídeos institucionais. Além disso, a tecnologia também traz avanços para o uso em design e indústria, colocando o SDXL na vanguarda das aplicações de imagens geradas por IA no mundo real.
O segredo por trás do avanço na composição do SDXL 0.9 está em seu aumento significativo na contagem de parâmetros. Para os menos familiarizados com o mundo da IA, os parâmetros são a soma de todos os pesos e vieses na rede neural em que o modelo é treinado. O SDXL 0.9 possui uma das maiores contagens de parâmetros de qualquer modelo de imagem de código aberto, ostentando um modelo base de 3,5 bilhões de parâmetros e um pipeline de modelo de conjunto de 6,6 bilhões de parâmetros.
Esse poderoso sistema é executado em dois modelos CLIP, incluindo um dos maiores modelos OpenCLIP treinados até o momento (OpenCLIP ViT-G/14). Isso aumenta o poder de processamento do 0.9 e sua capacidade de criar imagens realistas com maior profundidade e uma resolução mais alta de 1024×1024.
Apesar de seu potente desempenho e arquitetura de modelo avançada, o SDXL 0.9 é capaz de ser executado em uma GPU de consumo moderna. As únicas exigências são um sistema operacional Windows 10 ou 11 ou Linux, com 16GB de RAM, uma placa gráfica Nvidia GeForce RTX 20 (ou equivalente de padrão superior) equipada com no mínimo 8GB de VRAM. Os usuários de Linux também podem usar uma placa AMD compatível com 16GB de VRAM.
O SDXL 0.9 já está disponível na plataforma ClipDrop da Stability AI, e a API será disponibilizada em breve. Durante um período limitado, o SDXL 0.9 será fornecido apenas para fins de pesquisa, a fim de coletar feedback e refinar completamente o modelo antes de seu lançamento aberto geral. O código para executá-lo será publicamente disponível no Github.
É importante lembrar que o SDXL 0.9 é liberado sob uma licença não comercial, apenas para pesquisa, e está sujeito aos seus termos de uso. O lançamento completo e aberto do SDXL 1.0 está previsto para meados de julho, embora o cronograma ainda esteja a ser confirmado.
Na era da digitalização, ferramentas como o SDXL 0.9 têm o potencial de redefinir a maneira como concebemos e criamos imagens. Com sua capacidade de gerar imagens hiper-realistas a partir de texto, o SDXL 0.9 abre novas oportunidades para profissionais de diversas áreas, desde o cinema até a indústria.
Fonte: stability.ai
Perguntas Frequentes sobre Stable Diffusion XL 0.9
1. O que é o Stable Diffusion XL 0.9 (SDXL 0.9)?
O SDXL 0.9 é a mais recente adição à suíte de modelos de geração de imagens a partir de texto da Stability AI. Ele oferece detalhes de imagem e composição significativamente melhorados em relação ao seu antecessor.
2. Para que o SDXL 0.9 pode ser usado?
O SDXL 0.9 pode ser usado para gerar criações hiper-realistas para filmes, televisão, música e vídeos instrucionais. Ele também oferece avanços para design e uso industrial, tornando-se uma ferramenta valiosa em diversas aplicações reais de imagens geradas por IA.
3. O que torna o SDXL 0.9 avançado?
O SDXL 0.9 tem uma das maiores contagens de parâmetros de qualquer modelo de imagem de código aberto, com um modelo base de 3,5 bilhões de parâmetros e um pipeline de modelo de conjunto de 6,6 bilhões de parâmetros. Ele é executado em dois modelos CLIP, incluindo um dos maiores modelos OpenCLIP treinados até o momento, o que aumenta seu poder de processamento e a capacidade de criar imagens realistas com maior profundidade e resolução.
4. Quais são os requisitos de sistema para executar o SDXL 0.9?
O SDXL 0.9 pode ser executado em uma GPU de consumo moderna. Ele requer um sistema operacional Windows 10 ou 11 ou Linux, com 16GB de RAM, e uma placa gráfica Nvidia GeForce RTX 20 (ou equivalente de padrão superior) equipada com no mínimo 8GB de VRAM. Os usuários de Linux também podem usar uma placa AMD compatível com 16GB de VRAM.
5. Onde o SDXL 0.9 está disponível?
O SDXL 0.9 está disponível na plataforma ClipDrop da Stability AI. Durante um período limitado, ele será fornecido apenas para fins de pesquisa para coletar feedback e refinar o modelo. O código para executá-lo estará disponível publicamente no Github.
6. Quando o SDXL 1.0 será lançado?
O lançamento completo e aberto do SDXL 1.0 está previsto para meados de julho, embora o cronograma ainda esteja a ser confirmado.
7. O SDXL 0.9 pode ser usado para fins comerciais?
Não, o SDXL 0.9 é liberado sob uma licença não comercial, apenas para pesquisa, e está sujeito aos seus termos de uso.