Início Tecnologia Black Forest Labs lança Flux.2 de código aberto para gerar imagens...

Black Forest Labs lança Flux.2 de código aberto [klein] para gerar imagens de IA em menos de um segundo

19
0

A startup alemã de IA Black Forest Labs (BFL), fundada por ex-engenheiros de Stability AI, continua a desenvolver seu conjunto de geradores de imagens de IA de código aberto com o lançamento do FLUXO.2 [klein]um novo par de modelos pequenos – um aberto e outro não comercial – que enfatiza velocidade e menores requisitos de computação, com os modelos gerando imagens em menos de um segundo em uma Nvidia GB200.

O [klein] A série, lançada ontem, inclui duas contagens de parâmetros primários: 4 bilhões (4B) e 9 bilhões (9B).

Os pesos dos modelos estão disponíveis em Abraçando o rosto e código em GitHub.

Enquanto os modelos maiores da família FLUX.2 ([max] e [pro]), lançado em novembro de 2025, persegue os limites do fotorrealismo e dos recursos de “busca de aterramento”, [klein] foi projetado especificamente para {hardware} de consumo e fluxos de trabalho críticos para latência.

Uma ótima notícia para as empresas, a versão 4B está disponível sob uma licença Apache 2.0, o que significa que elas — ou qualquer organização ou desenvolvedor — podem usar o [klein] modelos para seus fins comerciais sem pagar um centavo à BFL ou a quaisquer intermediários.

No entanto, uma série de plataformas de criação de imagens e mídia de IA, incluindo Fal.ai começaram a oferecê-lo por um custo extremamente baixo também por meio de suas interfaces de programação de aplicativos (APIs) e como uma ferramenta direta ao usuário. Já recebeu fortes elogios dos primeiros usuários por sua velocidade. O que falta em qualidade geral de imagem parece compensar em sua capacidade de geração rápida, licença aberta, preço acessível e tamanho reduzido – beneficiando empresas que desejam executar modelos de imagem em seu próprio {hardware} ou a um custo extremamente baixo.

Então, como a BFL fez isso e como isso pode beneficiar você? Proceed lendo para saber mais.

A “Fronteira de Pareto” da Latência

A filosofia técnica por trás [klein] é o que a documentação da BFL descreve como definindo a “fronteira de Pareto” para qualidade versus latência. Em termos simples, eles tentaram espremer a máxima fidelidade visible possível em um modelo pequeno o suficiente para rodar em um PC doméstico para jogos sem atraso perceptível.

As métricas de desempenho divulgadas pela empresa mostram um modelo construído para interatividade, em vez de apenas geração em lote.

De acordo com dados oficiais do Black Forest Labs, o [klein] os modelos são capazes de gerar ou editar imagens em menos de 0,5 segundos em {hardware} moderno.

Mesmo em GPUs de consumo padrão, como RTX 3090 ou 4070, o modelo 4B foi projetado para caber confortavelmente em aproximadamente 13 GB de VRAM.

Essa velocidade é alcançada por meio da “destilação”, um processo em que um modelo maior e mais complexo “ensina” um modelo menor e mais eficiente a aproximar seus resultados em menos etapas. O destilado [klein] variantes requerem apenas quatro etapas para gerar uma imagem. Isso efetivamente transforma o processo de geração de uma tarefa de intervalo para o café em uma tarefa quase instantânea, permitindo o que a BFL descreve no X (antigo Twitter) como “desenvolver ideias de 0 → 1” em tempo actual.

Nos bastidores: arquitetura unificada

Historicamente, a geração e edição de imagens frequentemente exigiam diferentes pipelines ou adaptadores complexos (como ControlNets). FLUXO.2 [klein] tenta unificá-los.

A arquitetura suporta nativamente texto para imagem, edição de referência única e composição de múltiplas referências sem a necessidade de trocar modelos.

De acordo com a documentação divulgada no GitHub, os modelos suportam:

  • Edição de múltiplas referências: Os usuários podem fazer add de até quatro imagens de referência (ou dez no playground) para orientar o estilo ou estrutura da saída.

  • Controle de cores com código hexadecimal: Um problema frequente para os designers é obter “aquele tom exato de vermelho”. Os novos modelos aceitam códigos hexadecimais específicos em prompts (por exemplo, #800020) para forçar uma renderização de cores precisa.

  • Solicitação estruturada: O modelo analisa entradas estruturadas semelhantes a JSON para composições rigorosamente definidas, um recurso claramente voltado para geração programática e pipelines empresariais.

A divisão de licenciamento: pesos abertos versus código aberto

Para startups e desenvolvedores que desenvolvem a tecnologia da BFL, é basic compreender o cenário de licenciamento desta versão. A BFL adotou uma estratégia de divisão que separa o uso de “hobbyist/pesquisa” da “infraestrutura comercial”.

  1. FLUXO.2 [klein] 4B: Lançado no Apache 2.0. Esta é uma licença permissiva de software program livre que permite uso comercial, modificação e redistribuição. Se você estiver criando um aplicativo pago, uma plataforma SaaS ou um jogo que integre a geração de IA, poderá usar o modelo 4B sem royalties.

  2. FLUXO.2 [klein] 9B e [dev]: Lançado sob a licença não comercial FLUX. Esses pesos estão abertos para obtain e experimentação por pesquisadores e amadores, mas não podem ser usados ​​para aplicações comerciais sem um acordo separado.

Esta distinção posiciona o modelo 4B como um concorrente direto de outros modelos de peso aberto, como Secure Diffusion 3 Medium ou SDXL, mas com uma arquitetura mais moderna e uma licença permissiva que elimina a ambiguidade authorized para startups.

Integração de ecossistema: ComfyUI e muito mais

A BFL está claramente ciente de que um modelo é tão bom quanto as ferramentas que o executam. Coincidindo com a queda do modelo, a equipe lançou modelos oficiais de fluxo de trabalho para UI confortávela interface baseada em nós que se tornou o ambiente de desenvolvimento integrado (IDE) padrão para artistas de IA.

Os fluxos de trabalho – especificamente image_flux2_klein_text_to_image.json e as variantes de edição – permitem que os usuários arrastem e soltem imediatamente os novos recursos nos pipelines existentes.

A reação da comunidade nas redes sociais centrou-se nesta integração do fluxo de trabalho e na velocidade. Em uma postagem no X, a conta oficial do Black Forest Labs destacou a capacidade do modelo de “explorar rapidamente uma estética específica”, apresentando um vídeo onde o estilo de uma imagem muda instantaneamente conforme o usuário passa pelas opções.

Por que é importante para os tomadores de decisão de IA empresarial

O lançamento do FLUX.2 [klein] sinaliza um amadurecimento no mercado de IA generativa, passando da fase inicial de novidade para um período definido pela utilidade, integração e velocidade.

Para os principais engenheiros de IA que estão constantemente lidando com a necessidade de equilibrar velocidade e qualidade, essa mudança é basic. Esses profissionais, que gerenciam todo o ciclo de vida dos modelos, desde a preparação dos dados até a implantação, muitas vezes enfrentam o desafio diário de integrar ferramentas em rápida evolução nos fluxos de trabalho existentes.

A disponibilidade de um modelo 4B destilado sob uma licença Apache 2.0 oferece uma solução prática para aqueles focados na implantação rápida e no ajuste fino para atingir objetivos de negócios específicos, permitindo-lhes contornar os gargalos de latência que normalmente afetam a geração de imagens de alta fidelidade.

Para engenheiros seniores de IA focados em orquestração e automação, as implicações são igualmente significativas. Esses especialistas são responsáveis ​​por construir pipelines de IA escalonáveis ​​e manter a integridade do modelo em diferentes ambientes, muitas vezes trabalhando sob rigorosas restrições orçamentárias.

A natureza leve do [klein] família aborda diretamente o desafio de implementar sistemas eficientes com recursos limitados. Ao utilizar um modelo que se adapta à VRAM de nível consumidor, os especialistas em orquestração podem arquitetar pipelines de inferência locais econômicos que evitam os pesados ​​custos operacionais associados a modelos proprietários massivos.

Mesmo para o Diretor de Segurança de TI, a mudança em direção a modelos abertos capazes e executáveis ​​localmente oferece uma vantagem distinta. Com a tarefa de proteger a organização contra ameaças cibernéticas e gerenciar operações de segurança com recursos limitados, a dependência de APIs externas para fluxos de trabalho criativos confidenciais pode ser uma vulnerabilidade.

Um modelo de alta qualidade executado localmente permite que os líderes de segurança sancionem ferramentas de IA que mantêm dados proprietários dentro do firewall corporativo, equilibrando as demandas operacionais do negócio com as medidas de segurança robustas que são obrigadas a manter.

avots