Início Tecnologia Cohere lança uma família de modelos multilíngues abertos

Cohere lança uma família de modelos multilíngues abertos

10
0

A empresa de IA empresarial Cohere lançou uma nova família de modelos multilíngues à margem do India AI Summit em andamento. Os modelos, apelidados de Tiny Aya, são abertos – o que significa que seu código subjacente está disponível publicamente para qualquer pessoa usar e modificar – suportam mais de 70 idiomas e podem ser executados em dispositivos comuns, como laptops, sem exigir conexão com a Web.

O modelo, lançado pelo braço de pesquisa da empresa, Cohere Labs, oferece suporte a idiomas do sul da Ásia, como bengali, hindi, punjabi, urdu, guzerate, tâmil, telugu e marata.

O modelo básico contém 3,35 bilhões de parâmetros — uma medida de seu tamanho e complexidade. Cohere também lançou o TinyAya-World, uma versão ajustada para seguir melhor os comandos do usuário, para aplicativos que exigem amplo suporte a idiomas. Variantes regionais completam a família: TinyAya-Earth para línguas africanas; TinyAya-Hearth para idiomas do sul da Ásia; e TinyAya-Water para Ásia-Pacífico, Ásia Ocidental e Europa.

Créditos da imagem: Cohere

“Esta abordagem permite que cada modelo desenvolva uma base linguística e nuances culturais mais fortes, criando sistemas que parecem mais naturais e confiáveis ​​para as comunidades que devem servir. Ao mesmo tempo, todos os modelos Tiny Aya mantêm uma ampla cobertura multilíngue, tornando-os pontos de partida flexíveis para futuras adaptações e pesquisas”, disse a empresa em um comunicado.

Cohere observou que esses modelos, que foram treinados em um único cluster de 64 GPUs H100 (um tipo de chip de alta potência da Nvidia) usando fontes de computação relativamente modestas, são ideais para pesquisadores e desenvolvedores que criam aplicativos para públicos que falam idiomas nativos. Os modelos são capazes de rodar diretamente em dispositivos, para que os desenvolvedores possam usá-los para potencializar a tradução offline. A empresa observou que construiu seu software program subjacente para se adequar ao uso no dispositivo, exigindo menos poder de computação do que a maioria dos modelos comparáveis.

Créditos da imagem: Cohere

Em países com diversidade linguística como a Índia, este tipo de capacidade offline pode abrir um conjunto diversificado de aplicações e casos de utilização sem a necessidade de acesso constante à Web.

Os modelos estão disponíveis no HuggingFace, a plataforma standard para compartilhar e testar modelos de IA, e na Plataforma Cohere. Os desenvolvedores podem baixá-los no HuggingFace, Kaggle e Ollama para implantação native. A empresa também está lançando conjuntos de dados de treinamento e avaliação no HuggingFace e planeja lançar um relatório técnico detalhando sua metodologia de treinamento.

Evento Techcrunch

Boston, MA
|
23 de junho de 2026

O CEO da startup, Aidan Gomez, disse no ano passado que a empresa planeja abrir o capital “em breve”. De acordo com CNBCa empresa encerrou 2025 em alta, registrando US$ 240 milhões em receita recorrente anual, com crescimento de 50% em relação ao trimestre anterior ao longo do ano.

avots

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui