Início Tecnologia O novo modelo de tradução ultrarrápido da Mistral dá aos grandes laboratórios...

O novo modelo de tradução ultrarrápido da Mistral dá aos grandes laboratórios de IA uma corrida pelo seu dinheiro

5
0

Mistral AI tem lançou uma nova família de modelos de IA que afirma abrirá o caminho para uma conversa contínua entre pessoas que falam idiomas diferentes.

Na quarta-feira, o laboratório de IA com sede em Paris lançou dois novos modelos de fala para texto: Voxtral Mini Transcribe V2 e Voxtral Realtime. O primeiro foi desenvolvido para transcrever arquivos de áudio em grandes lotes e o último para transcrição quase em tempo actual, em 200 milissegundos; ambos podem traduzir entre 13 idiomas. Voxtral Realtime está disponível gratuitamente sob uma licença de código aberto.

Com quatro bilhões de parâmetros, os modelos são pequenos o suficiente para serem executados localmente em um telefone ou laptop computer – uma inovação no campo da conversão de fala em texto, afirma Mistral – o que significa que as conversas privadas não precisam ser enviadas para a nuvem. De acordo com Mistral, os novos modelos são mais baratos de operar e menos sujeitos a erros do que as alternativas concorrentes.

Mistral apresentou o Voxtral Realtime – embora o modelo produza texto, não fala – como um passo marcante em direção a uma conversa fluente através da barreira do idioma, um problema Maçã e Google também estão competindo para resolver. O modelo mais recente do Google é capaz de traduzir com um atraso de dois segundos.

“O que estamos construindo é um sistema capaz de traduzir perfeitamente. Este modelo está basicamente lançando as bases para isso”, afirma Pierre Inventory, vice-presidente de operações científicas da Mistral, em entrevista à WIRED. “Acho que esse problema será resolvido em 2026.”

Fundada em 2023 pelos ex-alunos da Meta e do Google DeepMind, a Mistral é uma das poucas empresas europeias que desenvolve modelos básicos de IA capazes de funcionar remotamente perto dos líderes do mercado americano – OpenAI, Anthropic e Google – do ponto de vista de capacidade.

Sem acesso ao mesmo nível de financiamento e computação, a Mistral concentrou-se em melhorar o desempenho através do design de modelos imaginativos e da otimização cuidadosa de conjuntos de dados de treinamento. O objetivo é que as micromelhorias em todos os aspectos do desenvolvimento do modelo se traduzam em ganhos materiais de desempenho. “Francamente, muitas GPUs deixam você preguiçoso”, afirma Inventory. “Você testa muitas coisas cegamente, mas não pensa qual é o caminho mais curto para o sucesso.”

O principal modelo de linguagem grande (LLM) da Mistral não corresponde aos modelos concorrentes desenvolvido por concorrentes dos EUA para capacidade bruta. Mas a empresa conquistou um mercado ao estabelecer um compromisso entre preço e desempenho. “A Mistral oferece uma alternativa mais económica, onde os modelos não são tão grandes, mas são suficientemente bons e podem ser partilhados abertamente”, afirma Annabelle Gawer, diretora do Centro de Economia Digital da Universidade de Surrey. “Pode não ser um carro de Fórmula 1, mas é um carro acquainted muito eficiente.”

Entretanto, enquanto os seus homólogos americanos investem centenas de milhares de milhões de dólares na corrida para a inteligência synthetic geral, a Mistral está a construir uma lista de modelos especializados – embora menos atraentes – destinados a realizar tarefas restritas, como converter fala em texto.

“A Mistral não se posiciona como um participant de nicho, mas certamente está criando modelos especializados”, afirma Gawer. “Como um participant dos EUA com recursos, você quer ter uma tecnologia de uso geral muito poderosa. Você não quer desperdiçar seus recursos ajustando-os aos idiomas e especificidades de determinados setores ou geografias. Você deixa esse tipo de negócio menos lucrativo na mesa, o que cria espaço para gamers intermediários.”

À medida que a relação entre os EUA e os seus aliados europeus mostra sinais de deterioração, Mistral tem-se apoiado cada vez mais nas suas raízes europeias. “Há uma tendência na Europa em que as empresas e, em specific, os governos estão a olhar com muito cuidado para a sua dependência de empresas de software program e IA dos EUA”, afirma Dan Bieler, analista principal da empresa de consultoria de TI PAC.

Neste contexto, a Mistral posicionou-se como o par de mãos mais seguro: uma alternativa nativa europeia, multilingue e de código aberto aos modelos proprietários desenvolvidos nos EUA. “A pergunta deles sempre foi: como podemos construir uma posição defensável num mercado que é dominado por atores americanos altamente financiados?” diz Raphaëlle D’Ornano, fundadora da empresa de consultoria tecnológica D’Ornano + Co. “A abordagem que a Mistral adotou até agora é que eles querem ser a alternativa soberana, em conformidade com todas as regulamentações que possam existir na UE.”

Embora a disparidade de desempenho em relação aos pesos pesados ​​americanos se mantenha, à medida que as empresas enfrentam a necessidade de encontrar um retorno sobre o investimento em IA e de ter em conta o contexto geopolítico, os modelos mais pequenos ajustados aos requisitos específicos da indústria e da região terão o seu dia, prevê Bieler.

“Os LLMs são os gigantes que dominam as discussões, mas não contaria que essa situação durasse para sempre”, afirma Bieler. “Modelos pequenos e com foco mais regional desempenharão um papel muito maior no futuro.”

avots

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui