Início Tecnologia O futuro da IA ​​não está na nuvem, está no seu dispositivo

O futuro da IA ​​não está na nuvem, está no seu dispositivo

9
0

Quando eu toco no aplicativo do Anthropic’s Claude AI no meu telefone e avisá-lo – diga: “Conte-me uma história sobre um gato travesso” – muita coisa acontece antes do resultado (O Grande Roubo do Atum) aparecer na minha tela.

Minha solicitação é enviada para a nuvem – um computador em um grande centro de dados em algum lugar – para ser executado no Soneto 4.5 de Claude modelo de linguagem grande. O modelo monta uma resposta plausível usando texto preditivo avançado, aproveitando a enorme quantidade de dados nos quais foi treinado. Essa resposta é então encaminhada de volta para o meu iPhone, aparecendo palavra por palavra, linha por linha, na tela. Ele viajou centenas, senão milhares de quilômetros e passou por vários computadores em sua jornada de ida e volta para meu pequeno telefone. E tudo acontece em segundos.

Leia mais: CNET está escolhendo o melhor dos prêmios CES 2026

Este sistema funciona bem se o que você está fazendo é de baixo risco e a velocidade não é realmente um problema. Posso esperar alguns segundos pela minha pequena história sobre Whiskers e sua desventura em um armário de cozinha. Mas nem todas as tarefas da inteligência synthetic são assim. Alguns exigem uma velocidade tremenda. Se um dispositivo de IA alertar alguém sobre um objeto bloqueando seu caminho, ele não poderá esperar um ou dois segundos.

Outras solicitações exigem mais privacidade. Não me importo se a história do gato passa por dezenas de computadores pertencentes a pessoas e empresas que não conheço e em quem não posso confiar. Mas e as minhas informações de saúde ou meus dados financeiros? Talvez eu queira manter isso sob controle.


Não perca nenhum de nossos conteúdos técnicos imparciais e análises baseadas em laboratório. Adicionar CNET como fonte preferencial do Google.


Velocidade e privacidade são duas das principais razões pelas quais os desenvolvedores de tecnologia estão cada vez mais transferindo o processamento de IA dos grandes information facilities corporativos para dispositivos pessoais, como telefone, laptop computer ou smartwatch. Também há economia de custos: não há necessidade de pagar uma operadora de huge information middle. Além disso, os modelos no dispositivo podem funcionar sem conexão com a Web.

Mas tornar esta mudança possível requer melhor {hardware} e modelos de IA mais eficientes – muitas vezes mais especializados. A convergência desses dois fatores acabará por moldar a rapidez e a fluidez da sua experiência em dispositivos como o seu telefone.

Arte do emblema CNET AI Atlas; clique para ver mais

CNET

Mahadev Satyanarayanan, conhecido como Satya, é professor de ciência da computação na Carnegie Mellon College. Ele pesquisou há muito tempo o que é conhecido como edge computing – o conceito de lidar com processamento e armazenamento de dados o mais próximo possível do usuário actual. Ele diz que o modelo ultimate para a verdadeira computação de ponta é o cérebro humano, que não transfere tarefas como visão, reconhecimento, fala ou inteligência para qualquer tipo de “nuvem”. Tudo acontece ali mesmo, completamente “no dispositivo”.

“Aqui está o problema: a natureza levou um bilhão de anos para nos evoluir”, ele me disse. “Não temos de esperar mil milhões de anos. Estamos a tentar fazer isto em cinco ou dez anos, no máximo. Como vamos acelerar a evolução?”

Você acelera com uma IA melhor, mais rápida e menor, executada em {hardware} melhor, mais rápido e menor. E como já estamos vendo com os aplicativos e dispositivos mais recentes – incluindo aqueles que vimos na CES 2026 – está bem encaminhado.

A IA provavelmente está rodando no seu telefone agora

A IA no dispositivo está longe de ser uma novidade. Lembra-se de 2017, quando você poderia desbloquear seu iPhone pela primeira vez segurando-o na frente do seu rosto? Essa tecnologia de reconhecimento facial usou um mecanismo neural no dispositivo – não é uma geração de IA como Claude ou ChatGPT, mas é uma inteligência synthetic elementary.

Os iPhones de hoje usam um modelo de IA no dispositivo muito mais poderoso e versátil. Possui cerca de 3 bilhões de parâmetros – os cálculos individuais de peso atribuídos a uma probabilidade em um modelo de linguagem. Isso é relativamente pequeno em comparação com os grandes modelos de uso geral nos quais a maioria dos chatbots de IA são executados. Deepseek-R1, por exemplo, tem 671 bilhões de parâmetros. Mas não se destina a fazer tudo. Em vez disso, ele foi desenvolvido para tarefas específicas no dispositivo, como resumir mensagens. Assim como a tecnologia de reconhecimento facial para desbloquear seu telefone, isso é algo que não pode depender de uma conexão com a Web para executar um modelo na nuvem.

A Apple aprimorou seus recursos de IA no dispositivo – apelidados de Apple Intelligence – para incluir recursos de reconhecimento visible, como permitir que você procure coisas das quais tirou uma captura de tela.

Os modelos de IA no dispositivo estão por toda parte. Os telefones Pixel do Google executam o modelo Gemini Nano da empresa de forma personalizada Chip tensor G5. Esse modelo potencializa recursos como o Magic Cue, que exibe informações de seus e-mails, mensagens e muito mais – exatamente quando você precisa – sem que você exact procurá-las manualmente.

Os desenvolvedores de telefones, laptops, tablets e o {hardware} contido neles estão construindo dispositivos com IA em mente. Mas vai além disso. Pense nos relógios e óculos inteligentes, que oferecem espaço muito mais limitado do que o telefone mais fino?

“Os desafios do sistema são muito diferentes”, disse Vinesh Sukumar, chefe de IA generativa e aprendizado de máquina da Qualcomm. “Posso fazer tudo isso em todos os dispositivos?”

Neste momento, a resposta geralmente é não. A solução é bastante simples. Quando uma solicitação excede os recursos do modelo, ela transfere a tarefa para um modelo baseado em nuvem. Mas dependendo de como essa transferência é gerenciada, ela pode prejudicar um dos principais benefícios da IA ​​no dispositivo: manter seus dados inteiramente em suas mãos.

IA mais privada e segura

Os especialistas apontam repetidamente a privacidade e a segurança como as principais vantagens da IA ​​no dispositivo. Em uma situação de nuvem, os dados voam em todas as direções e enfrentam mais momentos de vulnerabilidade. Se permanecer em um telefone criptografado ou unidade de laptop computer, será muito mais fácil protegê-lo.

Os dados empregados pelos modelos de IA dos seus dispositivos podem incluir coisas como suas preferências, histórico de navegação ou informações de localização. Embora tudo isso seja essencial para que a IA personalize sua experiência com base em suas preferências, também é o tipo de informação que você não deseja que caia em mãos erradas.

“O que estamos buscando é garantir que o usuário tenha acesso e seja o único proprietário desses dados”, disse Sukumar.

A mão de uma pessoa segurando um iPhone

A Apple Intelligence deu ao Siri um novo visible no iPhone.

Numi Prasarn/CNET

Existem algumas maneiras diferentes de lidar com a transferência de informações para proteger sua privacidade. Um fator importante é que você teria que dar permissão para que isso acontecesse. Sukumar disse que o objetivo da Qualcomm é garantir que as pessoas estejam informadas e tenham a capacidade de dizer não quando um modelo chegar ao ponto de ser transferido para a nuvem.

Outra abordagem – e que pode funcionar junto com a exigência de permissão do usuário – é garantir que todos os dados enviados para a nuvem sejam tratados de forma segura, breve e temporária. A Apple, por exemplo, usa tecnologia que chama Computação em nuvem privada. Os dados descarregados são processados ​​apenas nos próprios servidores da Apple, apenas os dados mínimos necessários para a tarefa são enviados e nenhum deles é armazenado ou disponibilizado à Apple.

IA sem o custo de IA

Os modelos de IA executados em dispositivos apresentam uma vantagem tanto para os desenvolvedores de aplicativos quanto para os usuários, pois o custo contínuo de executá-los é basicamente zero. Não há nenhuma empresa de serviços em nuvem que pague pela energia e pelo poder computacional. Está tudo no seu telefone. Seu bolso é o information middle.

Foi isso que atraiu Charlie Chapman, desenvolvedor de um aplicativo de máquina de ruído chamado Ruído escuroaté usar o Basis Fashions Framework da Apple para uma ferramenta que permite criar uma mixagem de sons. O modelo de IA no dispositivo não gera novo áudio, apenas seleciona diferentes sons e níveis de quantity existentes para fazer uma mixagem.

Como a IA funciona no dispositivo, não há custos contínuos enquanto você faz suas mixagens. Para um pequeno desenvolvedor como Chapman, isso significa que há menos riscos associados à escala da base de usuários de seu aplicativo. “Se algum influenciador postasse aleatoriamente sobre isso e eu conseguisse uma quantidade incrível de usuários gratuitos, isso não significa que irei à falência repentinamente”, disse Chapman.

Leia mais: Princípios básicos de IA: 29 maneiras de fazer a IA de geração trabalhar para você, de acordo com nossos especialistas

A falta de custos contínuos da IA ​​no dispositivo permite que tarefas pequenas e repetitivas, como a entrada de dados, sejam automatizadas sem grandes custos ou contratos de computação, disse Chapman. A desvantagem é que os modelos do dispositivo diferem de acordo com o dispositivo, então os desenvolvedores teriam que trabalhar ainda mais para garantir que seus aplicativos funcionassem em {hardware} diferente.

Quanto mais tarefas de IA são realizadas em dispositivos de consumo, menos as empresas de IA têm de gastar na construção massiva de centros de dados que faz com que todas as grandes empresas de tecnologia lutem por dinheiro e chips de computador. “O custo da infraestrutura é enorme”, disse Sukumar. “Se você realmente quer aumentar a escala, não quer carregar esse fardo de custos”.

Para criadores que usam IA para edição de vídeos ou fotos, executar esses modelos em seu próprio {hardware} tem a vantagem de evitar assinaturas caras ou cobranças de uso baseadas na nuvem. Na CES. vimos como computadores dedicados ou dispositivos especializadoscomo o Nvidia DGX Sparkpode alimentar modelos de geração de vídeo intensivos como Lightricks-2.

O futuro é tudo uma questão de velocidade

Especialmente quando se trata de funções em dispositivos como óculos, relógios e telefones, grande parte da utilidade genuína da IA ​​e do aprendizado de máquina não é como o chatbot que usei para fazer uma história de gato no início deste artigo. São coisas como reconhecimento de objetos, navegação e tradução. Eles exigem modelos e {hardware} mais especializados – mas também exigem mais velocidade.

Satya, professor da Carnegie Mellon, tem pesquisado diferentes usos de modelos de IA e se eles podem funcionar com precisão e rapidez suficiente usando modelos no dispositivo. Quando se trata de classificação de imagens de objetos, a tecnologia atual está indo muito bem – é capaz de fornecer resultados precisos em 100 milissegundos. “Cinco anos atrás, não conseguíamos em nenhum lugar obter esse tipo de precisão e velocidade”, disse ele.

Imagens dos óculos Oakley Meta Vanguard AI mostrando uma paisagem sobreposta com estatísticas da Garmin

Esta captura de tela recortada de imagens de vídeo capturadas com os óculos Oakley Meta Vanguard AI mostra métricas de treino extraídas do relógio Garmin emparelhado.

Vanessa Hand Orellana/CNET

Mas para outras quatro tarefas – detecção de objetos, segmentação instantânea (a capacidade de reconhecer objetos e sua forma), reconhecimento de atividades e rastreamento de objetos – os dispositivos ainda precisam ser descarregados para um computador mais poderoso em outro lugar.

“Acho que nos próximos anos, cinco anos ou mais, será muito emocionante, à medida que os fornecedores de {hardware} continuarem tentando tornar os dispositivos móveis mais bem ajustados para IA”, disse Satya. “Ao mesmo tempo, também temos os próprios algoritmos de IA cada vez mais poderosos, mais precisos e mais intensivos em computação.”

As oportunidades são imensas. Satya disse que os dispositivos no futuro poderão usar a visão computacional para alertá-lo antes que você tropece em pagamentos irregulares ou lembrá-lo com quem você está falando e fornecer contexto em torno de suas comunicações anteriores com eles. Esse tipo de coisa exigirá IA mais especializada e {hardware} mais especializado.

“Isso vai surgir”, disse Satya. “Podemos vê-los no horizonte, mas ainda não chegaram.”



avots

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui