Nova IA da Apple ‘dispensa’ Gemini para a Siri, mas ainda precisa do Google

Nova IA da Apple 'dispensa' Gemini para a Siri, mas ainda precisa do Google


Nessa segunda-feira (8), a Apple apresentou grandes novidades em seu ecossistema de softwares, incluindo o iOS 27, nova Siri AI e várias outras melhorias para a plataforma Apple Intelligence. Dentre os anúncios mais importantes, mas mais restrito aos bastidores das ferramentas, está a nova geração dos Apple Foundation Models (AFM) – desta vez, desenvolvida em colaboração com o Google.

Contudo, contrariando o que o anúncio da colaboração sugeria, a base dos AFM não é o Gemini, do Google. Na verdade, a abordagem da Apple para ingressar no mercado de inteligências artificiais é mais complexa e envolve diferentes modelos generativos e hardware.

smart_display

Nossos vídeos em destaque

Em um artigo dedicado, a Apple destrinchou informações acerca do AFM. O artigo descreve, de forma superficial e acessível, a composição e o funcionamento dos novos modelos.

Uma grande novidade do Apple Intelligence é a Siri AI, versão com IA da assistente virtual. (Fonte: Apple/Divulgação)

Apple Intelligence agora com a 3ª geração dos Apple Foundation Models

A base para todo o Apple Intelligence é a terceira geração dos Apple Foundation Models, uma família composta por cinco modelos generativos personalizados desenvolvidos em colaboração com o Google.

A estrutura é composta por diferentes tipos e escalas de modelos, indo desde ferramentas para processamento local, direto do iPhone, iPad ou Mac, quanto IAs de processamento remoto, nos servidores que compõem a Private Cloud Compute.

An infographic showing the architecture of Apple Intelligence.
A estrutura de IA da Apple é composta por diferentes camadas que distanciam a experiência do usuário da estrutura mais profunda da tecnologia. (Fonte: Apple/Reprodução)

Entenda o que são os Apple Foundation Models

O conjunto de modelos que compõem os Apple Foundation Models é composto por dois modelos de processamento local:

  • AFM 3 Core: modelo denso de 3 bilhões de parâmetros;
  • AFM 3 Core Advanced: o modelo de processamento local mais poderoso, com capacidades multimodais e capaz de lidar com recursos como vozes expressivas e maior precisão para interpretar falas. Estruturado para lidar com 20 bilhões de parâmetros, mas ativando apenas 1 a 4 bilhões dependendo da requisição.

Os outros três modelos são de processamento remoto:

  • AFM 3 Cloud: modelo focado em velocidade, eficiência e performance;
  • ADM 3 Cloud (Image): modelo dedicado à geração e edição de imagens, responsável por tarefas como as ferramentas de edição de fotos e o Image Playground, por exemplo;
  • AFM 3 Cloud Pro: modelo mais poderoso e dedicado às tarefas mais complexas, como uso de ferramentas de forma autônoma e raciocínio prolongado.

Segundo a Apple, o AFM 3 Core, AFM 3 Core Advanced, AFM 3 Cloud e o ADM 3 Cloud (Image) foram desenvolvidos especificamente para rodar em chips da Apple.

Apple usa hardware da Nvidia no Apple Intelligence

A IA mais avançada dos Apple Foundation Models, o AFM 3 Cloud Pro, roda em hardware da Nvidia contidos no Google Cloud sob regras do Private Cloud Compute. Os requisitos estruturais para garantir segurança e privacidade são os mesmos utilizados para os demais modelos, apesar de não serem executados em componentes da Apple.

Neste caso, o AFM 3 Cloud Pro foi desenvolvido e aperfeiçoado para ser executado em placas gráficas da Nvidia. Porém, o hardware foi configurado com restrições para evitar que essas GPUs leiam conteúdos de servidores da Apple.

data-center-google
O modelo de IA mais avançado da Apple roda em hardware Nvidia contido em servidores do Google Cloud. (Fonte: Google/Reprodução)

Segundo a Apple, os modelos foram treinados com uma ampla variedade de conteúdos de alta qualidade. A base de dados utilizada contém informações disponíveis publicamente e dados licenciados, adquiridos de terceiros, open source, obtidos por estudos dedicados ou sintéticos. Em artigo dedicado ao tema, a empresa ressaltou que não usa dados pessoais dos usuários (nem suas interações com as ferramentas) para treinar a IA.

Toda a operação dos modelos acontece de forma invisível para o usuário, organizados pelo System Orchestrator, como se todos fossem um único produto. Essa abordagem exime o consumidor de entender as capacidades de cada modelo disponível, assim proporcionando uma experiência mais intuitiva e direta.

O que faz o Gemini no iOS 27?

Embora o Google esteja colaborando com a Apple no desenvolvimento dos Apple Foundation Models, nenhum deles é o Gemini. No artigo dedicado, a Apple não citou o nome comercial da plataforma de IA do Google nenhuma vez – nem mesmo para comparar o desempenho entre ferramentas.

O que o Google fez, na verdade, foi servir como aliado no desenvolvimento da plataforma, quase como fornecedor da fundação técnica para os modelos da Apple. Não é exatamente um produto do Google, mas a Apple também não desenvolveu a tecnologia do zero.

Google-Gemini
A nova Siri não é derivada do Gemini. (Fonte: Kenneth Cheung/Getty Images)

“Usamos zero do Google Assistente”, esclareceu Craig Federighi, vice-presidente sênior de engenharia de software da Apple. “É claro que nós não temos o aplicativo Gemini como nosso aplicativo. Na verdade, nenhum código do lado do cliente faz parte de como funcionamos no iOS. Para esses modelos, não usamos nenhum dos modelos que o Google implementa para seus clientes, nem usamos a infraestrutura e os meios pelos quais eles implementam modelos para seus clientes”, complementou.

Nem mesmo a busca na web é feita com mecanismos do Google. Para a pesquisa online, a Siri AI usa recursos proprietários, como o crawler Applebot. “Quando se trata de base de conhecimento, é claro que não usamos a Busca do Google nem nada parecido como base do nosso sistema”, afirmou Federighi.

O vice-presidente de IA da Apple, Amar Subramanya, destacou que uma das contribuições do Google foi no treinamento dos novos modelos. “Todos [os modelos] foram desenvolvidos sob medida para o silício da Apple, treinados com dados proprietários por meio de aprendizado por reforço e refinados com base nas saídas dos modelos de vanguarda do Gemini”, afirmou o executivo. Portanto, o Gemini foi usado para um tipo de destilação, e não para servir como base do AFM.

O que a Apple não falou sobre os Apple Foundation Models?

Em nenhum momento do artigo, a Apple compara os próprios modelos com concorrentes conhecidos no setor – Gemini, GPT ou Claude, por exemplo. As únicas comparações exibidas são contra suas próprias versões anteriores do modelo. Portanto, no momento, é impossível afirmar que os modelos da Apple são melhores ou piores do que soluções disponíveis no mercado de IA.

Contudo, a empresa promete compartilhar mais informações sobre os modelos, como avaliações e benchmarks, em um artigo técnico com publicação prevista para o verão do hemisfério norte, entre junho e setembro deste ano.

Ao adotar essa estratégia de comunicação, a Apple evita que seus novos modelos sejam instantaneamente comparados com soluções concorrentes – assim talvez evitando que resultados ruins prejudiquem a reputação da empresa em IA, que já não é boa. Porém, deixa o mercado às cegas sobre o que esperar da nova geração do AFM em termos de desempenho, precisão, eficiência e confiabilidade.

Quer ficar por dentro das novidades do mundo da tecnologia? Acesse o TecMundo e acompanhe as últimas notícias sobre Apple, Apple Intelligence e inteligência artificial.



Fonte da notícia: Novidades do TecMundo https://www.tecmundo.com.br/software/413732-nova-ia-da-apple-dispensa-gemini-para-a-siri-mas-ainda-precisa-do-google.htm

Igor Almenara Carneiro