Google anuncia Gemini, seu modelo mais avançado e hábil de IA

Gemini

O Google anunciou nessa quarta-feira (6/12) o que chama do seu “modelo de IA mais avançado e o maior projeto científico e tecnológico que a empresa já desenvolveu até agora”. Batizado de Gemini, a o seu modelo avançado de IA é resultado de um esforço colaborativo em grande escala que envolveu vários times do Google, incluindo as equipes do Google DeepMind e Google Research.

De acordo com o anúncio da empresa, o Gemini é um modelo de IA multimodal, com capacidade de organizar, compreender, operar e combinar diferentes tipos de informação, incluindo textos, imagens, áudios, vídeos e linguagens de programação. Trata-se também do modelo de IA mais flexível do Google, capaz de funcionar com eficiência desde dispositivos móveis até data centers.

A gigante de tecnologia garante que sua resposta à avançada corrida de IA generativa vai melhorar significativamente a forma como os desenvolvedores e empresas constroem e escalam soluções com IA.

O Google explica que até agora, o método padrão para a criação de modelos multimodais envolvia treinar componentes separados para diferentes modalidades e depois juntá-los para imitar algumas dessas funcionalidades. Às vezes, esses modelos podem ser bons na execução de certas tarefas, como descrever imagens, mas enfrentam problemas com raciocínios mais conceituais e complexos.

Leia mais: Intel quer democratizar inteligência artificial

“Por isso, projetamos o Gemini para ser um modelo multimodal nativo, ou seja, previamente treinado desde o início em diferentes modalidades. Em seguida, aperfeiçoamos o modelo com dados multimodais adicionais para refinar ainda mais a sua eficácia. Isso ajuda o Gemini a compreender e raciocinar perfeitamente sobre todos os tipos de informações desde o começo, de uma forma muito melhor do que os modelos multimodais existentes e com recursos de última geração em quase todos os domínios”, explicou em comunicado.

O Google garante ainda que o seu novo modelo de IA foi testado e seu desempenho avaliado rigorosamente em uma ampla variedade de tarefas. O desempenho do Gemini Ultra supera 30 dos 32 pontos das referências acadêmicas amplamente utilizados na pesquisa e no desenvolvimento de grandes modelos de linguagem.

Gemini chega a produtos do Google

A primeira versão do modelo, o Gemini 1.0, está sendo lançado em uma variedade de produtos e plataformas do Google.
Para os usuários, o Bard com Gemini Pro já está disponível em inglês em mais de 170 países e territórios . Ele terá capacidade de compreender, resumir, raciocinar, fazer brainstorming, escrever e planejar. Essa é a maior melhoria de qualidade do Bard desde o seu lançamento, segundo o Google.

O Gemini também já se encontra está disponível para o Pixel, smartphone da companhia. O Pixel 8 Pro é o primeiro smartphone projetado para rodar o Gemini Nano, que está potencializando novos recursos como “Summarize no aplicativo Recorder” e lançando o “Smart Reply” no Gboard, começando pelo WhatsApp e, no próximo ano, em mais aplicativos de mensagens.

Nos próximos meses, o Gemini estará disponível em mais dos principais produtos e serviços do Google, como a Busca, Ads, Chrome e Duet AI.

Gemini para empresas e desenvolvedores

Já para os clientes corporativos e desenvolvedores, a partir do dia 13 de dezembro, será possível acessar o Gemini Pro por meio da API do Gemini no Google AI Studio ou Vertex AI.

O Google AI Studio é uma ferramenta gratuita para desenvolvedores baseada na Web que ajuda desenvolvedores e clientes corporativos a criar protótipos e lançar aplicativos rapidamente com uma chave de API. A Vertex AI permitirá a personalização do Gemini com controle total de dados, beneficiando-se de recursos adicionais do Google Cloud para segurança empresarial, proteção, privacidade e governança e conformidade de dados.

Os desenvolvedores Android também poderão construir com o Gemini Nano, modelo eficiente para tarefas em dispositivos móveis, via AICore, que é um novo recurso de sistema disponível no Android 14, começando em dispositivos Pixel 8 Pro.

Para o início de 2024, o Google promete lançar o Bard Advanced, uma nova experiência de IA avançada, a partir da qual será possível acessar os melhores modelos e capacidades, começando pelo Gemini Ultra.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!