Thomas Kurian: empresas estão criando agentes de IA generativa

Thomas Kurian, CEO do Google Cloud

Não diferente da maior parte das gigantes de tecnologia, Google Cloud está focado em Inteligência Artificial Generativa. Na abertura do evento Cloud Next ’24, Thomas Kurian, CEO da companhia, afirmou ter centenas de parcerias com empresas de IA para acelerar a inovação e citou Mc Donald’s, Deutsche Bank e Mayo Clinic como exemplos de empresas que estão usando a infraestrutura de Google Cloud para criar cases de IA.

“Vamos focar em como o Google está ajudando empresas líderes a transformar suas operações e se tornar líderes digitais de API, que é a nova onda da nuvem. Temos muitos avanços importantes, começando com nossa infraestrutura”, diz o CEO.

Para ele, os clientes rapidamente passaram de experimentar com IA generativa, aproveitando para responder perguntas e fazer previsões de IA, e agora estão construindo agentes de IA generativa. “Agentes são entidades inteligentes com ações para ajudá-lo a alcançar objetivos específicos. Por exemplo, ajudar um comprador a encontrar o vestido perfeito ou ajudar um funcionário a escolher os benefícios de saúde certos. Agentes auxiliam o pessoal de enfermagem a agilizar as transferências de pacientes quando as trocas de turno ocorrem.”

Os agentes, complementa Kurian, processam informações multimodais simultaneamente, conversando, raciocinando, aprendendo e tomando decisões. Os agentes podem se conectar com outros agentes e com humanos, e transformarão a forma como cada um interage com dispositivos de computação e a própria web.

O grande protagonista para chegar a esse resultado é o Gemini1.5 Pro, modelo de IA com avanço na compreensão de contextos longos. De acordo com Kurian, o lançamento está consideravelmente acima de concorrentes, como o GPT-4, e conta com um milhão de tokens.

Leia mais: Motorola Solutions e Google Cloud anunciam parceria em segurança

Com a integração do Gemini 1.5 Pro na plataforma Vertex AI, Google Cloud promete oferecer aos clientes a possibilidade de processar grandes quantidades de informações em um único fluxo, incluindo 1 hora de vídeo, 11 horas de áudio, bases de código com mais de 30.000 linhas ou mais de 700.000 palavras.

“Um professor universitário está usando [a ferramenta] para extrair dados de um documento de 3000 páginas com dados de texto, tabelas e gráficos em apenas um único disparo. Uma empresa de serviços financeiros está usando para pesquisar, analisar, entender e responder a perguntas em documentos complexos de fusões e aquisições”, exemplifica Kurian.

Na área de segurança orientada por IA, o Google Cloud anunciou novos recursos de segurança desenvolvidos pelo Gemini no intuito de aprimorar a inteligência contra ameaças e a resposta a incidentes. Por meio da linguagem natural, a IA do Google Cloud irá fornecer insights profundos sobre o comportamento dos atores da ameaça, informar sobre detecções, resumir dados dos problemas encontrados e fazer recomendações aos usuários por meio do chat.

Mark Lohemeyer, VP de infraestrutura de IA e Machine Learning de Google Cloud, subiu ao palco para dar detalhes da evolução de outros produtos e serviços. “Para manter a promessa da IA generativa, construímos modelos multimodais, o que exige aproveitar a computação e os dados em escala de uma maneira nunca imaginada antes. Estamos vendo a demanda concorrente de grandes modelos de linguagem crescer em um fator de 10 vezes a cada ano. Por isso, projetamos e construímos uma orquestra de hardware e software.”

Para isso, o Google Cloud anunciou a chegada dos chips A3 mega, NVIDIA HGX B200 e NVIDIA GB200 NVL72, que suportam cargas de trabalho mais exigentes, assim como opções de armazenamento otimizadas para IA e a disponibilidade geral do TPU v5p, o acelerador de IA do Google Cloud com quatro vezes mais poder de computação por módulo em comparação com a sua geração anterior.

Com disponibilidade na versão preview ainda este ano, a empresa anunciou os novos processadores Google Axion, a primeira CPU personalizada baseada em ArmⓇ do Google Cloud projetada para os data centers, e revelou que está habilitando a IA em qualquer lugar, ou seja, está trazendo a IA para mais perto de onde os dados estão sendo gerados e consumidos: para a borda (edge computing), ambientes isolados e nuvens soberanas.

“Em geral, descobrimos que nosso computador híbrido de IA pode rodar com mais do que o dobro da eficiência de reconhecimento em relação às técnicas de hardware básicas. Empresas líderes treinaram e certificaram modelos em nosso supercomputador de IA”, comemora o especialista.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

*a jornalista viajou a convite do Google Cloud