Microsoft alugará GPUs da Oracle devido à demanda de IA do Bing

Bing Chat Enterprise, Microsoft, Bing, IA generativa, Ia, inteligência artificial

A Microsoft firmou parceria com a Oracle para atender à crescente demanda por recursos de computação, especialmente GPUs, alimentando seus serviços de inteligência artificial, como o Bing Chat. Em um acordo de vários anos, a gigante do software planeja alugar GPUs do supercluster da Oracle, a fim de acelerar a inferência de IA, o processo de aplicação em larga escala de modelos de machine learning.

O Bing Chat, lançado em fevereiro, é um mecanismo de busca que integra chatbots de IA. No entanto, para treinar e aplicar modelos de linguagem em grande escala, são necessários clusters de GPUs. Enquanto isso, a Oracle dispõe de uma ampla oferta de Nvidia A100s e GPUs H100 disponíveis para locação.

“O Microsoft Bing está aproveitando os mais recentes avanços em IA para fornecer uma experiência de pesquisa dramaticamente melhor para pessoas em todo o mundo”, disse Divya Kumar, chefe global de Marketing de Pesquisa e IA da Microsoft, em comunicado.

Essa colaboração entre a Microsoft e a Oracle também tira proveito do Oracle Interconnect para o Microsoft Azure, permitindo que serviços em execução na plataforma Azure interajam com recursos na Oracle Cloud Infrastructure. A parceria reforça como as grandes empresas de tecnologia muitas vezes recorrem a parceiros para atender às suas necessidades de infraestrutura e manter a qualidade e a velocidade de seus serviços.

Leia também: Amazon trabalha em IA para competir com Microsoft e OpenAI

“Nossa colaboração com a Oracle e o uso da Oracle Cloud Infrastructure junto com nossa infraestrutura de IA do Microsoft Azure expandirá o acesso aos clientes e melhorará a velocidade de muitos de nossos resultados de pesquisa”, adicionou Kumar.

O empenho da Microsoft reforça sua tentativa de ampliar sua presença no mercado de buscadores dominado pela Google, tirando proveito do seu pioneirismo com a IA generativa. No entanto, a Microsoft ainda não é tão popular quanto o Google, que domina com uma participação global de 91,6% na pesquisa na web, enquanto o Bing detém apenas 3,1%, segundo apurado pela StatCounter, em outubro de 2023.

Os detalhes sobre quantos nós de GPU a Microsoft está alugando da Oracle não foram divulgados.

Conforme destacado pelo The Register, a Oracle destaca que seus superclusters de nuvem, que provavelmente serão utilizados pelo Bing, possuem a capacidade de expansão para 32.768 Nvidia A100s ou 16.384 GPUs H100, graças a uma rede RDMA de baixa latência. Isso é complementado por um armazenamento em cluster de alto desempenho, projetado para atender a aplicativos altamente paralelos.‌

*Com informações do The Register

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!