Nvidia anuncia serviço em nuvem para empresas criarem modelos de IA generativa

A Nvidia anunciou nesta terça-feira (21) um conjunto de serviços em nuvem que permite que empresas construam, refinem e operem seus próprios modelos amplos de linguagem (LLMs) personalizados. Com isso, a companhia espera acelerar a adoção de inteligência artificial (IA) generativa por empresas de diferentes tamanhos.

O conjunto de serviços inclui Nvidia AI Foundations. A oferta engloba o NeMo, de modelos de linguagem, e Picasso, para imagens, vídeos e de modelos 3D. Com eles, empresas poderão construir aplicações proprietárias de domínio específico, modelos de IA generativa para bate-papo inteligente, suporte ao cliente, simulação digital e outras aplicações.

Separadamente, a companhia também fornecerá o serviço em nuvem da BioNeM, com novos novos modelos para pesquisa e desenvolvimento em biologia.

“A IA generativa está impulsionando a rápida adoção da IA e reinventando inúmeras indústrias”, pontuou Jensen Huang, fundador e CEO da Nvidia, na abertura do GTC 2023. “O Nvidia AI Foundation permite às empresas personalizar os modelos de fundação com seus próprios dados para gerar os recursos mais valiosos da humanidade – inteligência e criatividade”.

Os serviços NeMo e Picasso são executados no DGX Cloud, novo serviço de supercomputação de IA que oferece às empresas acesso imediato à infraestrutura e ao software necessários para treinar modelos avançados para IA generativa e outros aplicativos inovadores.

Leia também: TI corporativa avança – com cautela – com IA generativa

“A Nvidia leva todo o expertise dela da parte de supercomputadores, da família DGX – que é o appliance de inteligência artificial da Nvidia –, para a nuvem”, explicou Marcel Saraiva, gerente de vendas enterprise da companhia no Brasil. “Com isso, a gente consegue ter a facilidade, segurança e dinâmica e a forma de trabalhar na nuvem com supercomputadores.”

O DGX Cloud é acessível através de um navegador de internet. Desenvolvedores podem utilizar os modelos oferecidos em cada serviço por meio de interfaces simples de programação de aplicações (APIs). Uma vez que os modelos estejam prontos para implementação, as empresas podem executar cargas de trabalho de inferência em escala usando os serviços em nuvem da AI Foundations.

Leia mais: Google avança IA generativa com novos recursos para devs

Cada serviço em nuvem inclui seis elementos: modelos pré-treinados, estruturas para processamento de dados, bancos de dados vetoriais e personalização, motores de inferência otimizados, APIs e suporte de especialistas da organização para ajudar clientes a afinar modelos para seus casos de uso personalizados.

Algumas empresas já estão construindo modelos customizados usando a DXG Cloud e suas ferramentas. A lista inclui a AMGen, que está utilizando a infraestrutura para pesquisa de medicamentos; a ServiceNow, que está pesquisando geração de códigos através de LLMs; e a CCC, que está empregando IA para agilizar o processamento de seguros.

“Estamos no ‘momento do iPhone da IA’. As startups estão correndo para criar produtos e modelos de negócios disruptivos, e as empresas estabelecidas estão procurando responder”, disse Huang. “O DGX Cloud oferece aos clientes acesso instantâneo à supercomputação da Nvidia AI em nuvens de escala global.”

Disponibilidade

Segundo a empresa, o serviço de IA generativa NeMo na nuvem está em acesso antecipado. O serviço Picasso está em pré-visualização privada. Desenvolvedores podem solicitar o acesso a cada um deles através de suas páginas oficiais.

Para o DGX Cloud, a companhia promete parcerias com os principais provedores de serviços em nuvem para hospedar a infraestrutura DGX Cloud. A primeira será a Oracle Cloud Infrastructure (OCI). A Microsoft Azure comece a hospedar o DGX Cloud no próximo trimestre, e o serviço será expandido “em breve” para o Google Cloud e mais.