OpenAI lança o modelo o1 com capacidades de “raciocínio”
A OpenAI revelou o modelo o1, o primeiro de uma nova série de modelos com habilidades de “raciocínio”, projetado para lidar com perguntas mais complexas de maneira mais eficiente do que os humanos. Juntamente com o o1-mini, uma versão menor e mais acessível, o lançamento marca a chegada do aguardado modelo Strawberry.
Para a OpenAI, o o1 representa um avanço significativo em direção à inteligência artificial que imita o raciocínio humano. Em termos práticos, o modelo se destaca na escrita de código e na resolução de problemas complexos, embora seja mais caro e mais lento que o GPT-4o. A OpenAI descreve o o1 como uma “prévia” para destacar que ainda está em estágio inicial.
Usuários do ChatGPT Plus e Team terão acesso ao o1-preview e ao o1-mini a partir de hoje (12), enquanto os usuários de Enterprise e Edu terão acesso no início da próxima semana. A OpenAI pretende oferecer acesso ao o1-mini para todos os usuários gratuitos do ChatGPT, embora ainda não tenha definido uma data para o lançamento.
Leia também: ABREE lança campanha educacional para conscientizar sobre descarte de resíduos eletrônicos
O acesso para desenvolvedores ao o1 é bastante caro: o o1-preview custa US$ 15 por 1 milhão de tokens de entrada e US$ 60 por 1 milhão de tokens de saída. Em comparação, o GPT-4o custa US$ 5 por 1 milhão de tokens de entrada e US$ 15 por 1 milhão de tokens de saída.
De acordo com Jerry Tworek, líder de pesquisa da OpenAI, o treinamento do o1 é fundamentalmente diferente dos modelos anteriores. Ele explica que o o1 foi treinado com um novo algoritmo de otimização e um conjunto de dados de treinamento específico para esse modelo.
A OpenAI usou a técnica de aprendizado por reforço para ensinar o o1 a resolver problemas de forma autônoma, recompensando e punindo o sistema durante o processo. O modelo utiliza uma “cadeia de pensamento” para processar consultas, similar ao modo como os humanos resolvem problemas passo a passo.
Como resultado dessa nova metodologia de treinamento, a OpenAI afirma que o modelo é mais preciso. “Observamos que este modelo tenha menos alucinações”, diz Tworek. No entanto, o problema ainda persiste. “Não podemos dizer que resolvemos as alucinações.”
O principal diferencial do o1 em relação ao GPT-4o é sua capacidade de lidar com problemas complexos, como codificação e matemática, e também explicar seu raciocínio. Segundo Bob McGrew, diretor de pesquisa da OpenAI, o o1 demonstrou melhor desempenho em testes de matemática, como o AP math test, e também em exames qualificatórios da Olimpíada Internacional de Matemática, onde obteve uma taxa de acerto de 83%, comparado aos 13% do GPT-4o.
O modelo também teve um bom desempenho em competições de programação online, alcançando o 89º percentil dos participantes. A OpenAI afirma que a próxima atualização do modelo terá um desempenho “semelhante ao de estudantes de doutorado em tarefas desafiadoras nas áreas de física, química e biologia.”
No entanto, o o1 não é tão eficiente quanto o GPT-4o em várias áreas. O modelo não possui um bom desempenho em conhecimentos factuais sobre o mundo e não pode navegar na web ou processar arquivos e imagens. Ainda assim, a empresa acredita que representa uma nova classe de capacidades, com o nome o1 indicando um “recomeço”.
McGrew admite que a OpenAI tem dificuldades com nomes, mas espera que este seja o primeiro passo para nomes mais claros e representativos das suas inovações.
Embora não tenha sido possível fazer uma demonstração direta do o1, McGrew e Tworek mostraram o modelo em uma chamada de vídeo. Eles pediram para resolver um problema complexo de matemática, e o modelo forneceu a resposta correta após 30 segundos de processamento. A interface do o1 mostra os passos de raciocínio enquanto o modelo trabalha, criando uma ilusão de pensamento humano com frases como “Estou curioso sobre” e “Deixe-me ver”.
Apesar de parecer que o modelo está pensando, ele não possui consciência ou inteligência verdadeira. A OpenAI não acredita em equiparar o raciocínio do modelo com o raciocínio humano, mas a interface visa mostrar como o modelo dedica mais tempo ao processamento e à solução de problemas, o que pode dar uma sensação mais humana.
A empresa de IA está investindo em capacidades de raciocínio porque acredita que este é um passo crítico para alcançar a inteligência em nível humano. O objetivo é que modelos com raciocínio possam trazer avanços em áreas como medicina e engenharia, embora, por enquanto, as habilidades de raciocínio do o1 ainda sejam relativamente lentas e caras para os desenvolvedores.
*Com informações do The Verge
Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!