IA ainda falha em julgamento ético e raciocínio crítico, diz OCDE
A Organização para a Cooperação e Desenvolvimento Econômico (OCDE) lançou hoje, 3, o relatório Introducing the OECD AI Capability Indicators, em que apresenta uma nova metodologia para mensurar as capacidades da inteligência artificial (IA) com base em comparações diretas com habilidades humanas. Segundo a avaliação dos especialistas responsáveis pela construção dos indicadores, as ferramentas de IA atualmente disponíveis, incluindo modelos de linguagem avançados como o GPT-4o, ainda estão longe de realizar julgamentos éticos ou tomar decisões com base em valores complexos.
Além do relatório, lançou o beta de uma ferramenta que pretende acompanhar o nível de desenvolvimento da IA e como ela afeta o mercado de trabalho.
Os indicadores propostos medem o desempenho da IA em nove domínios:
- linguagem;
- interação social;
- resolução de problemas;
- criatividade;
- metacognição e pensamento crítico;
- memória e aprendizado;
- visão;
- manipulação física;
- inteligência robótica.
Cada domínio é estruturado em cinco níveis. Para atingir o nível 5, a IA deve simular de forma robusta e consistente a totalidade da capacidade humana correspondente. Atualmente, nenhuma ferramenta de IA atinge esse patamar.
IA na infância: tecnologias atuais operam entre os níveis 2 e 3
A avaliação considera que os sistemas de IA mais avançados estão posicionados entre os níveis 2 e 3 em todas as escalas. No caso do domínio de “metacognição e pensamento crítico”, por exemplo, a OCDE observa que as IAs conseguem monitorar parcialmente suas próprias respostas e ajustar estratégias em contextos conhecidos, mas falham ao lidar com informações ambíguas, lacunas de conhecimento ou decisões com implicações éticas.
Da mesma forma, no domínio de “resolução de problemas”, os sistemas podem lidar com questões descritas em linguagem natural e realizar análises quantitativas e qualitativas simples. No entanto, ainda não demonstram capacidade de resolver problemas mal definidos, que envolvam múltiplas disciplinas ou dilemas morais — uma exigência dos níveis 4 e 5.
Ferramenta visa orientar políticas públicas
A proposta da OCDE é que os indicadores publicados hoje sirvam como ferramenta para a formulação de políticas públicas nas áreas de regulação, educação e mercado de trabalho. Ao permitir a comparação entre o que a IA já é capaz de fazer e o que ainda requer habilidades humanas, os indicadores podem apoiar decisões sobre currículo escolar, automação de tarefas e definição de limites para uso de IA em setores críticos, como saúde, justiça e defesa.
O documento faz inclusive uma relação entre certas profissões e o estágio atual de impacto sobre elas:
Ocupação | Tarefa analisada | Nível de IA necessário | Situação atual da IA |
Professores | Adaptação do ensino a diferentes perfis de alunos | Nível 4–5 | IA ainda no nível 2 ou 3 |
Médicos | Diagnóstico com base em dados clínicos estruturados | Nível 2–3 | IA já cumpre com apoio humano |
Atendimento ao cliente | Responder perguntas frequentes | Nível 2 | IA já automatiza com eficácia, sob supervisão humana |
Motoristas | Navegação em ambientes urbanos imprevisíveis | Nível 4–5 | IA ainda limitada a rotas simples |
Pesquisadores | Desenvolvimento de hipóteses e interpretação de experimentos | Nível 5 | IA ainda não alcança autonomia criativa e interpretativa |
Gestores públicos | Tomada de decisão com base em dados durante crise sanitária | Nível 4–5 | IA auxilia, mas decisões ainda exigem supervisão humana |
Técnicos de laboratório | Execução de experimentos padronizados com robótica | Nível 3–4 | IA executa com supervisão humana e limitações adaptativas |
Agentes administrativos | Gerenciar estoques e logística com auxílio de IA | Nível 3 | IA apoia tarefas logísticas com precisão em ambientes controlados |
Robôs domésticos | Auxílio no preparo de refeições e manipulação de objetos | Nível 4–5 | IA realiza algumas tarefas simples, mas sem flexibilidade humana |
“Tabela elaborada pelo Tele.Síntese com base no relatório ‘Introducing the OECD AI Capability Indicators’ (OCDE, 2025).
O relatório e a ferramenta serão aperfeiçoados a partir de consultas a pesquisadores, órgãos reguladores e representantes da sociedade civil. A OCDE pretende lançar uma versão completa e atualizada do sistema em 2026, com base em novos benchmarks e testes de desempenho. Também está prevista a criação de um repositório público com evidências de avaliação das capacidades da IA.
O relatório, em inglês, pode ser lido aqui.
O post IA ainda falha em julgamento ético e raciocínio crítico, diz OCDE apareceu primeiro em TeleSíntese.