GenAI e Open Source: catalisadores do próximo capítulo do progresso humano

IA generativa, genAI, A.C.Camargo, tivit

No decorrer da história humana, o progresso foi frequentemente definido pela matriz tecnológica dominante. Na Era do Bronze, civilizações como acadianos e hititas viveram seu apogeu. Já na Era do Ferro, mesopotâmicos e egípcios lideraram inovações até a chegada do aço, que não só trouxe ferramentas e armas mais resistentes, mas também transformou o transporte e a infraestrutura. Aquedutos, embarcações e estruturas como parlamentos moldaram sociedades e impulsionaram o comércio, a comunicação e as manifestações socioculturais de impérios como o grego e o romano.

Essa breve introdução histórica reflete como os avanços tecnológicos atuais, como a inteligência artificial generativa (GenAI) e os grandes modelos de linguagem (LLMs), seguem princípios ancestrais: a construção de sistemas capazes de integrar o conhecimento acumulado em um arranjo seguro e propício à inovação. Apesar das diferenças entre épocas, o objetivo permanece o mesmo: criar métodos que potencializem o progresso humano.

No passado, aquedutos garantiram o abastecimento e a sustentabilidade de cidades, embarcações possibilitaram a expansão de rotas comerciais e culturais, e parlamentos criaram espaços institucionais para debates e  deliberações. Essas estruturas não apenas transformaram a organização social, mas também facilitaram o intercâmbio de ideias, o desenvolvimento econômico, a organização política, a cultura e o conhecimento, bem como a integração e expansão territorial, contribuindo para o avanço das civilizações.

Hoje, as disciplinas emergentes da inteligência artificial seguem esse legado, aumentando a precisão de tecnologias avançadas e revolucionando diversas áreas do mundo contemporâneo. Seja otimizando processos industriais, aprimorando procedimentos médicos ou facilitando o acesso de estudantes a conteúdos acadêmicos. A Era da Inteligência Artificial inaugura um novo paradigma: criar sistemas inteligentes capazes de fornecer informações de alta qualidade, atendendo às necessidades de públicos cada vez mais específicos com eficiência e confiabilidade. 

Leia também: Violações de dados geram perda de 18% no PIB nacional, diz INCC 

GenAI e Open Source: O futuro dos modelos de inteligência artificial?

O frenesi contemporâneo pela inteligência artificial advém da modalidade que redesenhou o mundo em 2022, a GenAI. Sistemas como o ChatGPT, Gemini e MidJourney são alimentados por vastos repositórios de dados estruturados e não estruturados. Esses repositórios incluem desde documentos públicos amplamente reconhecidos até informações de origem questionável e, em alguns casos, inverídicas. Além de espalhar fatos equivocados (alucinações) e, muitas vezes incompletos, plataformas de GenAI também podem cometer grandes equívocos e, a depender das demandas de usuários, podem gerar respostas autorais sem embasamento confiável em seus registros, contribuindo para a disseminação de desinformação a seus usuários.  

De acordo com um estudo da Revista Nature (AI hallucination: towards a comprehensive classification of distorted information in artificial intelligence-generated content), o fenômeno da alucinação da inteligência artificial é característica intrínseca das redes neurais . De acordo com o grupo de pesquisadores, foram identificadas pelo menos oito categorias gerais de erros forçados por plataformas de GenAI e mais 31 subdivisões derivadas de problemas lógicos, matemáticos, de sobreajuste e fabricação infundada de informações. Na avaliação desses acadêmicos, o maior desafio enfrentado por desenvolvedores e cientistas de dados é criar consistência e segurança para um ambiente relativamente novo, em constante expansão e com pouco crivo quanto à qualidade dos dados trabalhados.

De fato, um dos maiores impasses na evolução da disciplina está na opacidade com que seus modelos de inteligência artificial são treinados. Diferentemente de iniciativas colaborativas e projetos públicos de desenvolvimento de TI, hoje é virtualmente impossível auferir a procedência e a qualidade dos dados utilizados pela maior parte dos grandes players da atualidade, o que coloca em xeque a credibilidade de sistemas utilizados por centenas de milhões de usuários. Felizmente, desenvolvedores de LLMs têm integrado práticas e modelos open source para criar sistemas mais robustos, personalizáveis e acessíveis, enquanto organizações avaliam a viabilidade financeira e a segurança desses avanços para aplicações internas e comerciais.

Custos otimizados, modelos flexíveis, adaptáveis e resilientes e, mais importante, uma comunidade apaixonada pronta para auxiliar o seu sistema de GenAI. Estes são alguns dos benefícios apontados por um paper (AI Transparency in the Age of LLMs: A Human-Centered Research Roadmap) da MIT Press, editora do Massachusetts Institute of Technology, o qual destaca que a adoção de código aberto no treinamento de interfaces de inteligência artificial é um marco inicial para o desenvolvimento de uma tecnologia alinhada a processos e valores humanos, como transparência e ética. Essa abordagem tem potencial para transformar tanto o ambiente de negócios quanto áreas historicamente carentes de inovação, como educação, transporte e governança. Portanto, a implementação de código aberto no desenvolvimento de IA não apenas facilita a transparência e a ética, mas também promove a integração de conhecimentos diversos, beneficiando múltiplos setores da sociedade.

Não por acaso, na conclusão do artigo, os pesquisadores apontam que o open source fornecerá os subsídios para a próxima fase de evolução da disciplina, exigindo não apenas plataformas mais inteligentes e personalizadas às necessidades de diferentes públicos, mas também um avanço significativo nos processos de desenvolvimento, integrando segurança e operações aos modelos e aplicações. A implementação eficaz dessas práticas impacta diretamente os modelos de negócios de empresas que utilizam a GenAI, bem como daquelas que fornecem sistemas para o mercado.  E entre diferentes players, a empresa de Mark Zuckerberg, a Meta, tem se destacado ao adotar uma estratégia de código aberto para os seus modelos de IA. 

Código aberto: solução ou meio para a inovação? 

Disponível no Instagram, Facebook e no WhatsApp, o Llama é um modelo de linguagem de grande porte disponibilizado como open source, permitindo que pesquisadores, desenvolvedores, cientistas de dados e organizações o utilizem e adaptem conforme suas necessidades. Essa iniciativa promove uma cultura de colaboração e inovação aberta no campo da inteligência artificial. No entanto, não há detalhes sobre como o modelo foi treinado. Esta falta de transparência pode levar a riscos legais por seus vieses ou proteções intelectuais. 

O código aberto não é, por si só, uma solução definitiva para a inovação na GenAI, mas sim um meio poderoso que facilita e acelera o avanço nesse campo. Ele desempenha um papel fundamental ao permitir que mais pessoas, instituições e empresas colaborem, experimentem e aprimorem modelos de inteligência artificial de maneira acessível, segura e transparente. Ao disponibilizar modelos, frameworks e ferramentas de IA, o código aberto democratiza o acesso à tecnologia, possibilitando que desenvolvedores, cientistas de dados, acadêmicos e empresas estudem seus aspectos e contribuam com melhorias significativas. Além disso, promove a colaboração global, conectando especialistas de diferentes áreas do conhecimento e regiões para criar soluções mais criativas e robustas.

A personalização é outro aspecto crucial: empresas e pesquisadores podem adaptar modelos open source para atender a necessidades específicas, o que muitas vezes seria inviável com soluções proprietárias. Isso também acelera o desenvolvimento, permitindo que equipes aproveitem trabalhos já existentes, economizando tempo e recursos valiosos. O código aberto oferece ainda maior transparência, uma vez que seus processos podem ser auditados, corrigidos e melhorados por uma comunidade global, promovendo confiança e confiabilidade nos modelos criados. 

Em resumo, o código aberto é um meio estratégico para fomentar a inovação na GenAI, fornecendo uma base colaborativa para o avanço tecnológico. O sucesso dessa inovação depende de como essas ferramentas são aplicadas e integradas a processos criativos, éticos e tecnicamente sólidos. Em última análise, o open source funciona como uma poderosa alavanca para a inovação que ocorre quando combinada com visão, conhecimento especializado e esforço coordenado.

Assim, retornando ao panorama histórico apresentado no início deste artigo, o sucesso dos poderosos reinos e grandes impérios não se baseou apenas na hegemonia econômica ou no poderio militar. Fatores como a sofisticação tecnológica e a eficiência administrativa desempenharam papéis cruciais em sua ascensão e estabilidade. O investimento em conhecimento — seja científico, tecnológico ou administrativo — também se mostrou um elemento fundamental para impulsionar o progresso e garantir a competitividade, tanto no passado quanto no presente. Contudo, é essencial reconhecer que a história é complexa e multifacetada, e as lições que dela extraímos estão intrinsecamente ligadas à forma como interpretamos seus inúmeros capítulos.

Em um momento de inflexão e transformação humana impulsionado pela inteligência artificial generativa, cabe a nós decidir como utilizar essa tecnologia de forma responsável, ética e visionária. Devemos escolher entre ser consumidores passivos das inovações ou assumir um papel ativo no direcionamento de seu desenvolvimento e aplicabilidade. Essa escolha implica em promover a ética e a transparência, garantindo que a IA seja usada para beneficiar a sociedade, respeitando valores como privacidade, equidade e inclusão, enquanto evitamos vieses e práticas discriminatórias. Também exige investir em educação e capacitação, preparando as pessoas para se adaptarem às mudanças no mercado de trabalho, equipando-as com habilidades tecnológicas e competências humanas, como criatividade, empatia e pensamento crítico.

Além disso, é essencial fomentar a inovação sustentável, utilizando a IA para enfrentar problemas globais, como mudanças climáticas, desigualdade social e crises de saúde, em vez de limitar seu uso a interesses puramente econômicos. Precisamos preservar a humanidade no centro de todas as decisões tecnológicas, garantindo que a IA amplie nosso potencial humano e não o substitua, priorizando o bem-estar, as conexões interpessoais e a qualidade de vida. Por fim, é necessário adotar uma visão colaborativa — e aqui as lições geradas pelo modelo open source são de grande valia — trabalhando em conjunto como indivíduos, empresas, governos e comunidades para estabelecer regulações equilibradas que incentivem a inovação, mas que também protejam a sociedade de riscos e abusos.

Em última análise, cabe a nós decidir se permitiremos que a IA evolua de forma desregulada e potencialmente prejudicial ou se iremos guiá-la para se tornar um motor do progresso humano. Essa decisão moldará não apenas o futuro da tecnologia, mas também o porvir da própria humanidade.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!