StarCoder 2 é lançado com foco em transparência e desempenho aprimorado

Desenvolvimento de código, desenvolvedor, código, IA, inteligência artificial, StarCoder 2

Em resposta à crescente demanda por soluções acessíveis e éticas de codificação impulsionada por inteligência artificial, foi lançado o StarCoder 2, uma colaboração entre ServiceNow, Nvidia e Hugging Face. Este modelo de geração de código promete melhorias notáveis, impulsionadas por um treinamento robusto com 67,5 terabytes de dados, quatro vezes mais do que seu antecessor.

O StarCoder 2 se destaca por sua abordagem transparente. Ao contrário de alguns geradores que podem introduzir vulnerabilidades de segurança, este novo modelo foi treinado apenas em dados licenciados da Software Heritage, organização sem fins lucrativos que fornece serviços de arquivo para código, garantindo conformidade legal e mitigação de riscos de violação de direitos autorais.

“O StarCoder 2 foi criado especialmente para desenvolvedores que precisam construir aplicativos rapidamente”, disse Harm de Vries, chefe da equipe de Desenvolvimento do StarCoder 2 da ServiceNow, ao TechCrunch em uma entrevista. “Com o StarCoder 2, os desenvolvedores podem usar suas capacidades para tornar a codificação mais eficiente sem sacrificar velocidade ou qualidade”.

Este lançamento, composto por três variantes, promete melhorias significativas em comparação com seu antecessor, com desempenho aprimorado e custos operacionais reduzidos, segundo as empresas. De acordo com um comunicado da Nvidia, “a família StarCoder2 inclui modelos de parâmetros 3B, 7B e 15B, oferecendo flexibilidade para escolher aquele que se adapta ao seu caso de uso e atende aos seus recursos de computação”.

Leia também: CEO do Google reconhece problemas com Gemini e promete correções

O modelo também oferece uma flexibilidade no ajuste de seu desempenho, podendo ser otimizado em apenas algumas horas com o uso de uma GPU, como a Nvidia A100. Essa capacidade permite a criação rápida de uma variedade de aplicativos, desde chatbots até assistentes pessoais de codificação. Além disso, o treinamento em um conjunto de dados mais amplo e diversificado, que abrange aproximadamente 619 linguagens de programação, promete aumentar sua capacidade de fazer previsões precisas e contextualizadas.

Apesar das inovações, críticos apontam questões éticas e legais relacionadas à licença do StarCoder 2. A licença, chamada BigCode Open RAIL-M 1.0, impõe restrições “leves” e, embora menos restritiva, ainda pode ser um ponto de controvérsia.

A Hugging Face, por meio de um porta-voz, afirmou que a licença foi cuidadosamente elaborada para garantir conformidade com as leis e regulamentações atuais. No entanto, alguns questionam a clareza dos requisitos da licença e sua conformidade com regulamentações de IA, como a Lei de IA da União Europeia.

Apesar dessas considerações, o StarCoder 2 representa um passo significativo na evolução dos geradores de código de IA, buscando equilibrar eficiência, ética e transparência em um mercado em rápida expansão. O código-fonte, modelos e dados de treinamento estão disponíveis no GitHub, incentivando desenvolvedores a explorarem e contribuírem para o avanço da tecnologia.

*Com informações do TechCrunch

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!