Zoom parte para tentativa escancarada de coleta de dados de IA generativa; Empresas, cuidado

zoom

Quando o Zoom modificou seus termos de serviço no início deste mês – em uma tentativa de deixar os executivos tranquilos de que não usaria os dados da plataforma para treinar modelos de IA generativa – logo causou uma grande controvérsia. Então, a empresa “revisou” os termos de serviço e deixou em vigor formas pelas quais ainda pode obter acesso completo aos dados do usuário.

(A Computerworld tentou entrar em contato com o Zoom repetidas vezes, mas sem sucesso, para esclarecer o que as mudanças realmente significam.)

Antes de mergulharmos na linguagem jurídica – e nas palavras evasivas do Zoom para sugerir falsamente que não estava fazendo o que obviamente estava fazendo – deixe-me levantar uma pergunta mais crítica: existe alguém no mundo de plataformas de vídeochamada que não esteja fazendo isso? Microsoft? Google? São duas empresas que nunca encontraram um conjunto de dados que não amassem.

Um dos grandes problemas com o treinamento de IA generativa é que ela não pode ser prevista. Ela é propensa a “alucinações” e, apesar da crença amplamente aceita de que ficará melhor e mais precisa por meio de várias atualizações ao longo do tempo, o oposto aconteceu. A precisão do ChatGPT, da OpenAI, despencou na versão mais recente.

Uma vez que os dados entram, não há como prever o que sairá. A Amazon aprendeu essa lição no início deste ano, quando percebeu que o ChatGPT estava revelando dados internos confidenciais da companhia em respostas. Os engenheiros da Amazon estavam testando o ChatGPT, alimentando-o com dados internos e pedindo que analisasse esses dados. Ele analisou tudo corretamente, depois aprendeu com isso – e depois se sentiu à vontade para compartilhar o que aprendeu com todos, em todos os lugares.

Leia mais: O que é a IA generativa?

Com esse cenário em mente, considere uma típica chamada do Zoom. As empresas o utilizam para reuniões internas onde os planos e problemas sensíveis são discutidos em detalhes. Os médicos o usam para discussões com pacientes.

Isto é o que o Zoom diz em seus termos de serviço revisados:

“O Conteúdo do Cliente não inclui quaisquer dados de telemetria, dados de uso do produto, dados de diagnóstico e conteúdo ou dados semelhantes que o Zoom coleta ou gera em conexão com o uso dos Serviços ou Software por você ou seus Usuários Finais. Entre você e o Zoom, todos os direitos, título e interesse em relação aos Dados Gerados pelo Serviço, e todos os Direitos de Propriedade neles, pertencem exclusivamente ao Zoom e são retidos exclusivamente pelo Zoom. Você concorda que o Zoom compila e pode compilar Dados Gerados pelo Serviço com base no Conteúdo do Cliente e no uso dos Serviços e Software. Você concorda com o acesso, uso, coleta, criação, modificação, distribuição, processamento, compartilhamento, manutenção e armazenamento de Dados Gerados pelo Serviço pelo Zoom para qualquer finalidade, na medida e na forma permitida pela lei aplicável, incluindo para o desenvolvimento de produtos e serviços, marketing, análises, controle de qualidade, aprendizado de máquina ou inteligência artificial (inclusive para fins de treinamento e ajuste de algoritmos e modelos), treinamento, testes, melhoria dos Serviços, Software ou outros produtos, serviços e software do Zoom, ou qualquer combinação desses, e conforme especificado neste Contrato.”

A menos que eu tenha deixado algo passar, os advogados do Zoom aparentemente esqueceram de incluir os direitos completos sobre o seu primogênito. (Eles chegarão lá.) Então, eles adicionaram o seguinte:

“O Zoom pode redistribuir, publicar, importar, acessar, usar, armazenar, transmitir, revisar, divulgar, preservar, extrair, modificar, reproduzir, compartilhar, usar, exibir, copiar, distribuir, traduzir, transcrever, criar obras derivadas e processar o Conteúdo do Cliente: Você concorda em conceder e por meio deste concede ao Zoom uma licença perpétua, mundial, não exclusiva, isenta de royalties, sublicenciável e transferível e todos os outros direitos necessários ou necessários para redistribuir, publicar, importar, acessar, usar, armazenar, transmitir, revisar, divulgar, preservar, extrair, modificar, reproduzir, compartilhar, usar, exibir, copiar, distribuir, traduzir, transcrever, criar obras derivadas e processar o Conteúdo do Cliente e executar todos os atos em relação ao Conteúdo do Cliente que possam ser necessários para que o Zoom forneça os Serviços a você, incluindo para dar suporte aos Serviços; (ii) para o desenvolvimento de produtos e serviços, marketing, análises, controle de qualidade, aprendizado de máquina, inteligência artificial, treinamento, testes, melhoria dos Serviços, Software ou outros produtos, serviços e software do Zoom, ou qualquer combinação desses; e (iii) para qualquer outro fim relacionado a qualquer uso ou outro ato permitido de acordo com a Seção 10.3.”

Leia também: O que está acontecendo com o Google Assistente?

Ok. E então, para dar umas risadas, eles digitaram: “No entanto, o Zoom não usará o Conteúdo do Cliente de áudio, vídeo ou chat para treinar nossos modelos de inteligência artificial sem o seu consentimento“. Sério mesmo? Se eles tivessem excluído as palavras anteriores, talvez isso fosse legítimo.

Existem duas brechas aqui. “Sem o seu consentimento”. Com base em tudo o que foi dito anteriormente, tal consentimento é concedido apenas pelo uso do produto. Perguntei repetidamente ao Zoom onde os usuários poderiam ir no site (ou no aplicativo) para retirar o consentimento para qualquer treinamento de IA. Nenhuma resposta. Eles oferecem a retirada de consentimento para alguns serviços altamente limitados, como resumir notas de reuniões. Mas, no geral? Não tanto.

O mecanismo de consentimento ao usar o produto é particularmente problemático para não-clientes. Digamos que uma empresa pague e hospede uma chamada e convide clientes, alguns contratados e outros parceiros para participar da reunião. Esses convidados entendem que qualquer coisa que eles digam pode ser usada para treinar a IA generativa? Além de recusar o convite, como um convidado pode recusar o consentimento?

A outra brecha envolve a palavra “conteúdo”. Conforme descrito pelo Zoom, há muitos metadados e outras informações que ele coleta e que não considera estritamente como conteúdo. O Zoom discutiu isso em um post de seu blog: “Há certas informações sobre como nossos clientes, em conjunto, usam nosso produto – telemetria, dados de diagnóstico, etc. Isso é comumente conhecido como dados gerados pelo serviço. Queríamos ser transparentes de que consideramos isso como nossos dados”.

A resistência a essa coleta de dados pode ser inútil. O Zoom não está recuando e, até que concorrentes tomem uma posição explícita sobre esse tipo de treinamento de IA generativa, isso continuará acontecendo repetidamente.

Kathleen Mullin, uma CISO veterana (incluindo o Aeroporto Internacional de Tampa e os Centros de Tratamento do Câncer da América) que agora realiza trabalho fracionado como CISO, disse que duvida que a Microsoft faria o mesmo que o Zoom está tentando fazer.

A Microsoft “é a criadora de grandes modelos de linguagem, de qualquer maneira, então não sei se eles precisam dos dados do Teams”, disse Mullin. Esse é um ponto válido, mas muitas empresas historicamente nunca deixaram o fato de “não precisarmos desses dados” impedir que elas usem alguns dados.

Veja mais: IA generativa pode ser ferramenta essencial para pessoas com deficiência visual

Scott Castle, que atuou por quatro anos como Diretor de Estratégia na empresa de IA Sisense antes de deixar a empresa em julho, disse que achou os esforços do Zoom desconfortantes. “Os CIOs não estão prestando tanta atenção” em como os dados dos parceiros podem ser usados, disse ele. “Eles estão apenas tentando estar alguns anos à frente do mercado”.

“O problema aqui é que é o usuário que criou os dados subjacentes e o Zoom está dizendo: ‘Se você usar (nosso serviço), queremos uma parte dessa ação’. É uma excessiva intromissão de uma maneira que tenta encerrar a conversa sobre quem é o criador de valor: ‘Você ainda é dono do seu conteúdo, mas nós somos donos de tudo sobre o seu conteúdo’. Acho que estão tentando dividir as coisas entre o seu e o meu de uma maneira profundamente ingênua. ‘Você nominalmente é dono da coisa sem valor que você criou, mas eu sou dono de tudo o mais, incluindo os pixels e todas as informações intrínsecas naquela imagem’.

“E se o Zoom mais tarde falir? Para onde esses dados vão?”

Pam Baker, especialista em análise de dados e autora de “Data Divination: Big Data Strategies“, viu o movimento do Zoom como potencialmente ainda mais perigoso.

“A nova política de coleta de dados do Zoom para IA, sem opção de exclusão, é um sintoma de um problema muito maior”, disse Baker. “Estamos testemunhando o esforço de coleta de dados mais abrangente já visto, tudo em nome do treinamento de IA em cada momento, cada aspecto, cada pensamento e ação, e cada ideia que as pessoas têm – sem mencionar a coleta de propriedade intelectual, trabalhos protegidos por direitos autorais e informações proprietárias. Isso é o que movimentos como a IA Responsável deveriam impedir, mas se as leis não forem promulgadas rapidamente para evitar a colheita, a privacidade já estará morta”.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!