Cientistas usam inteligência artificial e Twitter para medir risco de depressão e ansiedade
Grupo da USP utiliza tecnologia de aprendizado profundo de máquinas para avaliar padrões de escrita que sugerem uma probabilidade de transtorno psiquiátrico. No futuro, a ferramenta pode alertar pais sobre problemas que os filhos estão enfrentando, acreditam os pesquisadores. A linguagem que usamos nas redes sociais pode virar um indicativo de como anda a nossa saúde mental — e as máquinas seriam capazes de encontrar padrões e sinais precoces de quadros como ansiedade e depressão.
Essa é a premissa de um trabalho que está em andamento na Escola de Artes, Ciências e Humanidades da Universidade de São Paulo (Each-USP).
Por lá, um grupo de pesquisadores está construindo um algoritmo capaz de analisar perfis do Twitter e buscar algumas pistas que sugerem transtornos psiquiátricos.
O trabalho, que está nas fases preliminares, já construiu uma base de dados que ganhou o nome de SetembroBR — uma homenagem dupla ao Setembro Amarelo, campanha de prevenção do suicídio que ocorre todos os anos, e ao mês em que o projeto se iniciou.
Comparações massivas
O cientista da computação Ivandré Paraboni, coordenador do projeto, explica que a base de dados reúne informações de 3,9 mil usuários do Twitter que afirmam terem recebido o diagnóstico de depressão ou ansiedade.
Os pesquisadores compilaram as redes de conexões desses perfis e todo o conteúdo em texto compartilhado por eles na rede social — o que totaliza cerca de 47 milhões de pequenos textos de até 280 caracteres.
Todo esse material foi comparado ao de um outro grupo de usuários do Twitter escolhidos de forma aleatória, que não demonstravam ter passado por uma avaliação médica sobre saúde mental ou estarem fazendo algum tratamento contra transtornos psiquiátricos.
“É claro que, no meio desse universo, podem ter indivíduos que mentiram ou que omitiram essas informações. Mas, como a base de dados é grande, estimamos que esses falsos positivos ou falsos negativos sejam poucos”, pondera Paraboni, que também é pesquisador associado do Centro de Inteligência Artificial, um instituto de engenharia mantido pela Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp) e pela IBM Brasil.
Essa verdadeira biblioteca de posts foi anonimizada — ou seja, os pesquisadores apagaram as referências à identitade dos usuários que escreveram os textos (como nomes próprios e de usuário), por uma questão de privacidade.
A primeira tarefa do projeto foi a de “garimpar” toda essa base de dados para remover hashtags (palavras-chave precedidas pelo símbolo #), menções a outras contas (que aparecem com um @), caracteres fora do padrão e hiperlinks.
Depois, os dois grupos foram comparados. Além de avaliar os textos compartilhados pelo Twitter, os pesquisadores também conseguiram analisar a rede de contatos dos usuários, incluindo as contas que cada um deles segue.
Paraboni ressalta a importância de fazer uma iniciativa como essa em língua portuguesa.
“Já existem outros estudos desse tipo feitos no exterior, mas eles analisam prioritariamente o conteúdo em inglês”, explica.
E, claro, existe uma série de particularidades culturais e linguísticas — os padrões que se aplicam nesses países podem ser completamente diferentes do que é comum no Brasil, entre falantes do português.
“Alguém precisa desenvolver essa infraestrutura computacional, para que nós tenhamos acesso a essas ferramentas adaptadas para o português”, complementa o pesquisador.
Os resultados
Os modelos encontraram alguns padrões iniciais, que podem indicar uma propensão a doenças como ansiedade e depressão.
O primeiro deles é uma maior frequência de postagens sobre si mesmo observada no grupo que declarava ter transtornos psiquiátricos — por exemplo, com a utilização de verbos e pronomes — “eu”, “me”, “mim” — na primeira pessoa.
Outra constatação foi a de que esses indivíduos recorrem bastante a emojis e símbolos gráficos que simbolizam o coração.
Além disso, temas como morte, crise e psicologia também são mais comuns nessas contas.
Para completar, indivíduos com ansiedade ou depressão tendem a seguir outras páginas e usuários que tratem do tema — por exemplo, grupos de pacientes ou o perfil de uma celebridade que anunciou um diagnóstico recente de um desses transtornos.
“É importante explicar que os padrões encontrados pelos modelos de aprendizagem profunda podem ser literalmente qualquer coisa”, destaca Paraboni.
“A forma como a pessoa se expressa nas redes sociais não é necessariamente igual ao jeito que ela fala na vida real ou no consultório do psiquiatra”, complementa.
Ou seja, é possível que postagens em mídias sociais como o Twitter revelem traços e características diferentes daquelas que aparecem durante uma avaliação formal com um médico.
“A maioria dos padrões que encontramos são abstratos e não há uma explicação para eles nas teorias da psicologia”, ressalta Paraboni.
Ou seja, pode até ser relativamente fácil especular os motivos que fazem alguém com ansiedade ou depressão falar mais sobre si, até porque isso também é observado durante o contato com um profissional da saúde.
Porém, outros aspectos e comportamentos, como distribuir símbolos de coração ou seguir contas com a mesma temática, não são coisas que vão aparecer tão facilmente durante o diálogo no consultório.
Os próximos passos
Agora que as primeiras versões do modelo de inteligência artificial do SetembroBR já foram criadas, o grupo de especialistas da Each-USP começa a planejar os próximos passos do projeto.
Uma das metas é ampliar a base de dados que será avaliada e refinar as técnicas de aprendizado profundo, para que os resultados melhorem e as análises se tornem mais precisas.
Questionado pela BBC News Brasil se a meta é fazer com que essa ferramenta seja capaz de diagnosticar casos de ansiedade e depressão no futuro, Paraboni pede cuidado.
“Essa é uma das áreas mais perigosas quando pensamos no uso dessas novas tecnologias”, pondera.
“Ninguém quer ser diagnosticado erroneamente ou, pelo contrário, ver um quadro como depressão ou ansiedade passar despercebido.”
“Eu prefiro ver essas bases de dados mais como um complemento, um auxílio, ou um primeiro indicativo de que a pessoa pode estar com alguma questão de saúde mental.”
O cientista da computação antevê que o trabalho possa servir, daqui a alguns anos, para alertar os pais quando o filho estiver enfrentando algum problema.
“Quem sabe isso não possa virar uma ferramenta que analise as redes sociais de crianças e adolescentes e ajude a indicar alguma questão comportamental que mereça atenção e a avaliação de um profissional da saúde?”, especula.
A junção de inteligência artificial, redes sociais e saúde mental não poderia vir num momento mais oportuno.
Primeiro, nunca se falou tanto sobre aprendizado de máquinas quanto agora, momento em que ferramentas como o Chat GPT chegam ao público e provocam grandes discussões na sociedade.
Segundo, o uso das mídias sociais segue em alta — e o Brasil é o terceiro país com o maior número de usuários ativos dessas plataformas em todo o mundo, atrás apenas de Índia e Indonésia.
De acordo com um levantamento publicado em março pela Comscore, os brasileiros mantêm 131 milhões de contas ativas nas redes sociais e passam 46 horas (ou quase dois dias inteiros) do mês mexendo em YouTube, Instagram, Twitter, TikTok e afins.
Para completar, os transtornos psiquiátricos também estão em ascensão. A Organização Mundial da Saúde (OMS) estima que a depressão afeta 3,8% da população (ou 280 milhões de pessoas).
A entidade também aponta que esses números cresceram ainda mais nos últimos anos: houve um aumento de 25% na prevalência de ansiedade e depressão desde o início da pandemia de covid-19.
Essa é a premissa de um trabalho que está em andamento na Escola de Artes, Ciências e Humanidades da Universidade de São Paulo (Each-USP).
Por lá, um grupo de pesquisadores está construindo um algoritmo capaz de analisar perfis do Twitter e buscar algumas pistas que sugerem transtornos psiquiátricos.
O trabalho, que está nas fases preliminares, já construiu uma base de dados que ganhou o nome de SetembroBR — uma homenagem dupla ao Setembro Amarelo, campanha de prevenção do suicídio que ocorre todos os anos, e ao mês em que o projeto se iniciou.
Comparações massivas
O cientista da computação Ivandré Paraboni, coordenador do projeto, explica que a base de dados reúne informações de 3,9 mil usuários do Twitter que afirmam terem recebido o diagnóstico de depressão ou ansiedade.
Os pesquisadores compilaram as redes de conexões desses perfis e todo o conteúdo em texto compartilhado por eles na rede social — o que totaliza cerca de 47 milhões de pequenos textos de até 280 caracteres.
Todo esse material foi comparado ao de um outro grupo de usuários do Twitter escolhidos de forma aleatória, que não demonstravam ter passado por uma avaliação médica sobre saúde mental ou estarem fazendo algum tratamento contra transtornos psiquiátricos.
“É claro que, no meio desse universo, podem ter indivíduos que mentiram ou que omitiram essas informações. Mas, como a base de dados é grande, estimamos que esses falsos positivos ou falsos negativos sejam poucos”, pondera Paraboni, que também é pesquisador associado do Centro de Inteligência Artificial, um instituto de engenharia mantido pela Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp) e pela IBM Brasil.
Essa verdadeira biblioteca de posts foi anonimizada — ou seja, os pesquisadores apagaram as referências à identitade dos usuários que escreveram os textos (como nomes próprios e de usuário), por uma questão de privacidade.
A primeira tarefa do projeto foi a de “garimpar” toda essa base de dados para remover hashtags (palavras-chave precedidas pelo símbolo #), menções a outras contas (que aparecem com um @), caracteres fora do padrão e hiperlinks.
Depois, os dois grupos foram comparados. Além de avaliar os textos compartilhados pelo Twitter, os pesquisadores também conseguiram analisar a rede de contatos dos usuários, incluindo as contas que cada um deles segue.
Paraboni ressalta a importância de fazer uma iniciativa como essa em língua portuguesa.
“Já existem outros estudos desse tipo feitos no exterior, mas eles analisam prioritariamente o conteúdo em inglês”, explica.
E, claro, existe uma série de particularidades culturais e linguísticas — os padrões que se aplicam nesses países podem ser completamente diferentes do que é comum no Brasil, entre falantes do português.
“Alguém precisa desenvolver essa infraestrutura computacional, para que nós tenhamos acesso a essas ferramentas adaptadas para o português”, complementa o pesquisador.
Os resultados
Os modelos encontraram alguns padrões iniciais, que podem indicar uma propensão a doenças como ansiedade e depressão.
O primeiro deles é uma maior frequência de postagens sobre si mesmo observada no grupo que declarava ter transtornos psiquiátricos — por exemplo, com a utilização de verbos e pronomes — “eu”, “me”, “mim” — na primeira pessoa.
Outra constatação foi a de que esses indivíduos recorrem bastante a emojis e símbolos gráficos que simbolizam o coração.
Além disso, temas como morte, crise e psicologia também são mais comuns nessas contas.
Para completar, indivíduos com ansiedade ou depressão tendem a seguir outras páginas e usuários que tratem do tema — por exemplo, grupos de pacientes ou o perfil de uma celebridade que anunciou um diagnóstico recente de um desses transtornos.
“É importante explicar que os padrões encontrados pelos modelos de aprendizagem profunda podem ser literalmente qualquer coisa”, destaca Paraboni.
“A forma como a pessoa se expressa nas redes sociais não é necessariamente igual ao jeito que ela fala na vida real ou no consultório do psiquiatra”, complementa.
Ou seja, é possível que postagens em mídias sociais como o Twitter revelem traços e características diferentes daquelas que aparecem durante uma avaliação formal com um médico.
“A maioria dos padrões que encontramos são abstratos e não há uma explicação para eles nas teorias da psicologia”, ressalta Paraboni.
Ou seja, pode até ser relativamente fácil especular os motivos que fazem alguém com ansiedade ou depressão falar mais sobre si, até porque isso também é observado durante o contato com um profissional da saúde.
Porém, outros aspectos e comportamentos, como distribuir símbolos de coração ou seguir contas com a mesma temática, não são coisas que vão aparecer tão facilmente durante o diálogo no consultório.
Os próximos passos
Agora que as primeiras versões do modelo de inteligência artificial do SetembroBR já foram criadas, o grupo de especialistas da Each-USP começa a planejar os próximos passos do projeto.
Uma das metas é ampliar a base de dados que será avaliada e refinar as técnicas de aprendizado profundo, para que os resultados melhorem e as análises se tornem mais precisas.
Questionado pela BBC News Brasil se a meta é fazer com que essa ferramenta seja capaz de diagnosticar casos de ansiedade e depressão no futuro, Paraboni pede cuidado.
“Essa é uma das áreas mais perigosas quando pensamos no uso dessas novas tecnologias”, pondera.
“Ninguém quer ser diagnosticado erroneamente ou, pelo contrário, ver um quadro como depressão ou ansiedade passar despercebido.”
“Eu prefiro ver essas bases de dados mais como um complemento, um auxílio, ou um primeiro indicativo de que a pessoa pode estar com alguma questão de saúde mental.”
O cientista da computação antevê que o trabalho possa servir, daqui a alguns anos, para alertar os pais quando o filho estiver enfrentando algum problema.
“Quem sabe isso não possa virar uma ferramenta que analise as redes sociais de crianças e adolescentes e ajude a indicar alguma questão comportamental que mereça atenção e a avaliação de um profissional da saúde?”, especula.
A junção de inteligência artificial, redes sociais e saúde mental não poderia vir num momento mais oportuno.
Primeiro, nunca se falou tanto sobre aprendizado de máquinas quanto agora, momento em que ferramentas como o Chat GPT chegam ao público e provocam grandes discussões na sociedade.
Segundo, o uso das mídias sociais segue em alta — e o Brasil é o terceiro país com o maior número de usuários ativos dessas plataformas em todo o mundo, atrás apenas de Índia e Indonésia.
De acordo com um levantamento publicado em março pela Comscore, os brasileiros mantêm 131 milhões de contas ativas nas redes sociais e passam 46 horas (ou quase dois dias inteiros) do mês mexendo em YouTube, Instagram, Twitter, TikTok e afins.
Para completar, os transtornos psiquiátricos também estão em ascensão. A Organização Mundial da Saúde (OMS) estima que a depressão afeta 3,8% da população (ou 280 milhões de pessoas).
A entidade também aponta que esses números cresceram ainda mais nos últimos anos: houve um aumento de 25% na prevalência de ansiedade e depressão desde o início da pandemia de covid-19.