O que é Federated Learning e como o método pode contribuir para a área da saúde?

saúde, telemedicina, hospitais privados, Federated Learning

Na era digital, nossos dados são o bem mais precioso que possuímos. Essa afirmação foi consolidada em 2017, quando a revista britânica The Economist classificou os dados como “o recurso mais valioso do mundo desde o petróleo”. Desde então, a tese segue comprovando sua veracidade. Segundo um estudo da Fortune Business Insights, a estimativa é que a indústria global de Big Data atingirá uma receita de US$ 549,7 bilhões em 2028.

Essa previsão reforça a importância, cada vez maior, do aproveitamento dos dados para guiar decisões e estratégias das empresas.  Por outro lado, o risco de vazamento dos dados e ataques cibernéticos causam uma grande preocupação para as organizações. E na área da saúde, na qual os dados são mais sensíveis, essa ameaça é ainda pior.

Vamos imaginar que aconteça um vazamento de dados em um dos principais hospitais do país, expondo todos os pacientes da instituição. Os autores do crime cibernético teriam acesso ao histórico de doenças, procedimentos médicos e outras questões que podem comprometer a integridade dos pacientes, o que seria uma quebra total de privacidade. Por isso, organizações médicas devem zelar ainda mais pela segurança de seus dados.

No entanto, precisamos falar sobre outro ponto: para realizar novas descobertas e inovações na área, são necessários conjuntos de dados extensos e diversos para a realização de estudos. Cada hospital possui o seu, que é mantido em segurança e não pode ser compartilhado com outras instituições, o que acaba dificultando alguns estudos em parceria. Mas, e se eu disser que é possível fazer essa troca de uma maneira segura e que ainda garanta a confidencialidade dos dados dos pacientes? Essa solução se chama Aprendizado Federado (do inglês: Federated Learning).

O que é Federated Learning?

Para falarmos sobre Federated Learning, é preciso explicar o que é Aprendizado de Máquina (do inglês: Machine Learning). Essa área de estudo de Inteligência Artificial busca simular o processo humano de obtenção de conhecimento. A partir de um conjunto inicial de dados históricos relacionados a um determinado problema, um algoritmo realiza uma série de operações para aprender um modelo matemático que depois será capaz de fazer predições com dados novos.

O aprendizado de máquina exige que uma grande quantidade de dados sejam armazenados e treinados de maneira centralizada, o que pode ser custoso e gerar problemas de segurança em relação à privacidade, fazendo com que qualquer vazamento seja um risco altíssimo. Além disso, dependendo da quantidade de dados gerados a comunicação entre o servidor e as fontes de dados pode se tornar lenta, gerando uma sobrecarga na rede.

O aprendizado federado busca resolver essas questões por meio do aprendizado colaborativo, treinamento distribuído e sem o compartilhamento de dados entre instituições. Ou seja, os dados gerados nunca deixam a instituição a qual pertencem, sendo treinados localmente. No aprendizado federado os modelos são enviados a um servidor central, onde será feito o processo de agregação de todos os modelos pertencentes a cada uma das instituições participantes da federação. O modelo resultante será então enviado novamente a cada instituição, e o processo segue de maneira iterativa.

Aplicação do Federated Learning na saúde

A área da saúde já utiliza soluções baseadas em Machine Learning, principalmente nos atendimentos online, em que o sistema direciona o paciente de acordo com os sintomas descritos. Porém, como a área da saúde lida com dados extremamente sensíveis, é muito difícil realizar o compartilhamento entre instituições, o que seria necessário em alguns casos para realizar pesquisas e inovações no setor.

Portanto, o Federated Learning oferece uma grande oportunidade para melhorar o desempenho dos modelos existentes, preservar a privacidade dos dados e promover benefícios para todas as instituições envolvidas. Assim, é possível explorar um potencial ainda maior de descobertas na área da saúde sem que seja necessário a transmissão de informações que possam comprometer a privacidade dos pacientes.

Por exemplo, caso uma instituição de saúde esteja buscando usar técnicas de aprendizado de máquina desenvolver ou aprimorar um sistema que identifique diferentes tipos de câncer, por meio da análise dos resultados de uma biópsia, a organização poderia alcançar esse objetivo fazendo uso da colaboração com diferentes organizações, gerando um leque de possibilidades muito maior, o que favorece um resultado mais preciso e eficiente.

Para que o processo funcione, é preciso seguir algumas premissas importantes, como garantir que os dados gerados pelas diferentes fontes sejam padronizados e o processo de coleta seja o mesmo. Não há dúvidas de que o método poderia trazer benefícios em inúmeras áreas, principalmente na saúde, que está sempre em busca de inovações.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!