O que é a Aprendizagem Federada?
A aprendizagem federada é um paradigma de treino de machine learning onde os modelos são treinados em dados distribuídos sem mover os dados para uma localização central. Em vez disso, os modelos são enviados para onde os dados residem — dispositivos, hospitais, bancos ou outras organizações — treinados localmente e apenas as atualizações do modelo (gradientes ou pesos) são enviadas de volta para agregar. O servidor central combina estas atualizações para melhorar o modelo global sem nunca ver os dados de treino individuais.
Quando usar a Aprendizagem Federada
A aprendizagem federada é ideal quando a privacidade dos dados impede a centralização (dados de saúde, dados financeiros, informações pessoais), quando os dados estão sujeitos a requisitos regulatórios que restringem o movimento (RGPD, HIPAA), quando as organizações querem colaborar em modelos sem partilhar dados proprietários, e quando o tamanho dos dados ou a latência da rede tornam impraticável a transferência de dados em bruto.
Desafios e Limitações
A aprendizagem federada não é uma solução completa de privacidade — as atualizações de gradiente podem vazar informação sobre os dados de treino, razão pela qual é frequentemente combinada com privacidade diferencial. O desvio de dados não IID (dados independentes e identicamente distribuídos) entre participantes pode dificultar a convergência do modelo. A comunicação exige coordenação e pode ser um gargalo quando os dispositivos têm conectividade limitada. Os adversários podem introduzir atualizações maliciosas (ataques de envenenamento de modelos), requerendo defesas de agregação robustas.