Que son os Datos Sintéticos?
Os datos sintéticos son conxuntos de datos xerados artificialmente que preservan as propiedades estatísticas e patróns dos orixinais pero non conteñen datos persoais reais. Segundo Gartner, en 2030 os datos sintéticos constituirán a maioría dos datos de adestramento de IA.
Métodos de xeración
Enfoques principais: GANs (Generative Adversarial Networks), modelos de difusión (especialmente para imaxes), regras estatísticas (xeración baseada en distribucións de probabilidade) e LLMs (xeración de textos, escenarios de proba, conversas).
Beneficios empresariais
Os datos sintéticos resolven tres problemas clave: privacidade (sen datos persoais = sen problema RXPD), dispoñibilidade (podedes xerar millóns de rexistros a partir de poucos miles) e equilibrio (igualar clases descompensadas — p. ex. casos raros de fraude pasan a estar ben representados).