Volver ao Blog Empresa

Gobernanza de datos na era da IA — calidade, catálogo e liñaxe de datos

Zespół ESKOM.AI 2026-05-22 Tempo de lectura: 7 min

A gobernanza de datos como fundamento da IA

Cando unha organización pon en marcha o primeiro sistema de IA e descobre que as prediccións son incoherentes e o modelo xera resultados absurdos, o primeiro impulso é buscar erros no algoritmo. No 80% dos casos, a causa real é outra: os datos de entrada son incompletos, etiquetados de forma incoherente ou reflicten procesos de negocio antigos que xa non se aplican. A gobernanza de datos é un conxunto de procesos e ferramentas que prevén estes problemas antes de que se volvan custosos.

Calidade dos datos — dimensións e medición

A calidade dos datos non é un concepto unidimensional. A xestión práctica da calidade require a medición de varias dimensións independentes:

  • Completeza — que porcentaxe dos campos requiridos está enchido? Os valores baleiros invisibles nas táboas dos sistemas fonte poden arruinar modelos preditivos.
  • Coherencia — os mesmos datos almacenados en sistemas diferentes teñen un valor idéntico? As discrepancias entre CRM e ERP en atributos básicos do cliente son un problema xeneralizado.
  • Actualidade — que de antigos son os datos en comparación coa realidade? Para os sistemas de IA que operan en tempo real, esta é unha dimensión crítica.
  • Exactitude — os datos reflicten a realidade? A verificación require fontes de referencia externas ou mostraxe manual.

Catálogo de datos — onde está que e que significa

Nunha organización madura, os datos almacénanse en decenas de sistemas, bases de datos e ficheiros. Sen un catálogo de datos, un novo proxecto de IA comeza con semanas de investigación: onde están os datos de pedidos? Que significa o campo "status_v2" na táboa de clientes? Quen é responsable da calidade dos datos de vendas?

O catálogo de datos responde a estas preguntas automaticamente, escaneando os sistemas fonte e enriquecendo os metadatos técnicos con descricións de negocio, información sobre propietarios e clasificacións de sensibilidade. Para os sistemas de IA é fundamental que o catálogo sexa accesible para ferramentas de automatización — o modelo de IA pode entón investigar por si só as fontes de datos dispoñibles antes de comezar a análise.

Liñaxe de datos — seguimento do fluxo de datos

Cando un modelo de IA xera un resultado sospeitoso, a investigación debe responder á pregunta: de onde provén este valor e que transformacións experimentou polo camiño? A liñaxe de datos rexistra automaticamente o fluxo de datos desde a fonte pasando polas transformacións sucesivas ata a táboa ou modelo final. É unha ferramenta imprescindible non só para a depuración, senón tambén para o compliance — as regulacións RXPD, DORA e sectoriais requiren documentar de onde proveñen os datos utilizados en decisións que afectan persoas físicas.

Xestión de datos mestres (MDM)

Toda organización grande ten o problema de múltiples definicións das mesmas entidades: un cliente no CRM, un cliente no sistema financeiro e un cliente na plataforma de comercio electrónico son a miúdo tres entidades diferentes que deberían representar a mesma persoa ou empresa. A xestión de datos mestres crea un rexistro fiable único de cada entidade clave e propágao aos sistemas derivados. Sen MDM, os sistemas de IA aprenden de datos onde o mesmo cliente é tratado como tres diferentes.

Como comezar — enfoque iterativo

A gobernanza de datos non ten que ser un proxecto plurianual antes de lanzar calquera sistema de IA. O enfoque práctico consiste en construír a gobernanza en paralelo coas primeiras implementacións: identifica os conxuntos de datos máis críticos para o sistema de IA planificado e comeza polo seu perfil de calidade. Amplía o alcance gradualmente, aprendendo dos problemas reais en produción.

#data governance #data quality #data catalog #lineage #MDM