CDC (Change Data Capture) es una técnica que detecta y replica en tiempo real los cambios que ocurren en una base de datos transaccional —insert, update, delete— hacia un destino analítico como un data warehouse o un lakehouse. Con Fivetran, ese CDC se vuelve un conector administrado que lee directamente los logs de Oracle, SQL Server o SAP sin tocar las tablas productivas, y entrega los cambios al destino con latencias de minutos.
Por qué el batch nocturno ya no alcanza
Durante años, las empresas movieron datos al warehouse con cargas nocturnas (ETL en ventana). El problema es que cualquier reporte, modelo o agente de IA construido sobre eso opera con datos de ayer. Si querés que un agente avise hoy que un cliente bajó consumo, que un quiebre de stock está por ocurrir, o que un proveedor cambió un precio, necesitás datos frescos. CDC resuelve esto sin volver a procesar tablas enteras: solo viajan los cambios.
Cómo funciona CDC, en simple
Las bases transaccionales mantienen un log binario interno donde queda registrada cada operación (redo log en Oracle, transaction log en SQL Server, change tables en SAP). CDC se suscribe a ese log, decodifica cada evento (inserción, actualización, borrado) y lo replica al destino preservando el orden. No hay queries contra la base productiva; no hay impacto sobre el OLTP.
Por qué Fivetran y no rolar tu propio CDC
Implementar CDC a mano sobre SAP o Oracle es posible —Debezium, Kafka Connect, scripts custom— pero implica mantener decodificadores de log, manejar reinicios, esquemas que cambian y permisos en sistemas críticos. Fivetran provee conectores administrados (incluido Fivetran HVR para fuentes pesadas como SAP ECC / S/4HANA), con CDC log-based listo, autoescalado y SLA. El equipo de datos se ocupa del modelo, no del transporte.
Qué cambia con CDC en producción
- Latencia minutos en lugar de horas o un día.
- Sin impacto en los sistemas transaccionales (lectura de logs, no de tablas).
- Histórico completo de cambios disponible para auditoría y modelos.
- Habilita casos de IA sobre datos vivos: alertas, scoring, agentes operacionales.
Caso real: Evolve + Caja Los Andes con Fivetran sobre SAP
En Caja Los Andes, Evolve implementó CDC con Fivetran MDLS (Managed Data Lake Service) sobre las fuentes SAP, replicando hacia BigQuery en GCP. El resultado fue una capa de datos lista para analítica avanzada y agentes de IA, sin tocar el ERP, con costos predecibles y sin equipo dedicado a mantener pipelines. Esa misma capa hoy alimenta a Merlina (analítica conversacional) y a los agentes de Agentic Works.
Cuándo conviene CDC y cuándo no
CDC es la opción correcta cuando hay un sistema transaccional grande (ERP, core bancario, e-commerce) que necesita alimentar analítica o IA a baja latencia. No tiene sentido para fuentes pequeñas o lentas (planillas, exports diarios) donde un batch de Fivetran convencional ya resuelve. La regla de Evolve: si el caso de uso necesita decidir en horas, vas con CDC; si decide en días, no.
