El vendor lock-in en la nube no es una conspiración: es lo que pasa naturalmente cuando ponés tus datos y tu cómputo en formatos propietarios. La salida no es no usar la nube, es separar storage de cómputo, guardar los datos en formatos abiertos como Apache Iceberg, y mantener un catálogo neutral. Con eso, cambiar de proveedor deja de ser una migración épica y pasa a ser una decisión técnica.
Cómo te atan, sin que te des cuenta
Empezás con un warehouse cerrado porque es lo más rápido. Después agregás features propietarios: streams, masking, sharing, ML. Tres años después, mover los datos significa reescribir pipelines, perder funcionalidades y pagar egress millonario. No es trampa: es el modelo de negocio.
El principio: separar storage de cómputo
Si los datos viven en object storage (S3, GCS, ADLS) en Parquet, y la capa de metadata transaccional es Apache Iceberg, cualquier motor moderno puede leerlos. BigQuery, Snowflake, Databricks y Trino soportan Iceberg como fuente externa. Esto convierte al storage en commodity y al cómputo en intercambiable.
El rol del catálogo neutral
Un catálogo Iceberg (Polaris, Nessie, Unity bajo modo abierto, o el catálogo de BigLake) define qué tablas existen, qué versiones, qué permisos, sin atar al motor. Si mañana querés probar Trino para una pregunta específica o Databricks para entrenar un modelo, lo enchufás al catálogo y listo.
Lo que queda atado, y eso está bien
- El motor que usás para el caso de uso (BigQuery, Snowflake, Databricks).
- Servicios opinados de la nube: orquestación gestionada, ML serverless.
- Identity, monitoreo, redes: el lock-in operacional es bajo y aceptable.
El error opuesto: open-everything paralizante
Querer evitar todo lock-in lleva a stacks autoadministrados ingobernables: Hadoop revisitado. La línea correcta es: datos en formato abierto, cómputo gestionado del proveedor que sea mejor para el caso. Es la diferencia entre estar atado y estar conectado.
El patrón Evolve: Open Data Foundation
En Evolve diseñamos arquitecturas con Iceberg en object storage y motores intercambiables —BigQuery, Snowflake, Databricks— según lo que el caso demanda. Esto nos permite a nosotros y a nuestros clientes mantener postura vendor-neutral real, no declarativa.
