Schema Evolution articles

5/28/2026 • EN

The Death of the Data Swamp: Establishing Governance in Your 2026 Data Lakehouse

A guide to preventing data swamps in lakehouses through active governance, metadata stewardship, schema evolution safety, and drift detection.

Data Drift Detection Data Governance Data Lakehouse Metadata Stewardship Schema Evolution

Alex Merced

5/4/2026 • EN

Why JOIN USING Can Lead to Errors in SQL

Explains why JOIN USING in SQL can cause errors when schemas evolve, recommending JOIN ON for production queries.

Join Pitfalls Schema Evolution sql

Lukas Eder

2/19/2026 • EN

Schema Evolution Without Breaking Consumers

Explains how to safely evolve data schemas using API-like discipline to prevent breaking downstream systems like dashboards and ML pipelines.

api design Backward Compatibility Data Contracts Data Engineering Schema Evolution

Alex Merced

10/21/2024 • EN

All About Parquet Part 04 - Schema Evolution in Parquet

Explains how Parquet handles schema evolution, including adding/removing columns and changing data types, for data engineers.

Data Engineering Data Management File Format Parquet Schema Evolution

Alex Merced

8/21/2024 • EN

Understanding Apache Iceberg's Metadata.json

Explains the critical role and structure of the metadata.json file in Apache Iceberg, the open-source table format for data lakehouses.

Apache Iceberg Data Lakehouse metadata Schema Evolution Table Format

Alex Merced

3/3/2023 • EN

Aligning mismatched Parquet schemas in DuckDB

How to handle mismatched Parquet file schemas when querying multiple files in DuckDB using the UNION_BY_NAME option.

Data Engineering Duckdb Parquet S3 Schema Evolution

Robin Moffatt

1/8/2020 • EN

Streaming messages from RabbitMQ into Kafka with Kafka Connect

A technical guide on integrating RabbitMQ with Kafka using Kafka Connect, including setup, schema handling, and use cases.

Data Integration Kafka Connect Rabbitmq Schema Evolution Stream Processing

Robin Moffatt

10/31/2017 • EN

Database migrations

A guide to best practices for database schema migrations, focusing on tools like Flyway and Hibernate for evolving applications.

Database Migrations Flyway Hibernate Relational Databases Schema Evolution

Paweł Chudzik

Schema Evolution Articles

The Death of the Data Swamp: Establishing Governance in Your 2026 Data Lakehouse

Why JOIN USING Can Lead to Errors in SQL

Schema Evolution Without Breaking Consumers

All About Parquet Part 04 - Schema Evolution in Parquet

Understanding Apache Iceberg's Metadata.json

Aligning mismatched Parquet schemas in DuckDB

Streaming messages from RabbitMQ into Kafka with Kafka Connect

Database migrations

Select Language

We use cookies