Alex Merced

Alex Merced — Developer and technical writer sharing in-depth insights on data engineering, Apache Iceberg, data lakehouse architectures, Python tooling, and modern analytics platforms, with a strong focus on practical, hands-on learning.

https://tuts.alexmercedcoder.dev

RSS Feed

12/31/2025

data engineering apache iceberg data lakehouse python analytics

Articles from this Blog

333 articles from this blog

7/29/2025 • EN

Optimizing Compaction for Streaming Workloads in Apache Iceberg

Explains techniques for incremental, non-disruptive compaction in Apache Iceberg tables under continuous streaming data ingestion.

Apache Iceberg Data Lakehouse Data Compaction

7/22/2025 • EN

The Basics of Compaction — Bin Packing Your Data for Efficiency

Explains data compaction using bin packing in Apache Iceberg to merge small files, improve query performance, and reduce metadata overhead.

Spark Apache Iceberg Data Compaction

7/15/2025 • EN

The Cost of Neglect — How Apache Iceberg Tables Degrade Without Optimization

Explains how Apache Iceberg tables degrade without optimization, covering small files, fragmented manifests, and performance impacts.

Metadata Management Data Engineering Apache Iceberg

7/3/2025 • EN

How to Discover or Organize Lakehouse & Apache Iceberg Meetups

A guide on how to find, join, and organize community meetups focused on Apache Iceberg and modern data lakehouse architectures.

Slack Meetup Organization Apache Iceberg

5/2/2025 • EN

Introduction to Data Engineering Concepts | Storage Formats and Compression

Explains the importance of data storage formats and compression for performance and cost in large-scale data engineering systems.

compression Data Engineering Apache Iceberg

5/2/2025 • EN

Introduction to Data Engineering Concepts | Data Lakehouse Architecture Explained

Explains the data lakehouse architecture, a unified approach combining data lake scalability with warehouse management features like ACID transactions.

Data Management Data Engineering Data Architecture

5/2/2025 • EN

Introduction to Data Engineering Concepts | Cloud Data Platforms and the Modern Stack

Explores the modern data stack, cloud platforms, and principles for building flexible, cloud-native data engineering architectures.

Data Engineering Data Architecture Managed Services

5/2/2025 • EN

Introduction to Data Engineering Concepts | DevOps for Data Engineering

Explores how DevOps principles like CI/CD, infrastructure as code, and monitoring are applied to data engineering for reliable, scalable data pipelines.

DevOps version control Data Pipelines

5/2/2025 • EN

Introduction to Data Engineering Concepts | Building Scalable Pipelines

Explores core principles of scalable data engineering, including parallelism, minimizing data movement, and designing adaptable pipelines for growing data volumes.

parallelism Data Engineering Data Architecture

5/2/2025 • EN

Introduction to Data Engineering Concepts | Scheduling and Workflow Orchestration

Explores workflow orchestration in data engineering, covering DAGs, tools, and best practices for managing complex data pipelines.

Scheduling Etl Data Engineering

5/2/2025 • EN

Introduction to Data Engineering Concepts | What is Data Engineering?

An introductory guide to data engineering, explaining its role, key concepts, and how it differs from data science in the modern data ecosystem.

Data Pipelines Data Engineering Data Warehouse

5/2/2025 • EN

Introduction to Data Engineering Concepts | Metadata, Lineage, and Governance

Explains core data engineering concepts: metadata, data lineage, and governance, and their importance for scalable, compliant data systems.

metadata Data Engineering Data Governance

5/2/2025 • EN

Introduction to Data Engineering Concepts | Data Quality and Validation

Explores the importance of data quality and validation in data engineering, covering key dimensions and tools for reliable pipelines.

Data Quality Data Pipelines Data Validation

5/2/2025 • EN

Introduction to Data Engineering Concepts | Data Lakes Explained

Explains data lakes, their key characteristics, and how they differ from data warehouses in modern data architecture.

cloud storage Data Engineering Data Architecture

5/2/2025 • EN

Introduction to Data Engineering Concepts | Data Warehousing Fundamentals

An introduction to data warehousing concepts, covering architecture, components, and performance optimization for analytical workloads.

performance optimization Data Engineering Data Architecture

5/2/2025 • EN

Introduction to Data Engineering Concepts | Data Modeling Basics

An introduction to data modeling concepts, covering OLTP vs OLAP systems, normalization, and common schema designs for data engineering.

Data Modeling Database Design Data Engineering

5/2/2025 • EN

Introduction to Data Engineering Concepts | Streaming Data Fundamentals

Explains streaming data fundamentals, how streaming systems work, their use cases, and challenges compared to batch processing.

Data Pipelines Real Time Processing Data Engineering

5/2/2025 • EN

Introduction to Data Engineering Concepts | Batch Processing Fundamentals

Explains batch processing fundamentals for data engineering, covering concepts, tools, and its ongoing relevance in data workflows.

Data Pipelines Data Engineering Batch Processing

5/2/2025 • EN

Introduction to Data Engineering Concepts | ETL vs ELT – Understanding Data Pipelines

Explains core data engineering concepts, comparing ETL and ELT data pipeline strategies and their use cases.

data transformation Data Pipelines Etl

5/2/2025 • EN

Introduction to Data Engineering Concepts | Understanding Data Sources and Ingestion

An introduction to data engineering concepts, focusing on data sources and ingestion strategies like batch vs. streaming.

streaming Data Engineering Data Ingestion

Previous 1 2 3 4 5 ... 17 Next

Alex Merced

Articles from this Blog

Select Language