Data Engineering articles

3/13/2026 • EN

Evaluating Claude's dbt Skills: Building an Eval from Scratch

Testing Claude Code's ability to build a production-ready dbt project for a data pipeline, evaluating prompts and skills.

AI Evaluation Claude Data Engineering Dbt llm

Robin Moffatt

3/11/2026 • EN

Claude Code isn't going to replace data engineers (yet)

Explores the current capabilities and limitations of using Claude Code (AI) to build a dbt project, arguing it won't replace data engineers yet.

ai Claude Code Data Engineering Dbt llm

Robin Moffatt

3/11/2026 • EN

Claude Code in action with dbt

A technical demonstration of using Claude Code AI to autonomously debug and adapt dbt data models by analyzing data anomalies.

ai coding Claude Code Data Engineering data transformation Dbt

Robin Moffatt

3/5/2026 • EN

How to Use Dremio with JetBrains AI Assistant: Connect, Query, and Build Data Apps

A guide to integrating Dremio's data platform with JetBrains AI Assistant for enhanced data querying, pipeline generation, and app development within JetBrains IDEs.

Data Engineering Data Lakehouse Dremio Jetbrains AI Assistant mcp server

Alex Merced

3/4/2026 • EN

Who’s Hiring Database People? March 2026 Edition

Monthly job board for database professionals, featuring remote and onsite data engineering, DBA, and analytics roles from March 2026.

Data Engineering Database Jobs Hiring Job Board remote work

Brent Ozar

2/27/2026 • EN

Interesting links - February 2026

A monthly roundup of tech links focusing on data engineering, Kafka, AI, and software development, including personal articles and industry news.

Data Engineering Event Streaming Kafka llm software development

Robin Moffatt

2/19/2026 • EN

Pipeline Observability: Know When Things Break

Explains the importance of pipeline observability for data health, covering metrics, logs, and lineage to detect issues beyond simple execution monitoring.

Data Engineering Data Quality Monitoring observability pipeline

Alex Merced

2/19/2026 • EN

Data Engineering Best Practices: The Complete Checklist

A practical, tool-agnostic checklist of essential best practices for designing, building, and maintaining reliable data engineering pipelines.

best practices Data Engineering Data Quality Etl Pipeline Design

Alex Merced

2/19/2026 • EN

Data Modeling Best Practices: 7 Mistakes to Avoid

Seven common data modeling mistakes that cause reporting errors and slow analytics, with practical solutions to avoid them.

analytics Data Engineering Data Governance Data Modeling Database Design

Alex Merced

2/19/2026 • EN

Testing Data Pipelines: What to Validate and When

Explains the importance of automated testing for data pipelines, covering schema validation, data quality checks, and regression testing.

Data Engineering Data Pipelines Data Validation Quality Assurance testing

Alex Merced

2/19/2026 • EN

Semantic Layer Best Practices: 7 Mistakes to Avoid

Seven critical mistakes that can derail semantic layer projects in data engineering, with practical advice on how to avoid them.

Business Intelligence Data Engineering Data Modeling Metrics Governance Semantic Layer

Alex Merced

2/19/2026 • EN

How to Design Reliable Data Pipelines

A guide to designing reliable, fault-tolerant data pipelines with architectural principles like idempotency, observability, and DAG-based workflows.

Architecture Data Engineering Data Pipelines Idempotency reliability

Alex Merced

2/19/2026 • EN

Idempotent Pipelines: Build Once, Run Safely Forever

Explains idempotent data pipelines, patterns like partition overwrite and MERGE, and how to prevent duplicate data during retries.

Data Engineering Data Pipelines Data Quality Etl Idempotency

Alex Merced

2/19/2026 • EN

Data Quality Is a Pipeline Problem, Not a Dashboard Problem

Argues that data quality must be enforced at the pipeline's ingestion point, not patched in dashboards, to ensure consistent, reliable data.

Data Engineering Data Governance Data Pipeline Data Quality Data Validation

Alex Merced

2/19/2026 • EN

How to Think Like a Data Engineer

A guide to the core principles and systems thinking required for data engineering, beyond just learning specific tools.

Data Engineering Data Pipelines Data Quality Idempotency Systems Design

Alex Merced

2/19/2026 • EN

Batch vs. Streaming: Choose the Right Processing Model

A guide to choosing between batch and streaming data processing models based on actual freshness requirements and cost.

Architecture Batch Processing Data Engineering data processing streaming

Alex Merced

2/19/2026 • EN

Schema Evolution Without Breaking Consumers

Explains how to safely evolve data schemas using API-like discipline to prevent breaking downstream systems like dashboards and ML pipelines.

api design Backward Compatibility Data Contracts Data Engineering Schema Evolution

Alex Merced

12/7/2025 • EN

You Gotta Push If You Wanna Pull

Explores the limitations of traditional pull queries in data systems and advocates for using materialized views and data duplication to improve performance.

Data Duplication Data Engineering Materialized Views Query Optimization Stream Processing

Gunnar Morling

10/23/2025 • EN

2025-2026 Guide to Learning about Apache Iceberg, Data Lakehouse & Agentic AI

A comprehensive guide to learning Apache Iceberg, data lakehouse architecture, and Agentic AI with curated tutorials, tools, and resources.

agentic ai Apache Iceberg Data Engineering Data Lakehouse Table Formats

Alex Merced

10/16/2025 • EN

Intro to Apache Iceberg with Apache Polaris and Apache Spark

A technical guide on using Apache Iceberg with Apache Spark and Polaris for building and managing a data lakehouse, covering setup, operations, and optimization.

Apache Iceberg Apache Spark Data Engineering Data Lakehouse Table Management

Alex Merced