Instruction Tuning articles

2/10/2025 • EN

TIL: Masked Language Models Are Surprisingly Capable Zero-Shot Learners

Explores using a masked language model's head for zero-shot tasks, achieving strong results without task-specific heads.

Encoder Models Instruction Tuning Masked Language Modeling Modernbert Zero Shot Learning

Jeremy Howard

6/2/2024 • EN

LLM Research Insights: Instruction Masking and New LoRA Finetuning Experiments?

Analysis of new LLM research on instruction masking and LoRA finetuning methods, with practical insights for developers.

Instruction Tuning LLM Finetuning Lora Loss Masking Parameter Efficient Finetuning

Sebastian Raschka

6/2/2024 • EN

LLM Research Insights: Instruction Masking and New LoRA Finetuning Experiments?

Explores new research on instruction masking and LoRA finetuning techniques for improving large language models (LLMs).

Finetuning Instruction Tuning llm Lora Research

Sebastian Raschka

4/8/2024 • EN

Comparing LLMs on "Real-World" Retrieval

A developer compares 8 LLMs on a custom retrieval task using medical transcripts, analyzing performance on simple to complex questions.

Data Wrangling Instruction Tuning LLM Evaluation Model Comparison Retrieval Benchmarks

Shreya Shankar

2/11/2024 • EN

How to Generate and Use Synthetic Data for Finetuning

Explores methods for generating synthetic data (distillation & self-improvement) to fine-tune LLMs for pretraining, instruction-tuning, and preference-tuning.

Finetuning Instruction Tuning llm Preference Tuning Synthetic Data

Eugene Yan

9/15/2023 • EN

Optimizing LLMs From a Dataset Perspective

Strategies for improving LLM performance through dataset-centric fine-tuning, focusing on instruction datasets rather than model architecture changes.

Dataset Finetuning Instruction Tuning llm Neural Networks

Sebastian Raschka

9/15/2023 • EN

Optimizing LLMs From a Dataset Perspective

Explores dataset-centric strategies for fine-tuning LLMs, focusing on instruction datasets to improve model performance without altering architecture.

Dataset Finetuning Instruction Tuning llm Neural Networks

Sebastian Raschka