Submit Blog

Sign up Sign in

Search Articles

Filter by Tag

Sort By

Popular Tags

Granite31 Articles

Page 1 of 1 (1 article)

Finetune Granite3.1 for Reasoning

2/1/2025 • EN

Finetune Granite3.1 for Reasoning

A technical guide on fine-tuning IBM's Granite3.1 AI model using Guided Reward Policy Optimization (GRPO) to enhance its reasoning capabilities.

Finetuning Granite31 Grpo Reasoning Reinforcement Learning

Ruslan Magana Vsevolodovna