Issues · huggingface/trl

[Project] Training Agents with GRPO

#2723 opened Jan 31, 2025 by August-murr

Open 10

[Tracking issue] Integrate native liger-kernel losses

#2495 opened Dec 17, 2024 by qgallouedec

Open 5

[Tracking issue] Wrong loss scaling when accumulating gradient

#2617 opened Jan 23, 2025 by qgallouedec

Open

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

226 Open 1,268 Closed

✨ enhancement 🏋 GRPO 🏋 PPO

#2892 opened Feb 18, 2025 by haoxiongliu

🚀 deepspeed ⚡ PEFT 🏋 SFT

#2891 opened Feb 18, 2025 by sayakpaul

✨ enhancement 🏋 GRPO

#2888 opened Feb 18, 2025 by linkedlist771

✨ enhancement 🏋 GRPO

#2887 opened Feb 18, 2025 by ZYM66

🏋 GRPO 🏋 Reward

#2884 opened Feb 18, 2025 by Dong237

5 tasks done

⚡accelerate 🐛 bug 🚀 deepspeed 🏋 ORPO

#2882 opened Feb 17, 2025 by dannnnthemannnn

5 tasks done

🐛 bug 🏋 GRPO

#2878 opened Feb 17, 2025 by Saturnoul

5 tasks done

🐛 bug 🏋 GRPO

#2877 opened Feb 17, 2025 by GuodongFan

5 tasks done

I have this strange error with GRPO Trainer 🐛 bug 🏋 GRPO

#2876 opened Feb 16, 2025 by MohamedAliRashad

🐛 bug 🏋 GRPO ⚡ PEFT

#2872 opened Feb 15, 2025 by zaddy6

5 tasks done

🏋 DPO ✨ enhancement 🏋 KTO ⚡ PEFT

#2870 opened Feb 15, 2025 by claralp

⚡accelerate 🏋 GRPO ⏳ needs more info ⚡ PEFT

#2864 opened Feb 14, 2025 by AIR-hl

5 tasks done

❓ question 🏋 SFT

#2844 opened Feb 12, 2025 by shirinyamani

⚡accelerate 🐛 bug 🏋 GRPO

#2842 opened Feb 12, 2025 by MAOJIASONG

5 tasks done

🐛 bug 🏋 GRPO

#2839 opened Feb 12, 2025 by Carloszone

4 of 5 tasks

⚡accelerate 🐛 bug 🏋 Online DPO

#2835 opened Feb 12, 2025 by Snowdar

⚡ PEFT 🏋 PPO

#2833 opened Feb 11, 2025 by sr5434

✨ enhancement 🏋 GRPO

#2830 opened Feb 11, 2025 by August-murr

✨ enhancement 🏋 GRPO

#2821 opened Feb 10, 2025 by August-murr

ProTip! Updated in the last three days: updated:>2025-02-15.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Issues: huggingface/trl

Issues list