LLM-Finetuning-Qwen

Finetuning Qwen2.5-0.5B on QA and Preference Datasets

This project involves fine-tuning the Qwen2.5-0.5B model, a large language model, for question-answering (QA) tasks and direct preference optimization (DPO) to enhance model response quality. The training leverages LoRA (Low-Rank Adaptation) and quantization techniques to optimize VRAM usage, making it feasible to perform the fine-tuning on limited hardware resources.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
LLM-Finetuning-Qwen.ipynb		LLM-Finetuning-Qwen.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LLM-Finetuning-Qwen

About

Releases

Packages

Languages

rachida-saroui/LLM-Finetuning-Qwen

Folders and files

Latest commit

History

Repository files navigation

LLM-Finetuning-Qwen

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages