Finetune_llama2_Megatron

Building a llama fine-tuning script from scratch using PyTorch and the transformers API, with support for four optional parameters: gradient checkpoint, mixed precision, data parallelism, and tensor parallelism. Avoid using ColossalAI/Megatron/DeepSpeed. Referring to existing code is allowed.

The loss curve:

Multiple nodes scripts:

torchrun --nnodes 2 --node_rank=0 --master_addr=10.90.1.166 --nproc_per_node=8 finetune.py torchrun --nnodes 2 --node_rank=1 --master_addr=10.90.1.166 --nproc_per_node=8 finetune.py

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
README.md		README.md
data_utils.py		data_utils.py
finetune_llama2.py		finetune_llama2.py
start.sh		start.sh
tensor_parallel.py		tensor_parallel.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Finetune_llama2_Megatron

About

Releases

Packages

Languages

wangbluo/Finetune_llama2_Megatron

Folders and files

Latest commit

History

Repository files navigation

Finetune_llama2_Megatron

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages