bfloat16 support for quickgelugrad #18336

prathikr · 2023-11-07T23:54:03Z

Description

Registers BFloat16 datatype as valid input type for CUDA QuickGeluGrad Kernel.

Motivation and Context

Enabling meta-llama/Llama-2-70b to be finetuned with ONNX Runtime training.

orttraining/orttraining/training_ops/cuda/activation/activations_grad_impl.cu

### Description  Registers BFloat16 datatype as valid input type for CUDA QuickGeluGrad Kernel. ### Motivation and Context  Enabling `meta-llama/Llama-2-70b` to be finetuned with ONNX Runtime training. --------- Co-authored-by: Prathik Rao <[email protected]@orttrainingdev8.d32nl1ml4oruzj4qz3bqlggovf.px.internal.cloudapp.net>

bfloat16 support for quickgelugrad

9fe4767

hanbitmyths reviewed Nov 8, 2023

View reviewed changes

orttraining/orttraining/training_ops/cuda/activation/activations_grad_impl.cu Outdated Show resolved Hide resolved

Prathik Rao added 2 commits November 8, 2023 04:54

use X for bfloat16

f60f122

lint

5dd8f3b

prathikr requested a review from hanbitmyths November 8, 2023 05:04

hanbitmyths approved these changes Nov 8, 2023

View reviewed changes

prathikr merged commit 34f77ea into main Nov 8, 2023

prathikr deleted the prathikrao/quickgelugrad-bfloat16 branch November 8, 2023 16:40

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

bfloat16 support for quickgelugrad #18336

bfloat16 support for quickgelugrad #18336

prathikr commented Nov 7, 2023

bfloat16 support for quickgelugrad #18336

bfloat16 support for quickgelugrad #18336

Conversation

prathikr commented Nov 7, 2023

Description

Motivation and Context