use the correct available memory API for XPU #3076

faaany · 2024-09-04T07:15:45Z

What does this PR do?

This PR introduces the new API for get xpu available memory. Below is an example of before and after:

from transformers import AutoModelForSeq2SeqLM

model = AutoModelForSeq2SeqLM.from_pretrained("bigscience/T0pp", device_map="auto")
print(model.hf_device_map)

Before

{'': 'cpu'}

After

{'shared': 0, 'decoder.embed_tokens': 0, 'encoder.embed_tokens': 0, 'encoder.block.0': 0, 'encoder.block.1': 0, 'encoder.block.2': 0, 'encoder.block.3': 0, 'encoder.block.4': 0, 'encoder.block.5': 0, 'encoder.block.6': 1, 'encoder.block.7': 1, 'encoder.block.8': 1, 'encoder.block.9': 1, 'encoder.block.10': 1, 'encoder.block.11': 1, 'encoder.block.12': 1, 'encoder.block.13': 1, 'encoder.block.14': 2, 'encoder.block.15': 2, 'encoder.block.16': 2, 'encoder.block.17': 2, 'encoder.block.18': 2, 'encoder.block.19': 2, 'encoder.block.20': 2, 'encoder.block.21': 2, 'encoder.block.22': 3, 'encoder.block.23': 3, 'encoder.final_layer_norm': 3, 'encoder.dropout': 3, 'decoder.block.0': 3, 'decoder.block.1': 3, 'decoder.block.2': 3, 'decoder.block.3': 3, 'decoder.block.4': 4, 'decoder.block.5': 4, 'decoder.block.6': 4, 'decoder.block.7': 4, 'decoder.block.8': 4, 'decoder.block.9': 4, 'decoder.block.10': 5, 'decoder.block.11': 5, 'decoder.block.12': 5, 'decoder.block.13': 5, 'decoder.block.14': 5, 'decoder.block.15': 5, 'decoder.block.16': 6, 'decoder.block.17': 6, 'decoder.block.18': 6, 'decoder.block.19': 6, 'decoder.block.20': 6, 'decoder.block.21': 6, 'decoder.block.22': 7, 'decoder.block.23': 7, 'decoder.final_layer_norm': 7, 'decoder.dropout': 7, 'lm_head': 7}

muellerzr

Thanks! Overall this looks good to me, let's use device_index however rather than i (or something similar to avoid single-letter input names)

faaany · 2024-09-05T03:35:07Z

Thanks! Overall this looks good to me, let's use device_index however rather than i (or something similar to avoid single-letter input names)

thanks for pointing this out! Code Updated.

I also added a version check.

HuggingFaceDocBuilderDev · 2024-09-05T09:19:46Z

The docs for this PR live here. All of your documentation changes will be reflected on that endpoint. The docs are available until 30 days after the last update.

faaany · 2024-09-05T17:11:37Z

Hi @muellerzr , how do you think about the new update?

muellerzr

Thought about it a bit more, let's:

Move this to utils.memory
Use the new implementation I've shown, which takes care of things a bit cleaner.

src/accelerate/utils/imports.py

muellerzr

Great! This looks much cleaner :)

BenjaminBossan

Thanks, LGTM. I have a clarifying question, but it's not a blocker.

src/accelerate/utils/memory.py

faaany · 2024-09-09T14:10:13Z

ok, I think we can merge now. 😊

faaany added 3 commits September 4, 2024 00:03

fix

9798f35

update

c66cb8b

remove blank line

2d3c924

faaany changed the title ~~fix the not working torch.xpu.max_memory_allocated~~ use the correct available memory API for XPU Sep 4, 2024

muellerzr marked this pull request as ready for review September 4, 2024 19:48

muellerzr approved these changes Sep 4, 2024

View reviewed changes

update

f3a8867

add check

6c4db5b

muellerzr reviewed Sep 5, 2024

View reviewed changes

src/accelerate/utils/imports.py Outdated Show resolved Hide resolved

add imports

ae636c0

muellerzr approved these changes Sep 6, 2024

View reviewed changes

muellerzr requested a review from BenjaminBossan September 6, 2024 12:31

BenjaminBossan approved these changes Sep 9, 2024

View reviewed changes

src/accelerate/utils/memory.py Outdated Show resolved Hide resolved

warning for both

89096da

muellerzr merged commit 4b4c036 into huggingface:main Sep 9, 2024
25 checks passed

reformat

aac9162

faaany mentioned this pull request Oct 14, 2024

fix version check bug in get_xpu_available_memory #3165

Merged

faaany deleted the mem_get_info branch November 4, 2024 06:08

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

use the correct available memory API for XPU #3076

use the correct available memory API for XPU #3076

faaany commented Sep 4, 2024 •

edited

Loading

muellerzr left a comment

faaany commented Sep 5, 2024 •

edited

Loading

HuggingFaceDocBuilderDev commented Sep 5, 2024

faaany commented Sep 5, 2024

muellerzr left a comment

muellerzr left a comment

BenjaminBossan left a comment

faaany commented Sep 9, 2024

use the correct available memory API for XPU #3076

use the correct available memory API for XPU #3076

Conversation

faaany commented Sep 4, 2024 • edited Loading

What does this PR do?

muellerzr left a comment

Choose a reason for hiding this comment

faaany commented Sep 5, 2024 • edited Loading

HuggingFaceDocBuilderDev commented Sep 5, 2024

faaany commented Sep 5, 2024

muellerzr left a comment

Choose a reason for hiding this comment

muellerzr left a comment

Choose a reason for hiding this comment

BenjaminBossan left a comment

Choose a reason for hiding this comment

faaany commented Sep 9, 2024

faaany commented Sep 4, 2024 •

edited

Loading

faaany commented Sep 5, 2024 •

edited

Loading