Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

按照scripts代码跑出来的结果和论文对应不上? #4

Open
ownnaruto opened this issue May 18, 2023 · 3 comments
Open

按照scripts代码跑出来的结果和论文对应不上? #4

ownnaruto opened this issue May 18, 2023 · 3 comments

Comments

@ownnaruto
Copy link

你好,我按照script.md中的代码跑出来的结果和论文差了很多
CUDA_VISIBLE_DEVICES=0 python run.py --is_training 1 --data_path ETTh1.csv --model_id ETTh1_96_96 --model MTSMixer --data ETTh1 --seq_len 96 --pred_len 96 --enc_in 7 --c_out 7 --des 'EXP' --itr 1 --sampling 6 --fac_T --norm --rev --learning_rate 0.005
结果如下:
mse:0.40452468395233154, mae:0.42268383502960205
比起论文中的结果差的很远。。。

@plumprc
Copy link
Owner

plumprc commented May 18, 2023

您好,不确定您使用的 batch_size 大小如何,我尝试了 batch_size 为 16/32 的时候都是正常的。如果您使用了较大的 batch_size,可以参考 https://arxiv.org/abs/1609.04836,大的 batch_size 可能会导致较差的性能;如果您使用的 batch_size 是正常的,这就可能和您使用的显卡有关系,我们仅测试了 A100 和 V100,不确定其他类型的显卡可能存在的精度问题

@1348598339
Copy link

您好,不确定您使用的 batch_size 大小如何,我尝试了 batch_size 为 16/32 的时候都是正常的。如果您使用了较大的 batch_size,可以参考 https://arxiv.org/abs/1609.04836,大的 batch_size 可能会导致较差的性能;如果您使用的 batch_size 是正常的,这就可能和您使用的显卡有关系,我们仅测试了 A100 和 V100,不确定其他类型的显卡可能存在的精度问题
您好,不同类型的显卡会造成模型精度的较大变化吗

@plumprc
Copy link
Owner

plumprc commented Nov 14, 2023

您好,不同类型的显卡会造成模型精度的较大变化吗

不太确定,但之前在本地卡上跑的时候确实会出现精度造成的问题,至少服务器上A100,V100的结果都ok

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants