Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

SLANet plus表格识别模型微调之后效果很差 #2966

Open
4 tasks done
Sherryran08 opened this issue Jan 24, 2025 · 3 comments
Open
4 tasks done

SLANet plus表格识别模型微调之后效果很差 #2966

Sherryran08 opened this issue Jan 24, 2025 · 3 comments
Assignees

Comments

@Sherryran08
Copy link

Sherryran08 commented Jan 24, 2025

Checklist:

描述问题

复现

  1. 您是否已经正常运行我们提供的教程

  2. 您是否在教程的基础上修改代码内容?还请您提供运行的代码

  3. 您使用的数据集是?

  4. 请提供您出现的报错信息及相关log

环境

  1. 请提供您使用的PaddlePaddle和PaddleX的版本号
    PaddlePaddle:3.0.0b1;PaddleX:3.0.0b2
  2. 请提供您使用的操作系统信息,如Linux/Windows/MacOS
    Linux
  3. 请问您使用的Python版本是?
    3.10
  4. 请问您使用的CUDA/cuDNN的版本号是?
    12.2

使用的数据集为pubtables-1m数据集,已经数据格式转化为指定输入格式,数据量为2w,微调效果如下,感觉bbox变宽且位置不准确,比微调之前性能下降很多,训练时在验证集上的best acc只有0.7949999996025,微调参数为:

Image

微调之前推理效果:

Image

微调之后推理效果:

Image

此外,还尝试了使用自己标注的无线表数据1000张进行微调,效果也很差

@TingquanGao TingquanGao self-assigned this Jan 24, 2025
@cuicheng01
Copy link
Collaborator

数据可能有点少,需要再多加很多数据

@Sherryran08
Copy link
Author

Sherryran08 commented Jan 24, 2025

参考了之前别人使用好未来的数据集1.6w数据微调SLANet之后效果不错,https://github.com/PaddlePaddle/PaddleOCR/issues/8761;
并且官方上给的教程是1-2k数据微调即可,https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6.1/doc/doc_ch/table_recognition.md#1-%E6%95%B0%E6%8D%AE%E5%87%86%E5%A4%87

有点疑惑哪一个是正确的参考标准,如果需要再多加很多数据,多少数据量比较合适

@liu-jiaxuan
Copy link
Collaborator

数据量和数据质量都比较重要,需要使用与测试集数据类型相似的表格图片作为训练集,如果差距较大(例如训练集大部分为简单表格,而测试集却是较复杂的无线表),就会导致模型性能下降的问题,因此建议先把控好训练集质量,高质量的2w数据预期也能提升模型性能。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants