SLANet plus表格识别模型微调之后效果很差 #2966

Sherryran08 · 2025-01-24T02:30:36Z

Checklist:

使用的数据集为pubtables-1m数据集，已经数据格式转化为指定输入格式，数据量为2w，微调效果如下，感觉bbox变宽且位置不准确，比微调之前性能下降很多，训练时在验证集上的best acc只有0.7949999996025，微调参数为：

微调之前推理效果：

微调之后推理效果：

此外，还尝试了使用自己标注的无线表数据1000张进行微调，效果也很差

cuicheng01 · 2025-01-24T04:25:12Z

数据可能有点少，需要再多加很多数据

Sherryran08 · 2025-01-24T05:52:31Z

有点疑惑哪一个是正确的参考标准，如果需要再多加很多数据，多少数据量比较合适

liu-jiaxuan · 2025-02-05T03:40:04Z

数据量和数据质量都比较重要，需要使用与测试集数据类型相似的表格图片作为训练集，如果差距较大（例如训练集大部分为简单表格，而测试集却是较复杂的无线表），就会导致模型性能下降的问题，因此建议先把控好训练集质量，高质量的2w数据预期也能提升模型性能。

TingquanGao self-assigned this Jan 24, 2025

TingquanGao assigned liu-jiaxuan Feb 5, 2025