CCF 2020 competition repo for ID=472
- 赛题背景及意义
- 任务定义及目标 Formal
- 评价指标
- 赛题网址
- seaborn进行画图
- 分析每个label的分布, 作图分析 (T1)
- 文本长度分布统计 (T2)
- 类别关联度分析, 统计一个类的实体分布的分散或聚拢程度 (T3)
- 整体模型图
- 每一层的功能
- 数据流简介
- 强调可实现性
- ! 数据集划分使用P次K折交叉验证法, 模型超参数调优
- 对损失函数基于label分布进行调整
- 数据增强提高模型泛化性能
- 考虑拓展数据集
- 作图, 大致标记需要干什么事
- 数据预处理 (DXY) (删除异常数据, 数据统计量, label格式化)
- 模型实现 (HZX, KJS)
- 训练过程控制 (LMX)
- 模型优化 (ALL) 具体优化实现需要视情况而定
- Timeline
- 11.8 海报与PPT制作
- 11.20 模型实现第一稿完成
- 12.6 模型性能优化
- 11.8 12:00 KJS模型架构及REFERENCE HZX优化和分工介绍 LMX完成数据源统计量及绘图 DXY赛题介绍部分
- 11.8 23:59 DXY 完成PPT制作
- 11.9 10:00 开会讨论海报制作