Skip to content
This repository has been archived by the owner on Jan 8, 2021. It is now read-only.

JacquesdeH/NER-CCF2020-HeapOverflow

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

NER-CCF2020-HeapOverflow

CCF 2020 competition repo for ID=472

Stage 1 - Midterm Check

赛题介绍

  • 赛题背景及意义
  • 任务定义及目标 Formal
  • 评价指标
  • 赛题网址

数据集统计量

  • seaborn进行画图
  • 分析每个label的分布, 作图分析 (T1)
  • 文本长度分布统计 (T2)
  • 类别关联度分析, 统计一个类的实体分布的分散或聚拢程度 (T3)

模型架构介绍

  • 整体模型图
  • 每一层的功能
  • 数据流简介
  • 强调可实现性

模型优化

  • ! 数据集划分使用P次K折交叉验证法, 模型超参数调优
  • 对损失函数基于label分布进行调整
  • 数据增强提高模型泛化性能
  • 考虑拓展数据集

分工计划

  • 作图, 大致标记需要干什么事
  • 数据预处理 (DXY) (删除异常数据, 数据统计量, label格式化)
  • 模型实现 (HZX, KJS)
  • 训练过程控制 (LMX)
  • 模型优化 (ALL) 具体优化实现需要视情况而定
  • Timeline
    • 11.8 海报与PPT制作
    • 11.20 模型实现第一稿完成
    • 12.6 模型性能优化

补充说明

  • 11.8 12:00 KJS模型架构及REFERENCE HZX优化和分工介绍 LMX完成数据源统计量及绘图 DXY赛题介绍部分
  • 11.8 23:59 DXY 完成PPT制作
  • 11.9 10:00 开会讨论海报制作

About

CCF 2020 competition repo for ID=472

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •  

Languages