CPT_SS

句子相似度的比赛任务。
资料1:COVID-19-sentence-compete
资料2:知乎1
资料3:知乎2
资料3:Bert sentence similarity by PyTorch
资料4:nCoV-2019-sentence-similarity

百度千言数据集文本相似度比赛

包含三个数据集和两个baseline
三个数据集的Accuracy分别计分，求和后作为总成绩进行排名
两个Baseline的模型分别为BERT+Linear和BERT+TextCNN，使用中文预训练BERT参数来进行finetune
增加了一个对抗训练FGM的baseline，在各个数据集上训练的效果略有提升

to be continue: 数据增强（回传、近义词替换）；nfold；模型融合（ensemble/stacking）

Name		Name	Last commit message	Last commit date
Latest commit History 48 Commits
code		code
百度文本相似度		百度文本相似度
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CPT_SS

百度千言数据集文本相似度比赛

About

Releases

Packages

Contributors 2

Languages

License

iiot-tbb/CPT_SS

Folders and files

Latest commit

History

Repository files navigation

CPT_SS

百度千言数据集文本相似度比赛

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages