Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

關於資料集分數重現差異 #114

Open
vicaasas opened this issue Dec 13, 2023 · 15 comments
Open

關於資料集分數重現差異 #114

vicaasas opened this issue Dec 13, 2023 · 15 comments

Comments

@vicaasas
Copy link

vicaasas commented Dec 13, 2023

您好,謝謝你們對這領域的供獻,
想請問論文所提到的資料集 share13 share14 以及 cadec :
我們在重現各資料集的 report 分數時,在無數的嘗試後都沒辦法重現分數,多數的分數都與 report f1 分數差2%左右
我們也注意到,如果依照論文提及的 dataset github , 實作後得到的資料句子長度差異有點大,
有可能一個句子兩的字,也有的句子破百字,想請問你們在研究時是否有對資料集做更動

@vicaasas vicaasas changed the title 關於資料集問題 關於資料集分數重現差異 Dec 29, 2023
@Tomcathhh
Copy link

我也是,在使用源代码基础上复习Genia数据集得到的F1 为 80.87,与论文中有差异,请问是不是还用了什么trick?

@vicaasas
Copy link
Author

vicaasas commented Jan 4, 2024

我有注意到作者說可以調參,也試著調了幾個,如dilation [1,2,3] 改成 [1] 或是 不加 Biaffine 分數都沒有變好,不確定有沒有其他調參的做法,也想問一下 先生是否有找到其他作法 可以增高分數

@Tomcathhh
Copy link

我发现源代码使用的应该是biobert,但是使用这个预训练模型效果不如使用pubmedbert

@vicaasas
Copy link
Author

vicaasas commented Jan 4, 2024

作者還有一篇論文叫 TOE https://arxiv.org/pdf/2211.00684.pdf 不知道對先生有沒有幫助
只是分數一樣沒辦法重現,但"可能"會比 w2ner 高一點

@Tomcathhh
Copy link

谢谢你

@Tomcathhh
Copy link

Tomcathhh commented Jan 7, 2024 via email

@vicaasas
Copy link
Author

vicaasas commented Jan 8, 2024

mutibiaffine 是?
有教學實作嗎

@Tomcathhh
Copy link

An Embarrassingly Easy but Strong Baseline for Nested Named Entity Recognition
这篇论文

@vicaasas
Copy link
Author

vicaasas commented Jan 8, 2024

感謝,先生是加了這個分數就重現了嗎

@Tomcathhh
Copy link

Tomcathhh commented Jan 8, 2024 via email

@Tomcathhh
Copy link

Tomcathhh commented Jan 8, 2024 via email

@vicaasas
Copy link
Author

vicaasas commented Jan 8, 2024

先生給的那篇論文,我大致看了一下....,先生會覺得需要重現分數才能投上期刊嗎

@Tomcathhh
Copy link

Tomcathhh commented Jan 8, 2024 via email

@zhangyipeng1
Copy link

pubmedbert

您好,请问您用的pubmedbert是Hugging Face中的哪一个?NeuML的那个吗?还有就是您说的效果提升大概有多大呢?万分感谢!

@Tomcathhh
Copy link

我不太记得了,现在好像PubMedbert名字改了,你仔细看一下描述,里面有写的。在我的设备上大概比biobert有1%提升,你也可以试试别的比如scibert之类的

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants