-
Notifications
You must be signed in to change notification settings - Fork 3
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
对于额外数据的使用范围的疑问 #16
Comments
你好,可以用额外数据,但不可以用unseen类别。比赛结束后选手需上传模型及方案,并公布额外数据来源。 |
|
|
unseen类数据的使用需要遵循的原则是不破坏OVD问题的定义,否则就会变成已知类别的目标检测而失去本次竞赛的意义。对于额外数据的使用限制,您可以参照以下规则:
|
額外的數據裏不能包含unseen類的位置信息(bbox)可以理解, 否則就成了有標注的目標檢測; 但是如果只是用unseen類別的名字作爲搜索引擎的關鍵字爬取圖片呢? 這和先爬取,再用unseen類別的名字去過濾篩選,本質上沒有區別,都利用了unseen類別名稱. 目前的OVD 論文,主要有兩種,一種是利用弱監督的數據,比如分類數據和caption數據,這些數據有image-level的標簽,但沒有bbox的標注,如ov-rcnn, detic, object-centric-ovd. 根據unseen類別名稱爬取圖片構造分類數據作爲弱監督的信號可以算為這一種; 另外一種不利用任何額外的弱監督數據,只利用CLIP,對其蒸餾或直接基於CLIP搭建檢測器,比如ViLD和BARON, 以及F-VLM. |
第一種裏面,有些人會利用unseen類別來清理數據,如detic,object-centric-ovd; 也有的在訓練過程中完全對unseen類別完全不可知,只從caption裏解析noun, 比如VLDet. 請問這次比賽對於弱監督信號的限制是哪一種? (我認爲用unseen類別篩選爬取的數據和直接用unseen類別去爬取數據是等價的,後者可以做到和前者一樣,無非是時間更長一點; 對於公開的分類數據集,這兩者就是一回事). |
提出了OVD任务的OV-RCNN 对open-vocabulary的定义是:使用可能包含target类别的弱监督数据。这次比赛的原则是不是也类似?即:使用的外部数据不能包含unseen类别的bbox,除此之外没有限制。 |
上述提到的爬取过滤均不受限制,但使用的外部数据不能包含unseen类的位置信息 |
嗯嗯,感谢您的回复。 |
上述理解是对的,最后一个问题提到的方式是允许的。 |
好的,感谢回复 |
所以,你们都是用了额外数据做的啊;难怪点数这么高
|
The text was updated successfully, but these errors were encountered: