汇总一下网络上公开的内窥镜数据集,包括但不限于肠镜、胃镜、腹腔镜、胶囊内镜等数据集。(更新中)
数据集描述格式:
- 部位:
- 发布时间:
- 关键词:
- 内容:
- 对应论文:
- 备注:
- 示例图像:
-
部位: 胃肠道
-
发布时间: 2017年
-
关键词: 解剖标志(anatomical landmarks),病理发现(phatological findings),内镜检查程序(endoscopic procedures),息肉。
-
内容: 分为Kvasir Dataset v1、Kvasir Dataset v2两个版本,两个版本均包含8个类别。其中,解剖标志三类:Z线,幽门,盲肠;病理结果三类:食管炎,息肉,溃疡性结肠炎;内镜检查程序两类:"dyed and lifted polyp","dyed resection margins"。版本1共包含4000张图像,每类400张。版本2共包含8000张图像,每类800张。分辨率从720x576到1920x1072不等。
-
对应论文: Pogorelov, K., et al. (2017). Kvasir: A multi-class image dataset for computer aided gastrointestinal disease detection. Proceedings of the 8th ACM on Multimedia Systems Conference.
-
备注: 部分图像左下角显示奥林巴斯电磁定位系统ScopeGuide的绿色框。
-
示例图像:
-
部位: 胃肠道
-
发布时间: 2019年
-
关键词: 息肉,分割,pixel-wise mask,bounding box。
-
内容: 在The Kvasir Dataset基础上添加了segmentation masks。包含来自Kvasir Dataset v2的1000张息肉图像和对应的分割ground truth(pixel-wise mask和bounding box),分辨率从332x487到1920x1072不等。
-
对应论文: Jha, D., et al. (2020). Kvasir-seg: A segmented polyp dataset. International Conference on Multimedia Modeling, Springer.
-
备注: 数据集用黑色框代替奥林巴斯电磁定位系统ScopeGuide的绿色框,不过仍有几张图像还存在绿色框,需要预处理一下。
-
示例图像:
- 部位: 胃肠道
- 发布时间: 2019年
- 关键词: 解剖标志(anatomical landmarks),病理发现(phatological findings),内镜检查程序(endoscopic procedures),息肉,分割,标注视频。
- 内容: 号称最大的胃肠数据集,大小有58.6G,包含110079张图像和374个视频。数据集分为四大类:
- 第一类是标注图像,包含10662张图像,相当于The Kvasir Dataset的扩充。类别包含解剖标志(anatomical landmarks)、病理发现(phatological findings)、正常发现(normal findings),其中解剖标志又分为上消化道(Z线,反转视角下的胃,幽门)、下消化道(回肠,盲肠,反转视角下的直肠),病理发现包括上消化道病理发现(反流性食管炎,巴雷特食管,)、下消化道病理发现(溃疡性结肠炎,息肉,痔疮),正常发现包括波士顿肠道准备评分、粪便、内镜检查程序("dyed and lifted polyp","dyed resection margins")。
- 第二类是分割图像,与The Kvasir-SEG Dataset相同。
- 第三类是未标注图像,包含99417张图像。
- 第四类是标注视频,包含374个视频,每个视频有对应的finding标签,如息肉、出血、肿瘤等。
- 对应论文: Hyper-Kvasir: A Comprehensive Multi-Class Image and Video Dataset for Gastrointestinal Endoscopy
- 备注: 该数据集是kvasir系列的汇总。
- 示例图像:
- 部位: 猪的腹部
- 发布时间: 2019
- 关键词: 结构光、深度图、达芬奇、双目立体匹配
- 内容: 双目图像数据集,内含 7 个训练数据集、2 个测试数据集。每个数据集包含 4 到 5 个关键帧,通过结构光采集关键帧对应的深度信息。通过达芬奇机器人动力学信息获取关键帧间的深度信息
- 对应论文: Allan M, Mcleod J, Wang C, et al. Stereo correspondence and reconstruction of endoscopic data challenge[J]. arXiv preprint arXiv:2101.01133, 2021.
- 备注:
- dataset 4 和 dataset 5 有较大的 calibration error,所以很多论文中不使用 dataset 4 和 dataset 5 进行训练。
- 由于关键帧之间的深度信息通过动力学信息插值而来,STTR 只用关键帧进行评估。
- 示例图像: