マルチタスク検出器Mask R-CNNのchainer実装 (https://arxiv.org/abs/1703.06870)
- 準備中
$ pip install chainer
$ pip install chainercv
$ pip install cupy==1.0.3
- Python 3.0+
- NumPy
- Matplotlib
- OpenCV
- Precision Evaluator (bbox, COCO metric)
- Detectron Model Parser
- Modify ROIAlign
- Mask inference using refined ROIs
- Precision Evaluator (mask, COCO metric)
- Feature Pyramid Network (R-50-FPN)
- Keypoint Detection (R-50-FPN, Keypoints)
- [Model Zoo] (https://github.com/facebookresearch/Detectron/blob/master/MODEL_ZOO.md) からモデルファイルをダウンロード
(
End-to-End Faster & Mask R-CNN Baselines
のR-50-C4 Mask
行のmodel
リンク) modelfiles
ディレクトリを作り、ダウンロードしたmodel_final.pkl
を置く- 以下を実行
python utils/detectron_parser.py
modelfiles
の中に変換されたモデルファイルが保存されます。- 以下によりデモを実行
python demo.py --bn2affine --modelfile modelfiles/e2e_mask_rcnn_R-50-C4_1x_d2c.npz --image <input image>
-
学習済みモデルのダウンロード
・以下リンク先の'OneDrive download'から、ResNet-50-model.caffemodelをダウンロード ResNet pretrained models ・~/.chainer/dataset/pfnet/chainer/models/ に置く -
COCO 2017 データセット COCOデータセットのダウンロードと解凍:
bash getcoco.sh
- COCO APIのセットアップ:
git clone https://github.com/waleedka/coco
cd coco/PythonAPI/
make
python setup.py install
cd ../../
python train.py
引数は以下です:
'--dataset', choices=('coco2017'), default='coco2017'
'--extractor', choices=('resnet50','resnet101'), default='resnet50', help='extractor network'
'--gpu', '-g', type=int, default=0
'--lr', '-l', type=float, default=1e-4
'--batchsize', '-b', type=int, default=8
'--freeze_bn', action='store_true', default=False, help='freeze batchnorm gamma/beta'
'--bn2affine', action='store_true', default=False, help='batchnorm to affine'
'--out', '-o', default='result', help='output directory'
'--seed', '-s', type=int, default=0
'--roialign', action='store_true', default=True, help='True: ROIAlign, False: ROIpooling'
'--step_size', '-ss', type=int, default=400000
'--lr_step', '-ls', type=int, default=480000
'--lr_initialchange', '-li', type=int, default=800
'--pretrained', '-p', type=str, default='imagenet'
'--snapshot', type=int, default=4000
'--validation', type=int, default=30000
'--resume', type=str
'--iteration', '-i', type=int, default=800000
'--roi_size', '-r', type=int, default=14, help='ROI size for mask head input'
'--gamma', type=float, default=1, help='mask loss balancing factor'
本実装ではsubdivisionを用いたupdateを行なっているため、batch size = 1 相当のGPUメモリでbatch size=8等を指定可能です
入力画像のインスタンス・セグメンテーションを実行します:
python demo.py --image <input image> --modelfile result/snapshot_model.npz --contour
COCO metric (Bounding Box, Segmentation) によるモデルの評価を実行します。
python train.py --lr 0 --iteration 1 --validation 1 --resume <trained_model>
Please cite the original paper in your publications if it helps your research:
@article{DBLP:journals/corr/HeGDG17,
author = {Kaiming He and
Georgia Gkioxari and
Piotr Doll{\'{a}}r and
Ross B. Girshick},
title = {Mask {R-CNN}},
journal = {CoRR},
volume = {abs/1703.06870},
year = {2017},
url = {http://arxiv.org/abs/1703.06870},
archivePrefix = {arXiv},
eprint = {1703.06870},
timestamp = {Wed, 07 Jun 2017 14:42:32 +0200},
biburl = {http://dblp.org/rec/bib/journals/corr/HeGDG17},
bibsource = {dblp computer science bibliography, http://dblp.org}
}