연구는 각자 데이터셋을 수집하고, 레이블링 작업을 거친 후, Mask R-CNN 모델을 이용하여 결과를 확인하는 순서로 진행.
Mask R-CNN은 facebook에서 만든 기술로 객체의 detection, segmentation을 동시에 수행하는 모델입니다. 기존에 많은 데이터셋으로 학습된 경우 실제 Mask R-CNN은 객체 검출 및 분할이 잘되는 것을 확인하였고, 새로운 객체에 대한 학습을 위해 일반적인 학습과 coco 모델 기반 Transfer Learning의 성능을 비교한 결과 실제 검출할 객체가 coco 클래스와 유사하다면 Transfer Learning이 학습 속도, 정확도 면에서 유용하다는 것을 확인하였음.
일반학습
600 epoch
Loss 0.2202
전이학습(Transfer Learning)
150 epoch
Loss 0.1730
일반학습 600 epoch 학습한 것과 Transfer Learning 150 epoch 를 같은 데이터로 학습 시켰을 시 실제 Loss가 Transfer Learning이 더 낮게 나타나는 것을 확인하였음.