본문 바로가기

데이터 사이언스 이야기

[Case Study] 반지도학습에 의한 이상검사

외관의 이상은 재현율이 낮으므로 발생할 수 있는 이상 패턴을 망라하여 대량으로 수집하는 것이 어렵다.
따라서 학습 데이터에 포함되는 이상데이터는 소량이 된다.
이런 경우, 정상 데이터만을 학습하는 것으로 정상, 이상 데이터를 판별하는 반지도학습(정상인지 이상인지 binary로 분류한다는 전제로) 수법이 고안되었다.
그 수법의 하나로서 이미지의 차원삭감 및 재구성을 이용하는 방법이 있다.

이 방법에서는, 먼저, 정상 데이터만을 사용한 학습에 의해, 정상 이미지 데이터의 특징을 가지는 데이터의 성분 수를 줄이는 차원 삭감 구조와, 차원삭감한 데이터에서 원래의 정상 이미지 데이터에 가까운 이미지를 복원하는 재구성 구조의, 2개의 구조를 구축한다.
이 차원삭감 및 재구성 구조에 이상데이터를 입력하면, 재구성 전후에 이상 부분만이 변화하여, 다른 부분은 정상데이터와 유사한 이미지로 재구성되는 경향이 있다.
재구성 전후의 이미지의 차분인 재구성오차를 평가하여, 오차가 작은 것을 정상품, 오차가 큰 것을 불량품으로 분류한다.
Auto Encoder, pix2pix 등의 수법을 이용할 수 있다.

이러한 수법으로, 정상데이터의 패턴이 비교적 단순한 케이스에는 대체로 높은 분류성능이 얻어지지만,
복잡한 대상에 대해서는 성능이 좋지 못한 경우가 많다.
패턴이 복잡한 경우에 높은 성능을 내기 위한 수법은 아직 없는 듯 하다.

참고자료:
機械学習と外観検査 進む検査の自動化とその課題 掲載誌 画像ラボ / 画像ラボ編集委員会 編 32(6)=378:2021.6 p.15-22