d라이브러리









[논문탐독] 데이터 쪼개고 합쳐 구축한 스마트팩토리

 

스마트팩토리는 제조기업의 공장에 도입되는 지능형 생산 공정을 말합니다. 4차 산업혁명을 계기로 더 부각된 기술이지요. 스마트팩토리에서는 공정 설비와 기계에 사물인터넷(IoT)과 같은 정보통신기술을 도입함으로써, 공정에서 발생하는 여러 종류의 데이터를 수집하고 분석합니다. 스마트팩토리 환경이 구현된다면 사람이 하나하나의 공정을 관리하지 않더라도 기계가 의사결정을 통해 공정을 관리할 수 있습니다. 더 적은 인력을 투입해도 설비의 고장률이나 제품의 불량률을 낮출 수 있습니다.

 

데이터로 만드는 스마트팩토리


스마트팩토리를 구현하기 위해서는 실시간으로 공정의 이상을 탐지하는 기술이 중요합니다. 자동화 공정을 만들기 위해서는 센서로부터 공정의 상태를 나타내는 데이터를 수집·분석하는 체계가 필요합니다. 고장으로 생기는 피해를 신속하게 예방하거나, 생산되는 제품에 불량이 발생했는지를 실시간으로 탐지할 때 활용됩니다.


여기에는 다양한 형태의 데이터가 활용됩니다. 예를 들어 스마트팩토리를 구성하는 각 장치에서 발생하는 소음이나 진동 등 물리적인 신호 모두가 데이터가 됩니다. 어떤 데이터를 활용해 공정을 자동화할지는 구현하고자 하는 스마트팩토리의 특징과 목적에 따라 달라집니다.
수리학, 통계학에서 이미지 데이터는 숫자로 이뤄진 임의의 행렬로 표현됩니다. 데이터 자체만 봐선 어떤 의미가 있는지 쉽게 파악할 수 없지만, 사실 숫자에는 데이터가 가지는 고유한 특성이 내재해 있습니다. 데이터가 감추고 있는 특성을 추출하기 위해서는 신호처리 과정을 거쳐야 합니다.

 

데이터 이면의 데이터를 찾는 방법


이번에 살펴볼 논문도 2차원 이미지 데이터를 활용해 공정상의 고장 여부를 파악하고 분류하는 기술을 다루고 있습니다. 핵심을 한눈에 볼 수 있는 문장은 ‘결론(Concluding remarks)’ 단락에 있습니다. ‘In this study’로 시작하는 문장이죠. 연구팀은 2차원 이산 웨이블릿 패킷 변환(2D DWPT)이라는 신호처리 방법을 활용해 이미지 데이터에서 특징을 추출했습니다. 그리고 이를 학습시켜 높은 정확도로 불량품과 공정의 고장을 알아낼 수 있는 분류기를 제안했습니다.


이미지 데이터는 실제 공정을 통해 생산된 수중 펌프 사진을 이용했습니다. 주조 방식으로 만들어지는 수중 펌프는 불량률이 꽤 높습니다. 일반적인 공정에서는 품질을 담당하는 사람들이 하나하나 상태를 확인해야 합니다. 만약 펌프 사진을 확인했을 때 정상품이라면 공정에 이상이 전혀 없다는 신호로 받아들일 수 있습니다. 반대로 불량품이 촬영됐다면 어딘가에서 고장이 발생했다고 볼 수 있습니다. 연구팀은 이런 데이터들을 예측모델 대회 플랫폼인 ‘캐글’에서 얻었습니다. 캐글뿐만 아니라 최근에는 공공데이터 댐 등에서도 연구에 필요한 데이터를 구할 수 있습니다.


이번 논문에서 사용된 2D DWPT는 데이터를 시간-주파수 영역대를 갖는 신호로 변환하는 기법입니다. 하나의 데이터에서부터 단계적으로 신호를 추출해 피라미드 형태의 계층 신호 집합으로 분해할 수 있습니다. 이때 각 계층으로 쪼개진 신호들은 기존의 이미지보다 하위 수준의 이미지로 변환되며, 이를 서브 이미지라고 합니다.


이렇게 분해된 서브 이미지를 시간에 따라 확률적으로 변환시키는 과정을 거치면, 각 계층의 서브 이미지가 갖는 에너지 값이 하나의 특징으로 산출됩니다. 이 특징값을 이용하면 서브 이미지 계층 간의 관계를 통계적으로 표현할 수 있고, 그 결과 하나의 이미지가 갖는 불규칙성이나 반복성 등 패턴을 추출할 수 있습니다.


이미지 데이터에서 특징을 추출한 이후에는 기계학습을 시켜 분류기를 만들었습니다. 기계학습으로 분류기를 만드는 방식은 원리에 따라 여러 가지가 있습니다. 이번 논문에서는 인공신경망(ANN)과 랜덤 포레스트(RF), 서포트 벡터 머신(SVM) 등 3가지의 알고리즘을 활용했습니다. 각각의 분류기로 불량 판정의 정확도를 확인한 결과 가장 높은 99.26%의 정확도를 보이는 알고리즘은 SVM이었습니다. 다음으로는 ANN이 96.85%, RF는 92.27% 순서였습니다.


SVM은 고차원으로 매핑된 데이터를 분류하는 데 특화된 알고리즘입니다. 3차원 이상의 고차원 공간에 기준면을 두고 어느 지점에 있는지에 따라 각각의 데이터가 갖는 의미를 구분합니다. 데이터를 분류할 때 여러 차원을 사용한다는 것은 다양한 변수를 고려한다는 의미입니다. 분류 정확도를 더욱 높일 수 있죠. 넓은 운동장에 사람들을 모은 뒤 두 가지 특징에 따라 좌표를 만들어 각자의 위치에 세워놨다고 생각해봅시다. 이들을 두 그룹으로 나누기 위해서는 적절한 위치에 선을 그어야 합니다. 특징을 세 가지로 늘린다면 3차원 건물에 사람들을 배치하고 면을 이용해 분류할 것입니다. 그 이상의 차원에서는 초평면(hyperplane)을 이용해 분류할 수 있습니다. 이렇게 고차원 공간에서 데이터들을 구분해낼 수 있는 초평면을 만들어 데이터를 분류하는 것이 바로 SVM입니다.

 

스마트팩토리, 완벽을 꿈꾼다


언뜻 세 가지 분류기의 정확도는 모두 90% 이상으로, 충분히 높은 것 같습니다. 하지만 자동화, 무인화를 이루기 위한 스마트팩토리 구축이 목적이라면 100%에 가까운 정확도를 구현해야 합니다. 스마트팩토리를 구축한다는 것은 단순히 사람이 해야 하는 작업을 대체하는 데 국한된 것이 아닙니다. 자동화의 결과물이 사람의 작업 결과와 비슷하거나 그보다 뛰어나야 산업적으로 의미가 있습니다. SVM 분류기가 보여 준 99.26%의 정확도는 실제 사람이 공정에서 눈으로 보고 불량을 탐지하는 것과 비슷한 수준입니다. 이번 연구결과가 스마트팩토리에 적용된다면 공정에서 발생하는 손실 비용을 개선할 수 있을 것으로 기대됩니다.


최근에는 스마트팩토리 분야가 지속해서 성장함에 따라 공정 최적화에 관한 다양한 연구가 이뤄지고 있습니다. 이번에 소개한 신호처리와 통계적 기법 외에 딥러닝 등의 최신 방법론들을 활용하는 등 많은 연구자가 불량 탐지 100%의 정확도에 도전하고 있습니다. 이 내용을 흥미롭게 보신 독자 여러분들께서도 도전의 주인공이 되실 수 있기를 기대합니다. 

 

● 임문원 연구원의 논문 읽기 노하우
          

읽을 논문을 고르는 기준이 있나요?
관심 분야의 리뷰 논문을 우선 찾아봅니다. 필요한 내용에 주석으로 달린 참고논문을 찾아볼 수도 있습니다. 이외에도 피인용 수가 많은 논문, 유명한 학술지에 새로 게재된 논문을 고르는 편입니다.

 

논문은 어떤 순서로 읽나요?
초록, 서론, 결론을 먼저 읽습니다. 논문에서 하고자 하는 이야기를 알 수 있습니다. 저한테 필요한 내용이 맞다면 연구방법에 대한 부분을 읽습니다. 최근에는 생산품의 열화에 관한 연구를 하고 있는데, 이렇게 찾고 읽은 논문들이 많은 도움이 되고 있습니다.

 

산업공학 분야 논문을 읽는 데 필요한 지식은?
기본적으로 수학, 통계학, 프로그래밍에 대한 지식이 필요합니다. 산업 분야마다 다루는 문제는 다를 수 있지만, 데이터 대부분을 수학과 통계학으로 해석합니다. 또 인공지능(AI) 관련 논문이 많아 프로그래밍 지식이 중요합니다.

 

데이터 연구를 위한 자료를 얻을 수 있는 곳은?
이번에 소개한 논문에서는 캐글에서 얻은 데이터를 사용했습니다. 국내 기업들의 데이터를 얻을 수 있는 플랫폼인 데이콘, 최근 베타 서비스를 시작한 구글 데이터 박스 등도 있습니다. 코드에 대한 정보는 깃허브가 유용합니다.

 

산업공학과 진학을 꿈꾸는 후배들에게 한마디.
산업공학은 모든 산업 현장에서 일어날 수 있는 문제를 해결하고, 최적화하는 방법을 제시하는 학문입니다. 그만큼 다양한 경험을 할 수 있습니다. 산업 문제 해결의 전문가가 되고 싶은 분들을 기다리겠습니다.

 

※필자소개

임문원. 한양대 산업공학과 확률통계모형연구실에 재학 중이다. 현재 통계적 방법론을 활용한 신호, 이미지 기반 이상 탐지를 전공하고 있으며, 통합 생산 시스템에 대한 건전성 예측 및 관리 연구를 진행하고 있다. moonmunwon@psm.hanyang.ac.kr

 

※좋은 질문 챌린지
QR코드를 스캔해 필자에게 전공·진로·연구에 관해 물어보세요.http://m.scienceboard.co.kr/contents/view/14786

2022년 1월 과학동아 정보

  • 임문원 한양대 산업공학과 석·박통합과정 연구원
  • 에디터

    이볃철 기자

🎓️ 진로 추천

  • 산업경영공학
  • 컴퓨터공학
  • 통계학
이 기사를 읽은 분이 본
다른 인기기사는?