[한국기술뉴스] 인천대학교 황광일 교수 연구팀은 움직이는 물체 속 문자를 인식하는 SLAM 기반 텍스트 결정 장치를 개발했다. 개발된 기술은 인천대학교 산학협력단을 통해 특허를 출원(출원번호 제1020220015413호)했다. 특허 명칭은 '이동객체에서 촬영하는 장면 내 텍스트 결정 장치’이다. 현재 특허 등록이 완료돼 산업에서 기술을 활용할 수 있도록 기술이전을 추진할 계획이다.
[기자]
OCR(Optical Character Recognition) 기술은 딥러닝 기술의 발전으로 인해 우수한 성능을 보여주고 있습니다. 이 기술은 움직이는 물체에서 문자 인식을 가능하게 합니다. 특히, 로봇이 자체적으로 맵을 만들고 위치를 추정할 수 있는 SLAM 기술에서 OCR 기술이 적용되고 있어 특별한 관심을 받고 있습니다.
SLAM(Simultaneous Localization and Mapping)은 로봇의 위치와 주변 환경을 동시에 추적하는 기술입니다.
SLAM 기술은 영상에서 텍스트를 인식하는 것을 기반으로 하지만, 텍스트가 움직이면 정확한 인식 결과가 나오지 않을 수 있습니다. 예를 들어, 카메라가 움직이거나 텍스트가 있는 물체가 움직일 때 "인공지능"이라는 텍스트를 잘못 인식할 수 있습니다.
인천대학교 황광일 교수 연구팀은 움직이는 객체에서 촬영한 영상에서 텍스트를 제대로 인식할 수 있는 텍스트 결정 장치를 개발했습니다. 이 장치는 움직이는 물체에서 촬영한 장면에서 타깃 텍스트를 정확하게 인식할 수 있도록 도와줍니다.
텍스트 결정부는 움직이는 영상에서 텍스트를 정확히 인식하기 위해 구현되었습니다. 영상 프레임에서 타깃 텍스트를 추적하고, 추적한 타깃 텍스트가 적절한 크기를 가지면 레이블을 부여하고 텍스트 인식 결과를 평가합니다. 그리고 가장 높은 평가 점수를 가진 타깃 텍스트가 최종적으로 인식됩니다.
본 발명은 이동하는 객체에서의 텍스트 인식 정확도와 로봇에서의 문자 기반 SLAM 정확도를 향상시킵니다. 자율 주행 자동차에서는 표지판 정보를 정확도 높게 획득할 수 있을 것으로 기대됩니다.