[한국기술뉴스] 한양대 로봇공학과 이영문 교수팀이 최근 인공지능(AI)이 실시간으로 사람 및 사람의 포즈를 인식·분석하는 ‘PosePlusSeg’을 개발했다고, 한양대가 28일 밝혔다. PosePlusSeg는 AI가 사람을 인식함과 동시에 개별 행동을 추정할 수 있게 만든 기술이다. 해당 기술은 모션캡쳐 영역에서 활용은 물론 향후 AI가 다수의 사람을 동시에 인식하고 개인별로 맞춤 서비스를 제공하는 어플리케이션 등 다양한 AI 영역에서 활용될 수 있을 것으로 예상된다.
AI가 사람의 행동을 파악하고 상황에 맞는 최적의 상호작용을 위해 사람을 정확히 인식하고 사람의 행동을 파악하는 기술이 필요하다. 하지만 기존의 기술로는 사람의 포즈에 따라 인식률이 달라지고, 특정영역 내 사람 수가 많아질 경우 연산량이 늘어나 분석 속도가 느려져 활용에 제약이 있었다. 이 교수팀은 해당 문제를 해결하고자 사람을 먼저 찾고 신체부위를 찾아 포즈를 추정하는 기존 top-down 방식 대신, 신체부위를 먼저 찾고 포즈를 추정하는 bottom-up 방법을 사용했다.
PosePlusSeg의 핵심은 성능을 전반적으로 향상시키는 학습 패러다임(Multi-task Learning)을 통한 연산량 증가 없이 사람 인식 및 포즈 추정에 있다. 또 기존 bounding box(바운딩박스 : 이미지에서 물체가 어디에 위치하는지를 설명하는 방식 중 물체의 바운더리를 직사각형으로 표현하는 방식) 방식의 개체 인식이 아닌 픽셀 방식의 객체 인식 그리고 포즈추정 모델을 동시에 학습하는 점도 특징으로 꼽는다.
그 결과 PosePlusSeg는 대표적 top-down 방식인 페이스북의 Mask R-CNN(사물을 감지하고 그 사물의 주변 경계선을 그려 식별하는 컴퓨터 시력 알고리즘) 처리속도(5 fps)보다 5배 이상 빠른(28fps) 수준으로 속도를 크게 향상시켰고, 이로 인해 AI의 실시간 인식·분석이 가능하게 만들었다.
PosePlusSeg는 독창성과 우수성을 인정받아 2월 22일부터 3월 1일까지 열리는 ‘AAAI Conference on Artificial Intelligence (AAAI)’에서 발표될 예정이다. AAAI는 Association for the Advancement of Artificial Intelligence의 플래그쉽 학회로 세계적으로 인정받는 인공지능 분야의 최우수 컨퍼런스다. 한편 이번 연구는 Niaz Ahmad, Jawad Khan, 김유현 연구원, 이영문 교수가 참여했으며 인공지능융합센터, 한국연구재단, 정보통신기획평가원의 지원을 받아 진행됐다.