인공지능 기술 활용해 청각장애인 지원
[인더스트리뉴스 방제일 기자] ‘자율지능 디지털 동반자’ 과제는 과학기술정보통신부가 2017년부터 2020년까지 사용자의 생각과 의도를 이해하고 공감해 반응하는 인공지능 기술 개발 목적으로 추진 중인 지능정보 플래그십 사업으로 개발된 기술로, 순환신경망의 일종인 양방향 LSTM(Long short-term memory)을 기반으로 머신러닝을 기술로 수행하고 수어구현자의 손, 얼굴, 입 등에서 특징점을 추출해 한국어 문장으로 해석하는 타 기술대비 높은 ‘실용성’과 ‘간편성’, ‘정확성’을 자랑한다.
기존의 수어 인식기술은 국어와 수어 간 서로 다른 어순을 고려하지 않고 단순히 수어를 단어로 대체하는 형태로 개발돼 청각장애인의 실제 사용이 어려웠으나 KETI 기술은 청각장애인의 수어 자체를 학습하고 이해하는 인공지능 기술로 청각장애인이 실생활에 활용 가능하다.
기존 개발기술은 적외선을 이용한 깊이카메라를 사용하기 때문에 태양광을 차단하거나 수어 제공자의 몸에 센서를 부착해야 하는 등 3차원 정보추출을 위한 별도의 디바이스가 필요했다. 하지만 이번 KETI기술은 웹캠과 같은 일반 카메라만으로도 구동이 가능해 장소제약이 없고 저렴한 비용으로 활용할 수 있다.
이번 KETI 기술은 96%까지 정확도를 끌어 올렸다. 특히 비전문가의 수어도 인지하는 정밀한 기술로 어느 누가 수어를 하더라도 인식 수준이 높다. KETI는 이번 기술개발을 위해 수어통역 연구의 국내 최고 기관인 나사렛대학과 협력해 2017년부터 인공지능 학습을 위한 수어 데이터 구축을 진행했다.
인공지능 수어 인식 엔진 개발, 인공지능 수어 데이터 설계인공지능 학습용 수어 데이터셋을 구축 및 검증했고 현재는 청각장애인의 안전과 관련한 112, 119 신고 및 기타 도움 요청에 필요한 필수 단어 419개와, 문장 105개를 대상으로 10명의 수어 구현자를 다각도에서 촬영해 11.5시간 분량의 동영상 10,480개를 구축한 상태다.
세계에서 가장 많은 수어 데이터를 확보한 나라인 독일은 DGS말뭉치 프로젝트를 통해 560단어를 5명의 화자가 녹화한 2,800개 샘플 데이터와, 7명의 날씨방송 수어영상 45,760개의 비디오클립을 확보했다. 미국 또한 약 2,700단어 9,800샘플 데이터 분량 ASLLVD 구축했고 중국의 경우 수어구현자 8명, 2,000단어, 총 24,000샘플 동영상 데이터를 포함한 DEVISIGN 구축했다.
향후 연구팀은 안전 분야 외 의료, 민원, 금융, 편의서비스 등과 관련한 수어데이터를 지속 구축해 선진국 수준의 데이터셋을 확보하고 인식 성능 또한 개선할 계획이다. 연구를 총괄한 KETI 정혜동 인공지능연구센터장은 “본 기술 개발을 통해 인공지능이 누구나 불편함이 없도록 세상을 연결하는 가교 역할을 하길 기대한다”며, “앞으로 AI기반 행동 인식 기술을 지능형 CCTV에 확대 적용해 도시안전에 활용하거나 자율주행차에 탑재해 경찰관 수신호까지 인지할 수 있도록 하는 등, ‘언행’ 모두를 이해하는 고지능 AI기술로 업그레이드할 계획”이라고 밝혔다.