[인더스트리뉴스 한원석 기자] 오픈AI는 영상으로 본 내용을 실시간으로 처리하고 사람과 자연스럽게 대화할 수 있는 챗GPT를 출시한다고 12일(현지시간) 발표했다. 지난 5월 이러한 기능을 처음 공개한 지 7개월 만이다.
이번 발표는 오픈AI가 이날 라이브 스트리밍 이벤트가 있을 것이라고 예고한 가운데 나왔다. 오픈AI는 챗GPT가 스마트폰 카메라를 통해 물체를 인식하고 말을 통해 화면에 있는 내용에 반응할 수 있다고 설명했다.
예를 들어 챗GPT 사용자는 앱에서 메시지에 응답하는 데 도움을 요청하거나 커피 제조에 대한 실시간 지침을 받을 수 있다.
이날 공개한 시연 영상에서 챗GPT에 오픈AI 4명의 직원을 보여주면서 “사슴의 뿔을 쓰고 있는 동료의 이름은?”, “산타의 모자를 쓰고 있는 동료의 이름은?”이라고 물으니 정확히 이름을 답했다.
또 커피 내리는 세트를 보여주자 챗GPT는 “커피세트가 보인다, 커피를 내릴 계획인가”라고 물었다. 이에 “그러려고 하니 커피 내리는 방법을 알려달라”고 하자 커피 내리는 방법을 단계별로 설명했다.
유료 챗GPT 플러스 및 프로 구독자는 이날부터 사용할 이러한 옵션을 사용할 수 있다. 오픈AI의 기업 및 교육 고객은 내년 1월부터 이 기능을 사용할 수 있다고 회사 측은 언급했다.
챗GPT 채팅창 옆에 있는 음성 아이콘을 누르고, 화면 왼쪽 하단의 비디오 아이콘을 탭 하면 비디오 모드가 시작될 수 있다고 오픈AI는 설명했다. 오픈AI는 크리스마스를 앞두고 챗GPT의 5가지 종류의 목소리를 내는 음성 기능에 ‘산타 음성’도 추가했다.
오픈AI는 2년 전 챗GPT의 출시와 함께 텍스트 기반 챗봇에 대한 투자를 시작했다. 그 이후 오픈AI와 그 경쟁사들은 오디오와 이미지, 비디오에 응답하는 이른바 ‘멀티모달(multimodal)’ 기능을 밀어붙였고, 이 과정에서 이러한 서비스는 보다 역동적이고 매력적인 디지털 어시스턴트를 제공할 수 있었다고 블룸버그 통신은 전했다.