이파피루스, LLM 기반 문서 AI 제품으로 시장 선도… 출처확인·비정형 민감정보 비식별화 구현
  • 최종윤 기자
  • 승인 2024.10.08 15:13
  • 댓글 0
이 기사를 공유합니다

‘StreamDocs.ai’, 문서 내용 요약하고 필요한 정보까지 검색
‘AI BlackMarker’, 이름·지명·인적 관계 등 비정형 정보도 완벽 비식별화

[인더스트리뉴스 최종윤 기자] 문서 AI 기업 이파피루스(대표 김정희)가 최근 LLM(대규모 언어 모델, Large Language Model) 기반 문서 AI 제품을 연달아 출시했다.

StreamDocs.ai(스트림닥스 에이아이) 서비스 화면. 좌측에 표시된 문서에 대해 사용자와 인공지능이 우측의 채팅창에서 대화를 나누고 있다. 인공지능이 답변한 내용의 근거가 되는 문장은 문서 내 하이라이트로 표시되며, 해당 문장 바로가기 버튼이 제공된다. [자료=이파피루스]

지난 6월 국내 및 글로벌 동시 출시한 ‘StreamDocs.ai(스트림닥스 에이아이)’는 인공지능 문서 질의응답 LLM 서비스다.

문서 내용을 토대로 인공지능과 대화하며 필요한 정보와 인사이트를 얻을 수 있다. 긴 문서의 내용을 핵심만 요약하거나, 수백 장의 문서 내에서 필요한 정보만 빠르게 검색하는 등의 요청을 대화식으로 편하게 요청하고 답변을 받을 수 있다.

특히 답변의 근거가 되는 문장을 문서 내에 하이라이트로 표시하고, 답변 하단의 출처 버튼을 누르면 문서 내 해당 위치로 바로 이동해 내용을 확인할 수 있어 유사 서비스 대비 답변 신뢰도도 한층 더 높였다.

이파피루스 ‘AI BlackMarker’의 비식별화 프로세스. 연락처나 신분증 번호 등 정형화된 개인정보는 물론, LLM의 문맥 분석을 통해 신체적·인적·정신적·사회적·재산적 정보까지 감지하고 비식별화한다. [자료=이파피루스]

지난 달 출시한 개인정보 비식별화 솔루션 ‘AI BlackMarker(에이아이 블랙마커)’는 LLM을 통해 기존 비식별화 솔루션의 한계를 극복한 제품이다.

LLM을 통해 개인정보 처리를 학습한 AI 모델을 적용, 문서에 포함된 주민등록번호·전화번호·이메일과 같이 정형화된 규칙을 가진 개인정보는 물론, 성명이나 별명, 주소와 출생지, 직업이나 인적 관계 등 문맥을 이해해야 감지할 수 있는 비정형 민감정보까지 빠르고 정확하게 찾아내어 다른 문자로 치환하거나 가림 처리한다.

사전 설정한 옵션에 따라 다량의 문서 내에 포함된 민감정보를 자동으로 감지하고 비식별 처리하는 서버 기반 자동 배치 처리 기능으로 대량의 문서도 빠르고 안정적으로 작업할 수 있다.

비식별화 후 기존의 텍스트 정보는 완전 삭제하므로 원본 문서 복구를 통한 유출 시도까지 원천 차단된다. 이파피루스의 PDF 스트리밍 뷰어인 ‘StreamDocs(스트림닥스)’와 연계해 비식별 처리된 문서를 다운로드 없이 웹 브라우저에서 열람하면서 직접 비식별 영역을 추가하거나 수정할 수도 있다.

이파피루스 김정아 부사장은 “’StreamDocs.ai’는 서비스 홈페이지 런칭 이후 글로벌 시장에서 많은 주목을 받고 있고, ‘AI BlackMarker’ 또한 고객 문의가 빗발칠 정도로 뜨거운 관심을 모으고 있다”며, “LLM이라는 강력한 인공지능 기술에 그동안 축적해 온 심도 깊은 문서 기술과 노하우를 접목한 결과 정확성과 신속성, 사용자 편의성까지 세 마리 토끼를 모두 잡았다”고 강조했다.


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.