[서울=뉴스핌] 이영기 기자 = 비큐AI는 자체 인공지능(AI) OCR(광학문자인식) 솔루션 'Be Reader' 개발을 완료하고 기존에 사용하던 외산 OCR 솔루션을 Be Reader로 전면 교체한다고 5일 밝혔다. 비큐AI는 향후 전개할 다양한 AI 사업에 Be Reader를 자사 제품과 서비스에 적극 적용할 예정이다.
AI OCR 기술은 이미지를 구조화된 형태로 변환해 AI 모델이 텍스트 데이터를 학습하고 이해할 수 있도록 하는 기술이다. 인공지능(AI) 및 머신러닝(ML) 분야에서 매우 중요한 기반 기술로 평가받는다.
여전히 종이 문서와 이미지 형식의 데이터에 많은 기업들이 의존하고 있는 가운데 관련 데이터는 AI 및 ML 시스템이 학습하고 분석할 수 있는 형태로 전환되지 않으면 활용될 수 없다. 업계에서는 AI 빅테크들이 추가 학습 데이터를 확보하기 위해 AI OCR과 같은 고도화된 기술이 필요할 것으로 내다보고 있다.
AI OCR 기술은 인쇄 품질, 폰트 전환 범위, 배경 질감, 언어, 손글씨체 등 고려해야 하는 개발 변수가 매우 많다. 특히 한국어는 영문보다 복잡해 한국어 데이터를 활용하기 위해서는 특화된 AI OCR이 필요하다.
회사 측에 따르면 내부 성능 검증 결과 비큐AI의 Be Reader는 비교 제품군의 평균 인식률 91.6% 대비 큰 폭으로 향상된 96.7%의 인식률을 기록했다. 특히 A1 대형 사이즈의 이미지에 대한 학습과 고도화로 단으로 구분된 이미지 내 텍스트 구분과 인식 기능이 월등하다는 게 큰 특징이다.
비큐AI 관계자는 "기존 외산 제품이 가지는 리스크 요인을 줄이고자 오픈소스를 기반으로 자체적 데이터 학습과 정확도 향상 기술 개발을 진행해 왔다"며 "내부 성능 검증 결과 인식률이 대폭 향상되었고, 이는 전체적인 데이터 정확성과 처리 속도 역시 향상됐다"고 설명했다.
그는 "Be Reader를 통해 국내외 논문, 잡지, 학술지 등 다양한 종류의 자료에서 고객이 원하는 형태로의 데이터 제공이 가능해 최적의 서비스를 제공할 수 있다"며 "AI 데이터 확보 과정에서 소요되는 고객의 시간과 비용이 크게 절감돼 회사 AI 사업의 경쟁력이 한층 더 강화될 것"이라고 덧붙였다.
한편, 비큐AI는 이미 자체 데이터 처리 기술을 통해 고품질의 뉴스 데이터를 국내 주요 대기업에 AI용 학습 목적으로 제공하고 있다. 최근 해외 AI 빅테크와의 사업기회를 모색하는 등 AI 사업에 역량을 집중하는 것으로 알려졌다.
007@newspim.com