전체기사 최신뉴스 GAM 라씨로
KYD 디데이
산업 중기·벤처

속보

더보기

올거나이즈, '알리 RAG 리더보드' 공개

기사입력 : 2024년05월29일 14:15

최종수정 : 2024년05월29일 14:15

[서울=뉴스핌] 송은정 기자 =올거나이즈가 국내 최초 RAG 리더보드인 '알리(Alli) RAG 리더보드'를 공개한다고 29일 밝혔다.

[사진=올거나이즈]

RAG(Retrieval Augmented Generation, 검색증강생성)란 생성형 AI의 환각(할루시네이션) 현상을 최소화할 수 있는 대안으로 주목받는 기술이다. 사전 학습한 데이터만을 활용하는 게 아닌, 기업 내부 데이터 등 이미 존재하는 데이터에서 답을 찾아낸다. 이들 답변 중 질문 및 검색어의 맥락을 고려한 후 가장 적절한 대답을 제공하는 식이다. 올거나이즈의 RAG 리더보드는 RAG 기술의 성능을 측정해 순위를 매겨 기업 AI 실무자들이 가장 적절한 솔루션을 비교 도입할 수 있도록 돕는다.

올거나이즈의 알리 RAG 리더보드는 금융, 공공, 의료, 법률, 커머스의 5개 분야에 대한 한국어 RAG 성능을 평가한다.

답변 유사도 및 정확도를 판단하는 5개의 평가 툴로 RAG 성능을 평가해 신뢰도를 높이고 오차를 줄였다. 우선 각 분야별로 2~300페이지의 문서를 업로드한 후 분야마다 사용자가 할 법한 질문 60개를 생성했다. 질문별로 RAG가 답변을 생성하면 5개의 평가 툴 중 3개 이상에서 오류가 없을 경우 '이상 없음'으로 판명한다. 해외 RAG 리더보드의 경우 일반적으로 1~2개의 평가 툴만을 활용하고 있다.

특히 현재 공개돼 있는 RAG 리더보드 중 유일하게 RAG의 3개 구성요소를 모두 평가한다. RAG는 문서에서 글자·그림·표 등을 추출하고 읽기 쉬운 포맷으로 변경해주는 파서(Parser), 기업이 보유한 방대한 데이터 중 사용자가 원하는 대답을 즉시 찾아주는 리트리버(Retrieval), 새로운 지식과 학습 데이터를 토대로 LLM이 응답을 생성해내는 답변생성(Generation)의 3개 요소로 구성돼 있다.

기업들이 RAG을 도입하고자 할 때 어떤 RAG가 적합한지 성능평가를 제대로 하기 어렵다는 점을 고려해 테스트 데이터셋을 모두 공개했다. 실제 업무 문서에 표, 이미지 등이 복잡하게 얽혀 있다는 점을 감안해서 표 및 이미지 데이터도 테스트 데이터셋에 포함시켰다.

리더보드는 허깅페이스를 통해 확인할 수 있다. 리더보드에 들어간 RAG 솔루션들도 링크로 공개돼 있어 누구나 손쉽게 체험해 볼 수 있다.

올거나이즈 다양한 산업별 고객사와의 협업 노하우를 바탕으로 자체 개발한 RAG 솔루션을 공급하고 있다. 올거나이즈의 'RAG 2.0'은 수백만 건 이상의 사내 문서에서 정확한 답을 찾기 위해 고성능의 리트리버 모델을 전략적으로 구성해 왔다. 키워드 검색 모델인 '엘라스틱 서치', 문서의 제목과 페이지를 중점적으로 찾는 모델인 '덴스 벡터'로 구성돼 있으며 산업별 특화 데이터가 사전 학습돼 있다. 여기에 고객사의 문서나 데이터베이스를 연동하면 개발자가 별도로 투입되지 않아도 고객사의 전용 모델을 자동으로 만든다. 결과물에 대한 사용자 피드백도 실시간으로 반영해 리트리버의 정확도가 지속적으로 올라가 실무자들의 만족도가 높다. 이렇게 사용자의 피드백을 활용한 답변 생성 방법과 키워드 기반 검색 및 의미 기반 검색을 상호 보완해 검색 성능을 향상시키는 방법은 각각 특허로 출원돼 있다.

이창수 올거나이즈 대표는 "인공지능(AI) 생태계에 기여하기 위해 테스트 데이터셋을 모두 공개했으며 이를 활용해 한국어로 된 다양한 RAG 솔루션의 성능이 향상됐으면 하는 바람이 있다"며 "대학 및 개인 연구자들은 AI 연구에 도움을 받을 수 있을 것이고 기업들 역시 성능 좋은 RAG를 도입함으로써 업무 생산성 증대를 경험할 수 있을 것"이라고 밝혔다.

yuniya@newspim.com

[뉴스핌 베스트 기사]

사진
'지각대장' 푸틴, 새벽에 평양 지각 도착 [서울=뉴스핌] 이영종 통일전문기자 = 블라디미르 푸틴 대통령이 19일 새벽 평양 순안공항에 도착해 김정은 북한 국무위원장과 만났다고 크렘린궁과 러시아 매체 등 외신이 전했다. 크렘린궁 측이 공개한 영상에 따르면 푸틴은 예정보다 늦은 이날 새벽 2시45분께 전용기인 일류신(IL)-96 항공기로 도착했으며, 공항 활주로에서 영접 나온 김정은과 환영 의식을 가졌다. [서울=뉴스핌] 19일 새벽 평양 순안공항에 도착한 블라디미르 푸틴 러시아 대통령이 영접 나온 김정은 북한 국무위원장과 포옹하고 있다. 두 사람은 이날 정상회담을 갖는다. [사진=크렘린궁] 2024.06.19 김정은과 푸틴은 환영 행사를 위해 의장대가 도열한 레드카펫을 걸어가면서도 이야기를 나누었으며, 푸틴의 이야기를 통역을 통해 들은 김정은이 고개를 끄덕이는 장면도 드러났다. 두 정상은 푸틴의 전용차량인 러시아산 '아우루스' 차량에 서로 먼저 탈 것을 청하며 한동안 옥신각신 했고 결국 푸틴이 먼저 탑승해 뒷좌석 오른쪽에 앉았다고 현지에서 취재한 매체들은 전했다.  푸틴은 김정은의 안내로 숙소인 금수산영빈관에 묵었다. 지난해 9월 러시아 아무르주 보스토치니 우주센터에서 만난 이후 9개월 만에 재회한 김정은과 푸틴은 19일 정상회담을 하고 북러 간 포괄적 전략동반자 관계에 서명하는 등의 결과를 공동으로 발표할 예정이다. 푸틴의 방북은 지난 2000년 7월 첫 평양 방문에 이어 두 번째로 우크라이나 침공 이후 북한의 대러 무기 제공 등으로 밀착관계를 보여온 북러 정상 간의 논의 결과에 관심이 쏠리고 있다. yjlee@newspim.com 2024-06-19 06:03
사진
尹 지지율 35.2% 제자리걸음…'동해 석유' 발표 별무신통 [서울=뉴스핌] 박성준 기자 = 윤석열 대통령의 지지율이 소폭 상승해 30%대 중반을 기록했다는 여론조사 결과가 13일 발표됐다. 종합뉴스통신 뉴스핌 의뢰로 여론조사 전문업체 미디어리서치가 지난 10~11일 전국 만 18세 이상 남녀 1001명에게 물은 결과 윤 대통령의 국정운영에 대한 긍정평가는 35.2%로 집계됐다. 부정평가는 62.2%로 나타났다. '잘 모름'에 답한 비율은 2.6%다. 지난 조사 대비 긍정평가는 0.1%포인트(p) 상승했고 부정평가는 0.6%p 하락했다. 긍정평가와 부정평가 간 격차는 27.0%p다. 연령별로 보면 40대에서 긍·부정 평가 격차가 극명하게 드러났다. 만 18세~29세에서 '잘함'은 26.5% '잘 못함' 72.1%였고, 30대에서는 '잘함' 32.3% '잘 못함' 64.4%였다. 40대는 '잘함' 22.5% '잘 못함' 75.3%, 50대는 '잘함' 32.3% '잘 못함' 66.5%로 집계됐다. 60대는 '잘함' 45.5% '잘 못함' 51.4%였고, 70대 이상에서는 '잘함'이 55.0%로 '잘 못함'(40.1%)보다 높게 나타났다. 지역별로는 서울 '잘함' 37.0%, '잘 못함'은 60.1%로 집계됐다. 경기·인천 '잘함' 32.6% '잘 못함' 66.2%, 대전·충청·세종 '잘함' 34.8% '잘 못함' 63.6%, 부산·울산·경남 '잘함' 35.7% '잘 못함' 59.9%로 나타났다. 대구·경북은 '잘함' 51.9% '잘 못함' 45.6%, 전남·광주·전북 '잘함' 21.9% '잘 못함' 75.1%로 나타났다. 강원·제주는 '잘함' 38.0% '잘 못함' 54.6%로 집계됐다. 성별로도 남녀 모두 부정평가가 우세했다. 남성은 '잘함' 32.4% '잘 못함' 65.7%, 여성은 '잘함' 38.0% '잘 못함' 58.8%였다. 김대은 미디어리서치 대표는 윤 대통령 지지율 결과에 대해 "포항 영일만 앞바다의 석유, 천연가스 매장 가능성 국정브리핑과 북한의 오물풍선 살포로 인한 9·19 군사합의 파기 등의 이슈를 거치면서 지지율 반등을 노릴 수 있었다"며 "그러나 액트지오사에 탐사 분석을 맡긴 배경에 대한 의혹이 증폭되고 있고, 육군 훈련병 영결식에 참석하는 대신 여당 워크숍에 가는 모습 등 때문에 민심이 움직이지 않았다"고 평가했다. 차재권 부경대 정치외교학과 교수는 "앞으로 큰 이슈가 발생하지 않는다면 지지율은 떨어지지도, 올라가지도 않을 것 같다"며 "많은 국민이 기대도 하지 않고 그렇다고 아예 버리지도 못하고 있는 상황으로 보인다. 지지율이 올라가려면 획기적 변화가 있어야 한다"고 분석했다. 이번 여론조사는 성·연령·지역별 인구비례 할당 추출 방식으로 추출된 표본을 구조화된 설문지를 이용한 무선(100%) ARS 전화조사 방식으로 실시했으며 응답률은 3.4%, 표본오차는 95% 신뢰수준에 ±3.1%p다. 통계보정은 2024년 1월말 행정안전부 주민등록 인구통계를 기준으로 성별 연령별 지역별 가중 값을 부여(셀가중)했다. 자세한 내용은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. parksj@newspim.com 2024-06-13 06:00
안다쇼핑
Top으로 이동