전체기사 최신뉴스 GAM
KYD 디데이
산업 ICT

속보

더보기

카카오, 한국어 최적화 멀티모달 AI '카나나' 2종 성능 공개

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

통합 멀티모달 언어모델 '카나나-o', 지시이행 능력 개선
이미지 기반 검색 기술 '임베딩'…"韓 문화 이해도 탁월"

[서울=뉴스핌] 이성화 기자 = 카카오가 사람처럼 보고 듣고 말하며 한국어와 한국 문화를 가장 잘 이해하는 고도화된 멀티모달 인공지능(AI) 기술 연구 성과를 공개했다.

카카오는 12일 테크블로그를 통해 한국적 맥락 이해에 최적화된 통합 멀티모달 언어모델 '카나나-o(Kanana-o)'와 멀티모달 임베딩 모델 '카나나-v-임베딩(Kanana-v-embedding)'의 개발 과정과 성능을 공개했다.

Kanana-o와 글로벌 경쟁모델 벤치마크 성능비교. [사진=카카오]

'카나나-o'는 텍스트와 음성, 이미지를 동시에 이해하고 실시간으로 답변하는 통합 멀티모달 언어모델이다. 글로벌 모델 대비 한국어 맥락 이해에서 압도적 성능을 보유하고 있으며 사람처럼 자연스럽고 풍부한 표현력을 갖춘 것이 특징이다.

카카오는 기존 멀티모달 모델들이 텍스트 입력 시 강점을 보이지만 음성 대화에서는 답변이 단순해지고 추론 능력이 떨어지는 한계에 주목해 이를 보완했다. '카나나-o'의 지시 이행 능력을 고도화해 사용자의 숨은 의도와 복잡한 요구사항까지 파악할 수 있도록 개선했으며 자체 구축 데이터셋으로 학습해 다양한 모달리티 입출력에서도 기존 언어모델 성능을 유지하고 요약, 감정 및 의도 해석, 오류 수정, 형식 변환, 번역 등 다양한 과업을 수행할 수 있도록 성능을 끌어올렸다.

또한 고품질 음성 데이터와 직접 선호 최적화(DPO) 기술을 적용해 억양, 감정, 호흡 등을 정교하게 학습시켰다. 이를 통해 기쁨, 슬픔, 분노, 공포 등 상황별 생생한 감정 표현은 물론 미세한 음색과 어조 변화에 따른 감정 표현 능력도 향상됐다. 호스트와 게스트가 대화를 주고받는 팟캐스트 형태의 대화 데이터셋을 구축해 끊김 없이 자연스러운 멀티턴 대화도 가능해졌다.

벤치마크 평가 결과 '카나나-o'는 영어 음성 성능에서 GPT-4o와 유사한 수준을 보였고 한국어 음성 인식 및 합성, 감정 인식 능력에서는 월등히 높은 수준을 기록했다. 카카오는 향후 더욱 자연스러운 동시 대화와 상황에 맞는 소리환경 실시간 생성이 가능한 진화된 모델로 발전시킬 계획이다.

함께 공개된 '카나나-v-임베딩'은 이미지 기반 검색의 핵심 기술로 텍스트와 이미지를 동시에 이해해 처리할 수 있는 한국형 멀티모달 모델이다. 텍스트로 이미지를 검색하거나 사용자가 선택한 이미지와 관련된 정보를 찾고 이미지가 포함된 문서 검색도 지원한다.

Kanana-v-embedding 벤치마크 성능 비교. [사진=카카오]

특히 한국어와 한국 문화에 대한 이해도가 탁월해 '경복궁', '붕어빵' 같은 고유명사뿐만 아니라 '하멜튼 치즈'처럼 오타가 포함된 단어도 문맥을 파악해 정확한 이미지를 찾아준다. '한복 입고 찍은 단체 사진'처럼 복합 조건도 정확히 이해해 조건 일부에만 해당하는 사진을 걸러내는 높은 변별력을 갖췄다.

현재 '카나나-v-임베딩'은 카카오 내부에서 광고 소재 유사도 분석 및 심사 시스템에 적용 중이며 향후 비디오나 음성으로 범위를 확대해 다양한 서비스에 적용할 계획이다.

한편 카카오는 지난 5월 에이전틱 AI 구현을 위한 기능 강화에 중점을 둔 언어모델 '카나나-1.5'를 기반으로 모바일 기기 등 온 디바이스 환경에서 동작할 수 있는 멀티모달 모델의 경량화 연구를 진행하고 있다. 또한 전문가 혼합 구조인 MoE(Mixture of Experts)를 적용한 고성능·고효율 모델 '카나나-2' 개발도 준비하고 있다.

김병학 카카오 카나나 성과리더는 "카카오 자체 AI 모델 카나나는 단순 정보 나열을 넘어 사용자의 감정을 이해하며 친숙하고 자연스럽게 대화하는 AI가 될 수 있도록 한국적 맥락 이해와 표현력을 높여가고자 한다"며 "실제 서비스 환경을 통해 사용자들의 일상 속 AI 기술 경험을 만들어 나가고 사람처럼 상호작용할 수 있는 AI 구현에 주력할 것"이라고 말했다.

shl22@newspim.com

[뉴스핌 베스트 기사]

사진
육군 제복 10년 만에 전면 개편 착수 [서울=뉴스핌] 오동룡 군사방산전문기자 = 육군이 10년 가까이 변화가 없던 제복 체계를 전면 재설계하기 위해 전문 디자인 기관과 협력에 나섰다.  육군은 지난 5일 충남 계룡대에서 한국공예·디자인문화진흥원(공진원)과 '육군 제복 디자인 개발'을 위한 업무협약(MOU)을 체결했다고 7일 밝혔다. 이번 협약은 공진원이 추진하는 '2026년 공공디자인 컨설팅 사업'에 '육군 제복류 디자인 개발 사업'이 선정되면서 성사됐다. 공진원은 문화체육관광부 산하 공공기관으로, 공공 영역 디자인 개선 사업을 총괄해 온 전문 기관이다. 지난 2월 27일 서울 노원구 육군사관학교에서 열린 제82기 졸업식에서 졸업생들이 졸업을 자축하며 정모를 높이 던지고 있다. [사진=국방부] 2026.02.27 photo@newspim.com 양측은 이번 협약을 통해 ▲육군 정복 ▲근무복 ▲육군사관학교 생도 정복을 핵심 협력 분야로 설정했다. 특히 제복에 담긴 상징성과 기능성, 착용 편의성, 대외 이미지까지 종합적으로 검토해 '미래형 육군 이미지'를 반영한 디자인 개선 방향을 도출할 계획이다. 육군 제복 체계는 2016년 개정 이후 약 10년간 큰 변화 없이 유지돼 왔으며, 육사 생도 정복은 1970년대 개정 이후 사실상 반세기 가까이 유지된 상태다. 이번 개편에서 가장 관심이 집중되는 부분은 육군사관학교 정복이다. 정부가 육·해·공군 사관학교 통합을 검토하는 상황에서, 각 군의 정체성을 상징하는 제복 체계 역시 재편 압력을 받을 가능성이 크기 때문이다. 군 안팎에서는 "제복은 단순 복장이 아니라 군 정체성과 역사, 지휘 체계와 군의 정체성을 보여준다"라는 말이 나오는 만큼, 사관학교 통합 논의에서 핵심 쟁점으로 떠오를 수 있다는 분석이 나온다. 육군은 이번 협약을 계기로 단순한 디자인 변경을 넘어 장기적인 제복 발전 로드맵 수립에 착수할 방침이다. 기능성 소재 적용, 체형 다양성 반영, 근무 환경별 최적화 등 실질적 개선 요소도 함께 검토된다. 특히 병력 구조 변화와 복무 환경 개선 흐름을 반영해 '착용 만족도'를 핵심 지표로 설정할 것으로 알려졌다. 김진평 육군본부 인사근무과장(대령)은 "전문기관의 체계적인 컨설팅과 지원을 통해 육군 구성원에게는 자부심을, 국민에게는 품격 있고 신뢰받는 이미지를 제공할 수 있는 제복 체계를 구축하겠다"고 밝혔다. 군 안팎에서는 이번 사업이 단순한 복제 개편을 넘어, 향후 10~20년간 육군 브랜드 이미지와 대외 인식을 좌우할 '장기 프로젝트'가 될 것으로 보고 있다. 사관학교 통합이 현실화될 경우, 제복 디자인이 군 조직 개편 방향을 보여주는 상징이 될 가능성이 크다. gomsi@newspim.com 2026-06-08 12:05
사진
오세훈·추경호 재판 이번주 재개 [서울=뉴스핌] 이바름 기자 =  6·3 전국동시지방선거로 미뤄졌던 정치인들의 재판이 이번주 재개된다. 8일 법조계에 따르면 서울중앙지법 형사합의22부(재판장 조형우)는 오는 10일 오세훈 서울시장과 강철원 전 서울시 정무부시장, 사업가 김한정 씨의 정치자금법 위반 혐의에 대한 공판기일을 연다. 오세훈·추경호 등 6·3 전국동시지방선거로 미뤄졌던 정치인들의 재판이 이번 주 재개된다. 사진은 오세훈 서울시장 당선인이 지난 4일 오전 서울시청으로 들어서며 직원들에게 인사말을 하는 모습. [사진 = 뉴스핌DB] 지난 4월 22일 이후 49일 만의 속행공판이다. 재판부는 오 시장의 지선 일정을 고려해 당초 5월로 잡혔던 공판기일을 지선 이후로 연기한 바 있다. 오 시장에 대한 구형은 내주로 전망되고 있다. 오는 17일 결심공판이 진행될 예정인 가운데, 이날 오 시장에 대한 피고인 신문 및 민중기 특별검사팀의 최종의견 진술과 구형, 오 시장의 최후진술 등이 이뤄질 전망이다. 오 시장은 지난 2021년 4월 7일 서울시장 보궐선거를 앞두고 정치브로커인 명태균 씨로부터 10회에 걸쳐 공표·비공표 여론조사를 전달받고, 후원자인 김씨에게 3300만 원을 대납토록 한 혐의를 받고 있다. 오세훈·추경호 등 6·3 전국동시지방선거로 미뤄졌던 정치인들의 재판이 이번 주 재개된다. 사진은 추경호 국민의힘 대구시장 후보가 지난달 23일 오후 대구 북구 칠성종합시장 앞에서 열린 유세현장에서 지지를 호소하고 있는 모습. [사진 = 뉴스핌DB] 추경호 대구시장 당선인의 내란 중요임무 종사 사건도 같은 날 열린다. 서울중앙지법 형사합의34부(재판장 한성진)는 10일 추 당선인의 내란 중요임무 종사 혐의를 공판을 진행한다. 추 당선인은 지난달 13일 법정에 출석했지만, 같은달 28일 공판준비기일에는 출석하지 않았다. 재판부는 지난 4월 추 당선인에게 지방선거가 끝나면 매주 한 차례씩 공판을 진행할 예정이라고 밝힌 바 있다. 추 당선인은 12·3 비상계엄 당시 국민의힘 원내대표로서 윤석열 전 대통령 측으로부터 계엄에 협조해달라는 요청을 받은 뒤 의원총회 장소를 수 차례 변경하는 방식으로 계엄 해제 표결을 방해한 혐의를 받는다. right@newspim.com 2026-06-08 10:20
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동