전체기사 최신뉴스 GAM
KYD 디데이
산업 ICT

속보

더보기

카카오, 한국어 최적화 멀티모달 AI '카나나' 2종 성능 공개

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

통합 멀티모달 언어모델 '카나나-o', 지시이행 능력 개선
이미지 기반 검색 기술 '임베딩'…"韓 문화 이해도 탁월"

[서울=뉴스핌] 이성화 기자 = 카카오가 사람처럼 보고 듣고 말하며 한국어와 한국 문화를 가장 잘 이해하는 고도화된 멀티모달 인공지능(AI) 기술 연구 성과를 공개했다.

카카오는 12일 테크블로그를 통해 한국적 맥락 이해에 최적화된 통합 멀티모달 언어모델 '카나나-o(Kanana-o)'와 멀티모달 임베딩 모델 '카나나-v-임베딩(Kanana-v-embedding)'의 개발 과정과 성능을 공개했다.

Kanana-o와 글로벌 경쟁모델 벤치마크 성능비교. [사진=카카오]

'카나나-o'는 텍스트와 음성, 이미지를 동시에 이해하고 실시간으로 답변하는 통합 멀티모달 언어모델이다. 글로벌 모델 대비 한국어 맥락 이해에서 압도적 성능을 보유하고 있으며 사람처럼 자연스럽고 풍부한 표현력을 갖춘 것이 특징이다.

카카오는 기존 멀티모달 모델들이 텍스트 입력 시 강점을 보이지만 음성 대화에서는 답변이 단순해지고 추론 능력이 떨어지는 한계에 주목해 이를 보완했다. '카나나-o'의 지시 이행 능력을 고도화해 사용자의 숨은 의도와 복잡한 요구사항까지 파악할 수 있도록 개선했으며 자체 구축 데이터셋으로 학습해 다양한 모달리티 입출력에서도 기존 언어모델 성능을 유지하고 요약, 감정 및 의도 해석, 오류 수정, 형식 변환, 번역 등 다양한 과업을 수행할 수 있도록 성능을 끌어올렸다.

또한 고품질 음성 데이터와 직접 선호 최적화(DPO) 기술을 적용해 억양, 감정, 호흡 등을 정교하게 학습시켰다. 이를 통해 기쁨, 슬픔, 분노, 공포 등 상황별 생생한 감정 표현은 물론 미세한 음색과 어조 변화에 따른 감정 표현 능력도 향상됐다. 호스트와 게스트가 대화를 주고받는 팟캐스트 형태의 대화 데이터셋을 구축해 끊김 없이 자연스러운 멀티턴 대화도 가능해졌다.

벤치마크 평가 결과 '카나나-o'는 영어 음성 성능에서 GPT-4o와 유사한 수준을 보였고 한국어 음성 인식 및 합성, 감정 인식 능력에서는 월등히 높은 수준을 기록했다. 카카오는 향후 더욱 자연스러운 동시 대화와 상황에 맞는 소리환경 실시간 생성이 가능한 진화된 모델로 발전시킬 계획이다.

함께 공개된 '카나나-v-임베딩'은 이미지 기반 검색의 핵심 기술로 텍스트와 이미지를 동시에 이해해 처리할 수 있는 한국형 멀티모달 모델이다. 텍스트로 이미지를 검색하거나 사용자가 선택한 이미지와 관련된 정보를 찾고 이미지가 포함된 문서 검색도 지원한다.

Kanana-v-embedding 벤치마크 성능 비교. [사진=카카오]

특히 한국어와 한국 문화에 대한 이해도가 탁월해 '경복궁', '붕어빵' 같은 고유명사뿐만 아니라 '하멜튼 치즈'처럼 오타가 포함된 단어도 문맥을 파악해 정확한 이미지를 찾아준다. '한복 입고 찍은 단체 사진'처럼 복합 조건도 정확히 이해해 조건 일부에만 해당하는 사진을 걸러내는 높은 변별력을 갖췄다.

현재 '카나나-v-임베딩'은 카카오 내부에서 광고 소재 유사도 분석 및 심사 시스템에 적용 중이며 향후 비디오나 음성으로 범위를 확대해 다양한 서비스에 적용할 계획이다.

한편 카카오는 지난 5월 에이전틱 AI 구현을 위한 기능 강화에 중점을 둔 언어모델 '카나나-1.5'를 기반으로 모바일 기기 등 온 디바이스 환경에서 동작할 수 있는 멀티모달 모델의 경량화 연구를 진행하고 있다. 또한 전문가 혼합 구조인 MoE(Mixture of Experts)를 적용한 고성능·고효율 모델 '카나나-2' 개발도 준비하고 있다.

김병학 카카오 카나나 성과리더는 "카카오 자체 AI 모델 카나나는 단순 정보 나열을 넘어 사용자의 감정을 이해하며 친숙하고 자연스럽게 대화하는 AI가 될 수 있도록 한국적 맥락 이해와 표현력을 높여가고자 한다"며 "실제 서비스 환경을 통해 사용자들의 일상 속 AI 기술 경험을 만들어 나가고 사람처럼 상호작용할 수 있는 AI 구현에 주력할 것"이라고 말했다.

shl22@newspim.com

[뉴스핌 베스트 기사]

사진
광주도서관 현장 매몰자 추가 수습 [광주=뉴스핌] 박진형 기자 = 광주대표도서관 공사 현장에서 철제 구조물이 붕괴해 2명이 사망하고 2명이 실종 상태다. 11일 서부소방서에 따르면 이날 오후 1시 58분쯤 광주 서구 치평동 광주대표도서관 공사 현장에서 옥상 2층 철근 콘크리트 구조물이 붕괴하는 사고가 발생했다. [광주=뉴스핌] 박진형 기자 = 11일 오후 광주 서구 지평동 광주대표도서관 신축 공사장에서 붕괴 사고가 발생해 경찰이 안전 사고를 대비해 출입을 통제하고 있다.2025.12.11 bless4ya@newspim.com 이 사고로 하청업체 소속 작업자 1명이 이날 오후 2시 52분에 의식 불명 상태로 구조돼 병원으로 옮겨졌으나 오후 4시 1분을 기해 사망 판정을 받았다. 이날 오후 2시 53분쯤 지하층에서는 또다른 작업자 1명이 구조물에 깔린 상태로 발견됐다. 구조 당국이 8시 13분쯤 잔해를 치우고 수습하는 과정에서 이미 사망한 상태였다. 나머지 2명은 실종 상태다. 건설 현장에 투입된 작업자는 총 97명이며 사고를 당한 이들은 미장 및 철근, 배관 관련 작업을 각각 담당하고 있었다. 소방당국은 대형 크레인 2대, 중앙119구조본부 소속 구조견 2마리, 열화상카메라, 드론 등을 활용해 나머지 실종자에 대한 수색 작업을 펼치고 있다. 밤샘 수색 작업에 대비해 한국전력의 협조를 구해 조명도 설치했다. 11일 오후 광주 서구 지평동의 한 공사장 붕괴 사고 현장에서 출동한 구조대원들이 매몰자 수색·구조 작업을 벌이고 있다. [사진=광주 서부소방서] 사고는 콘크리트 타설 중에 구조물이 연쇄적으로 무너져 발생했으며 정확한 사고 원인은 조사 단계다. 광주대표도서관은 연면적 1만1640㎡, 지하 2층~지상 2층 규모로 건립될 예정으로 총사업비는 516억원이다. 완공 시점은 내년 4월 13일까지였다. 광주시는 이날 오후 2시 40분을 기해 지역재난안전대책본부를 가동했다. 소방 관계자는 "사고 현장에 콘크리트하고 철근이 집중돼 있어 구조까지 상당한 시간이 소요될 것으로 보인다"고 말했다.  bless4ya@newspim.com 2025-12-11 21:26
사진
李대통령, 전재수 장관 면직안 재가 [서울=뉴스핌] 박찬제 기자 = 이재명 대통령이 11일 '통일교 금품수수' 의혹을 받는 전재수 해양수산부 장관에 대한 면직안을 재가했다. 대통령실 대변인실은 이날 오후 언론 공지를 통해 "이재명 대통령은 전재수 해양수산부 장관에 대한 면직안을 재가했다"고 밝혔다. [영종도=뉴스핌] 김학선 기자 = 통일교로부터 금품을 받았다는 의혹이 제기된 전재수 해양수산부 장관이 11일 오전 'UN해양총회' 유치 활동을 마친 후 인천국제공항 제2여객터미널을 통해 귀국해 입장을 밝힌 후 공항을 나서고 있다. 전 장관은 "직을 내려놓고 허위사실 의혹을 밝힐 것"이라고 밝혔다. 2025.12.11 yooksa@newspim.com 통일교 측으로부터 금품을 받았다는 의혹이 불거진 전 장관은 앞서 "장관직을 내려놓고 당당하게 응하는 것이 공직자로서 해야 할 처신"이라며 사의를 표명했다. 전 장관은 이날 오전 인천국제공항으로 입국하면서 기자들과 만나 '통일교 금품 수수 의혹'에 대해 "전혀 사실무근"이라면서도 사의를 밝혔다. 그는 "흔들림 없이 일할 수 있도록 제가 해수부 장관직을 내려놓는 것이 온당하지 않을까 생각한다"고 밝혔다. 전 장관은 의혹에 대해 "전혀 사실무근이고, 불법적인 금품수수는 단언컨대 없었다"며 "추후 수사 형태든지, 아니면 제가 여러 가지 것들 종합해서 국민들께 말씀드리거나 기자간담회를 통해 밝혀질 것"이라고 강조했다. 전 장관은 "(통일교 측으로부터)10원짜리 하나 불법적으로 받은 사실이 없다"면서 "600명이 모인 장소에서 축사를 했다는 것도 사실무근"이라고 반박했다. 앞서 민중기 특별검사팀은 지난 8월 윤영호 전 통일교 세계본부장으로부터 2018∼2020년께 전재수 당시 더불어민주당 의원에게 명품 시계 2개와 함께 수천만 원을 제공했다는 취지로 진술한 것으로 전해졌다. 그러면서 한일 해저터널 추진 등 교단 숙원사업 청탁성이라고 설명한 것으로 알려졌다. pcjay@newspim.com 2025-12-11 17:14
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동