전체기사 최신뉴스 GAM 라씨로
KYD 디데이
산업 전기·전자

속보

더보기

삼성전자 전세계에 '갤럭시AI' 언어모델 과정 공개

기사입력 : 2024년06월25일 08:51

최종수정 : 2024년06월25일 08:51

[서울=뉴스핌] 김지나 기자 = 삼성전자는 언어 장벽 없이 자유로운 소통이 가능하도록 돕는 '갤럭시 인공지능(AI)'의 언어 모델 개발 과정을 공개했다고 25일 밝혔다.

삼성전자는 언어를 넘어 문화를 이해하고 지식을 갖춘 고도화된 '갤럭시 AI'를 위해 전 세계 총 20여개의 연구개발(R&D) 센터에서 언어 모델 연구·개발에 매진하고 있다.

'갤럭시 AI'의 온디바이스 실시간 통·번역 기능은 현재 16개 언어를 지원 중이며, 연내 스웨덴어, 네덜란드어, 루마니아어, 튀르키예어의 4개 언어를 더 추가해 총 20개 언어를 지원할 계획이다.

삼성리서치 요르단 연구소(SRJO)의 '갤럭시 AI' 언어 개발 담당자. [사진=삼성전자]

삼성전자의 '갤럭시 AI' 언어 모델은 언어의 특성과 문법에 대한 정량 평가, 문화에 대한 지식과 이해를 검증하는 정성 평가 등을 거쳐 공개된다.

아랍어는 20여개국 4억명 이상이 사용하는 세계에서 6번째로 많이 사용되는 언어다. 아랍어를 통번역에 활용하기 위해서는 현대 표준 아랍어인 풋스하(Fusha)와 일상생활에서 사용하는 방언인 암미야(Ammiyya)를 모두 학습해야 한다. 특히 아랍어 방언은 총 30여 종에 달한다.

삼성리서치 요르단 연구소(SRJO)는 아랍어 방언을 이해하면서, 답변은 표준 아랍어로 할 수 있는 언어 모델을 개발했다. 이를 위해 각기 다른 방언의 음성 녹음 데이터를 수집하고, 이를 직접 텍스트로 변환하는 과정을 거쳤다.

데이터베이스 구축을 맡은 요르단 연구소의 아야 하산(Ayah Hasan)은 "여러 방언의 미묘한 차이와 변형을 정확히 이해할 수 있는 원어민들로 갤럭시 AI 팀을 구성하고, 음성 데이터를 일일이 글과 문장으로 바꾸는 수작업을 진행했다"고 설명했다.

삼성전자는 아랍어의 복잡성에 대한 깊은 이해와 신중한 데이터 선별을 진행하고, 고급 모델링 기술을 적용해 아랍어를 갤럭시 AI에 추가할 수 있었다.

베트남어는 전세계 약 1억명이 사용하는 언어로 중국어, 태국어 등 인근 지역 언어와 비슷한 성조 체계를 지니고 있다. 특히 베트남어는 여섯 가지의 성조를 가진다. 예를 들어 베트남어 단어 '마(Ma)'는 성조에 따라 엄마(Má), 무덤(Mả), 귀신(Ma) 등 전혀 다른 의미를 지녔다.

삼성리서치 베트남 연구소(SRV)는 성조의 미세한 차이를 인식할 수 있도록, 음성 데이터를 매우 정교하게 다듬고 정제하는 과정을 거쳤다. 무엇보다 성조를 정확히 구분해 내기 위해 한 단어를 0.02초 전후의 짧은 프레임으로 잘라내고 이를 데이터베이스화 했다.

중남미 22개국의 공식 언어는 스페인어다. 하지만 같은 스페인어라도 동일한 대상을 지칭하는 단어는 국가와 지역에 따라 천차만별이다.

예를 들어 멕시코에서는 수영장을 '알베르카(alberca)'라고 한다. 하지만 아르헨티나, 파라과이, 우루과이에서는 '필레타(pileta)'라고 부른다. 콜롬비아, 볼리비아, 베네수엘라에서는 '피시나(piscina)'라고 표현한다.

중남미 지역의 언어 모델 개발을 담당한 삼성리서치 브라질 연구소(SRBR)는 '갤럭시 AI'가 중남미 국가의 스페인어 차이를 이해할 수 있도록, 각 국가의 오디오와 텍스트 등 방대한 양의 데이터를 수집해 관리하고 지속적으로 개선했다.

2억8000만명, 인구 4위의 인도네시아는 2억8000만 인구가 인도네시아어를 사용하고 있다. 인도네시아어는 관사, 복수형, 동사의 시제 변화가 없어서 상대적으로 배우기 쉬운 언어로 평가받는다. 하지만 반대로 문장의 맥락을 충분히 파악하지 못하면 내용을 이해할 수 없어 통·번역이 쉬지 않은 언어이다.

이러한 언어적 특성을 반영해 삼성리서치 인도네시아 연구소(SRIN)는 인간의 뇌가 학습하는 과정과 유사한 '인공신경망번역(Neural Machine Translation, NMT)' 방식을 적용했다. 단어가 아닌 '문장 단위'로 언어를 학습시켜, 갤럭시 AI가 의사소통의 맥락과 규칙을 이해할 수 있도록 했다.

 

abc123@newspim.com

[뉴스핌 베스트 기사]

사진
헌법재판관들 "공정" 49.3% "불공정" 44.9% [서울=뉴스핌] 이바름 기자 = 윤석열 대통령의 탄핵 심판을 맡은 헌법재판관들의 공정성을 묻는 질문에 '공정하다' 49.3%, '공정하지 않다' 44.9%로 팽팽했다. 종합뉴스통신사 뉴스핌이 미디어리서치에 의뢰해 지난 18~19일 전국 만 18세 이상 남녀 1000명을 대상으로 진행해 20일 발표한 ARS(자동응답 시스템) 조사에서 윤 대통령 탄핵 심판 헌법재판관들의 공정성을 묻는 질문에 49.3%가 '공정하다'고 응답했다. '불공정하다'는 답변은 44.9%로 오차범위 내였다. 5.8%는 '잘모름'이었다. 연령별로 보면 30·40·50대는 '공정'이 우세했고, 만18세~29세·60대·70대 이상은 '불공정' 응답이 많았다. 만18세~29세는 공정하다 44.7%, 불공정하다 47.8%, 잘모름은 7.5%였다. 30대는 공정하다 52.2%, 불공정하다 40.4%, 잘모름 7.3%였다. 40대는 공정하다 61.3%, 불공정하다 34.8%, 잘모름 3.9%였다. 50대는 공정하다 61.3%, 불공정하다 35.2%, 잘모름 3.6%였다. 60대는 공정하다 40.7%, 불공정하다 53.8%, 잘모름 5.5%였다. 70대 이상은 공정하다 31.6%, 불공정하다 60.4%, 잘모름은 8.0%였다. 지역별로는 서울과 경기·인천, 광주·전남·전북은 '공정'으로 기울었다. 대전·충청·세종과 강원·제주, 부산·울산·경남, 대구·경북은 '불공정'하다고 봤다. 서울은 공정하다 52.9%, 불공정하다 41.5%, 잘모름 5.6%였다. 경기·인천은 공정하다 50.8%, 불공정하다 44.0%, 잘모름 5.1%였다. 대전·충청·세종은 공정하다 41.8%, 불공정하다 50.7%, 잘모름은 7.4%였다. 강원·제주는 공정하다 44.6%, 불공정하다 48.6%, 잘모름 6.8%였다. 부산·울산·경남은 공정하다 43.8%, 불공정하다 49.3%, 잘모름 6.9%였다. 대구·경북은 공정하다 37.7%, 불공정하다 56.4%, 잘모름은 5.9%였다. 광주·전남·전북은 공정하다 28.2%, 불공정하다 67.6%, 잘모름 4.2%였다. 지지정당별로는 더불어민주당 지지자들은 88.7%가 공정하다고 답했다. 반면 국민의힘 지지자들은 90.0%가 불공정하다고 응답했다. 조국혁신당 지지자들은 84.4%가 공정하다고 봤다. 개혁신당 지지자들은 공정하다 48.0%, 불공정하다 46.9%로 팽팽했다. 진보당 지지자들은 59.5%가 공정하다, 잘모름 27.0%, 불공정하다는 13.5%였다. 무당층은 51.8%가 공정하다, 32.9%는 불공정하다. 잘모름은 15.3%였다. 성별로는 남성 53.6%는 공정하다, 42.1%는 불공정하다였다. 여성은 45.1%가 공정하다, 47.7%는 불공정하다고 답했다. 박상병 정치평론가는 "우리사회의 마지막 성역이었던 헌법재판관의 양심까지도 공격하는 시대"라며 "대통령 탄핵 인용 또는 기각 이후 다음 정권에도 이러한 갈등은 더 심해질 것으로 예상한다"고 전했다. 김대은 미디어리서치 대표는 "지지층에 따라 서로 상반된 입장이 나오고 있어 향후 헌재에서 대통령 탄핵 기각과 인용중 어떠한 판결을 내리더라도 상당한 혼란이 있을 것으로 보인다"고 말했다. 이번 여론조사는 무선 RDD(무작위 전화 걸기)를 활용한 ARS를 통해 진행됐다. 신뢰 수준은 95%, 표본 오차는 ±3.1%p. 응답률은 7.2%다. 자세한 조사 개요 및 내용은 미디어리서치 홈페이지와 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. right@newspim.com 2025-02-20 11:00
사진
민주 42.3%·국힘 39.7%…오차 범위 내 역전 [서울=뉴스핌] 한태희 기자 = 더불어민주당의 지지율이 청년층·수도권 등 보수 결집으로 힘을 받았던 국민의힘 지지율을 오차 범위 안에서 역전한 것으로 조사됐다. 20~30대 청년층과 서울·경기·인천 등 수도권에서 집권 여당에 대한 호감도가 줄어든 영향으로 분석된다. 종합뉴스통신사 뉴스핌이 여론조사 전문기관 미디어리서치에 의뢰해 지난 18일부터 19일까지 이틀 동안 전국 만 18세 이상 남녀 1000명을 대상으로 진행해 20일 발표한 자동 응답시스템(ARS) 조사에서 '어느 정당을 지지하거나 약간이라도 더 호감을 가지고 있냐'는 질문에 민주당 지지율은 직전 조사(41.4%) 대비 0.9%포인트(p) 오른 42.3%로 나타났다. 국민의힘 지지율은 직전 조사(43.2%) 대비 3.5%p 하락한 39.7%다. 같은 기간 조국혁신당은 4.5%에서 3.5%로 1%p 떨어졌다. 개혁신당은 1.5%에서 2.3%로 0.8%p 올랐다. 진보당은 0.7%로 지지율에 변동이 없었다. '지지 정당 없음'은 5.9%에서 7.6%로 1.7%p 늘었다. '기타 다른 정당'은 2.3%에서 3.1%로 0.8%p 상승했다. '잘모름'은 0.5%에서 0.6%로 0.1%p 올랐다. [서울=뉴스핌] 한태희 기자 = 2025.02.20 ace@newspim.com 연령별로 보면 만 18~29세와 60대 이상은 국민의힘에 대한 지지도가 높았다. 30~50대는 민주당을 더 지지했다. 만 18~29세 정당 지지도를 보면 국민의힘 39.6%, 민주당 36.9%, 개혁신당 7.9%, 조국혁신당 3.6%, 기타 다른 정당 1.9%, 지지 정당 없음 9.5%, 잘모름 0.6%등이다. 직전 조사와 비교하면 민주당은 35.5%에서 36.9%로 1.4%p 올랐고 국민의힘은 46.3%에서 39.6%로 6.7%p 떨어졌다. 30대는 민주당 41.3%, 국민의힘 35.2%, 개혁신당 2.7%, 조국혁신당 1.4%, 진보당 1.3%, 기타 다른 정당 5.3%, 지지 정당 없음 11.4%, 잘모름 1.3% 등이다. 직전 조사 대비 민주당은 39.9%에서 41.3%로 1.4%p 상승했고 국민의힘은 41.1%에서 35.2%로 5.9%p 하락했다. 40대는 민주당 52.2%, 국민의힘 32.9%, 조국혁신당 3.8%, 개혁신당 2.9%, 진보당 0.5%, 기타 다른 정당 1.1%, 지지 정당 없음 1.1% 등이다. 50대는 민주당 50.2%, 국민의힘 27.8%, 조국혁신당 6.4%, 진보당 1.4%, 기타 다른 정당 4.5%, 지지 정당 없음 9.7% 등이다. 60대는 국민의힘 51%, 민주당 38.4%, 조국혁신당 3.2%, 개혁신당 0.5%, 기타 다른 정당 2.7%, 지지 정당 없음 3.7%, 잘모름 0.5% 등이다. 70대 이상은 국민의힘 54.7%, 민주당 31.5%, 조국혁신당 1.8%, 진보당 1.3%, 개혁신당 0.7%, 기타 다른 정당 3.2%, 지지 정당 없음 5.1%, 잘모름 1.7% 등이다. 지역별로 보면 직전 조사와 비교해 서울과 경기·인천 등 수도권에서 민주당이 국민의힘을 역전했다. 반대로 대전·충청·세종에서는 국민의힘이 민주당보다 앞섰다. 서울은 민주 42.5%, 국민의힘 37.4%, 조국혁신당 3.0%, 개혁신당 2.2%, 진보당 2.0%, 기타 다른 정당 3.5%, 지지 정당 없음 9.5% 등이다. 경기·인천은 민주 43.5%, 국민의힘 36.9%, 조국혁신당 4.1%, 개혁신당 3.2%, 진보당 0.3%, 기타 다른 정당 2.5%, 지지 정당 없음 8.6%, 잘모름 0.9% 등이다. 대전·충청·세종은 국민의힘 45.2%, 민주당 41.7%, 개혁신당 1.9%, 조국혁신당 0.8%, 기타 다른 정당 4.4%, 지지 정당 없음 6.0% 등이다. 강원·제주는 민주당 42%, 국민의힘 31.4%, 개혁신당 7.3%, 조국혁신당 4.3%, 진보당 2.4%, 기타 다른 정당 8.1%, 지지 정당 없음 4.4% 등이다. 부산·울산·경남은 국민의힘 47.1%, 민주당 34.7%, 조국혁신당 4.2%, 개혁신당 2.0%, 기타 다른 정당 2.1%, 지지 정당 없음 8.8%, 잘모름 1.1% 등이다. 대구·경북은 국민의힘 57.3%, 국민의힘 29.1%, 조국혁신당 3.8%, 기타 다른 정당 3.1%, 지지 정당 없음 6.7% 등이다. 광주·전남·전북은 민주당 63.7%, 국민의힘 22.1%, 조국혁신당 3.9%, 진보당 1.9%, 개혁신당 1.0%, 기타 다른 정당 2.3%, 지지 정당 없음 3.1%, 잘모름 2.0% 등이다. 성별로 보면 남성은 민주당 41.1%, 국민의힘 38.7%, 조국혁신당 4.2%, 개혁신당 3.3%, 진보당 1.1%, 기타 다른 정당 2.4%, 지지 정당 없음 8.6%, 잘모름 0.6% 등이다. 여성은 민주당 43.5%, 국민의힘 40.7%, 조국혁신당 2.9%, 개혁신당 1.4%, 진보당 0.4%, 기타 다른 정당 3.8%, 지지 정당 없음 6.7%, 잘모름 0.7% 등이다. 박상병 정치평론가는 "윤석열 대통령에 대한 탄핵이 기각될 수 있다는 예상과 극우 인사 준동, 국민의힘까지 힘을 합치며 (보수) 세력이 뭉치는 밴드왜건 효과로 국민의힘 지지율이 상승했으나 이제는 (보수 결집이) 정점에 이르렀다"며 "윤석열 대통령의 헌법재판소 법정 발언에 반감이 생기고 일부 극우 인사들이 밖에서 탄핵 무효를 외치는 게 중도층에는 꼴불견으로 비춰지고 있다"고 분석했다. 이어 "극우 인사들의 준동이 해도 너무 한다는 생각을 하는 사람이 늘며 국민의힘 지지율이 정점에서 하향 추세를 보이고 있다"고 부연했다. 이번 여론조사는 무선 무작위 전화걸기(RDD)를 활용한 ARS를 통해 진행됐다. 신뢰 수준은 95%, 표본 오차는 ±3.1%p. 응답률은 8.1%다. 자세한 조사 개요 및 내용은 미디어리서치 홈페이지와 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. ace@newspim.com 2025-02-20 11:00
안다쇼핑
Top으로 이동