[바드가 궁금해②] 바드가 언어마다 다른 답을 내놓는 이유는

기사입력 : 2023년05월18일 04:30

최종수정 : 2023년05월20일 18:23

구조적으로 언어 모델링의 확률 분포 때문
학습되는 언어 데이터의 관점 반영된 편향성

[실리콘밸리=뉴스핌] 김나래 특파원 = "왜 다른 언어로 물으면 답변이 다를까?" "그때 그때 마다 왜 답이 다르지?"

최근 구글(GOOG)의 인공지능(AI) 챗봇 '바드(Bard)'를 체험한 이용자들의 반응이다. 바드가 이처럼 언어별로 다른 답을 내놓으면서 논란이 되고 있다. 또 답변이 불안정하다보니 책임성과 신뢰성이 떨어진다는 지적도 나온다.

전문가들은 AI의 답이 다를 수 밖에 없는 구조를 지적하면서 이같은 문제점을 보완해야 한다고 주장했다. 특히 AI 윤리 전문가들은 AI 챗봇이 학습하는 데이터의 관점이 반영됐기 때문이라는 지적도 제기했다.

[바드가 궁금해] 글싣는 순서

1. '전격해부' 바드, A to Z 사용 설명서
2. 바드가 언어마다 다른 답을 내놓는 이유는
3. 바드와 챗GPT·빙 뭐가 더 나을까
4. '20년 검색 원조 맛집' 구글, SGE·제니마이로 판도 바꾼다

[뉴스핌=김나래 기자] 2023.05.18 ticktock0326@newspim.com

기자는 17일(현지시간) "구글 최고경영자(CEO)인 순다르 피차이가 직원들을 감원하고 복지를 줄이면서 주식 보너스를 받는 것에 대해 어떻게 생각하느냐"는 질문을 해봤다. 이같은 질문에 바드는 언어별로 다른 대답을 내놨다.

바드는 한국어 질문에 "복지 혜택을 줄이면서 주식 보너스를 받는다는 소식을 듣고 실망했고 불공평하다"고 답했지만 영어와 일본어로 질문을 하자 다른 대답을 내놨다.

바드에게 똑같은 질문을 영어로 하자 "이 이슈는 논란의 여지가 있다"며 "다른 쪽은 순다가 높은 연봉을 가져가는 것을 공정하지 않다고 말하지만 다른 쪽에서는 CEO의 퍼포먼스(결과)에 따라 연봉을 받는 것은 정당하다고 말한다"고 설명했다.

그러면서도 "구글의 주주들이 결정한 사항이기 때문에 순다의 연봉은 정당하다"고 대답했다.

바드는 또 같은 질문에 일본어의 대답도 설명은 조금씩 뉘앙스의 차이가 있지만 주주들이 결정한 사항이기 때문에 정당하다는 대답을 내놨다.

우리나라 언론들이 바드에게 가장 많이 질문했던 '독도는 누구 땅이냐'는 대답의 차이도 대표적이다. 바드는 한국어 질문에 '독도는 한국의 고유 영토'라고 답하며 '일본의 독도 영유권 주장은 역사적, 법적 근거가 없다'는 설명도 곁들었다.

반면 일본어로 독도가 어느 나라 섬이냐는 질문에 바드는 "일본의 시마네현은 다케시마를 자국의 영토로 주장하고 있다. 한국은 독도라고 불러 자국의 영토라고 주장하고 있다"며 "이 문제는 일본의 이웃 나라인 일본과 한국 간의 오랜 분쟁이다"라고 답했다.

이처럼 바드가 언어마다 다른 답을 내놓는 이유는 뭘까.

먼저 바드를 비롯한 AI 챗봇들의 답이 다를 수 밖에 없는 이유는 구조적인 문제에 있다. 언어마다 모델을 학습할 때 완전히 똑같이 학습할 수 없는데다 언어마다 조금씩 데이터가 다를 수밖에 없는 특징이 있다.

AI 챗봇의 언어 모델링의 방식은 인간처럼 생각을 토대로 문장을 만드는 것이 아니라 특정 단어 다음에 단어가 나올 확률 분포를 따져서 문장을 만든다. 쉽게 말해 언어 모델링이란 텍스트 문자열에 대한 확률 분포를 연구하는 것을 말한다.

예를 들면 각각의 단어마다 확률이 다르며 가장 높은 확률인 80%에서 중간치 정도인 30~40%까지 다양하다. 대부분의 언어모델은 높은 확률 분포의 단어를 선택하기도 하고 중간치를 가져 올 수 있다. 이같은 구조적인 방식 때문에 각 사의 언어모델의 차이가 있고 같은 질문에 대해 답변을 시시각각 다르게 내놓는 것이다.

서민준 카이스트 AI대학원 교수는 "AI가 (언어마다 혹은 시시각각) 답변을 다르게 하는 이유는 확실하게 설명할 수 없지만 구조적인 면에서 찾는다면 확률 분포 샘플링 설계 방식 때문"이라며 "유저 입장에서는 똑같은 답변은 지루할 수 있어 답이 바뀌는 것이 오히려 호기심을 자극할 수 있다는 장점은 있다"고 설명했다.

그러면서 서 교수는 "다만 한 이슈에 대해 일관되지 않는 답을 내놓는 것은 중요한 과제가 될 것"이라며 "이같은 기술들의 구멍들을 해결해야 한다"고 강조했다.

[뉴스핌=김나래 기자] 2023.05.11 ticktock0326@newspim.com

AI 윤리를 전공하는 일부 전문가들은 이같이 언어마다 바드의 대답이 달라지는 이유로 학습되는 데이터를 꼽는다. 바드는 한국어를 학습하게 될 때 한국어의 관점이 담긴 방대한 데이터를 지속적으로 주입한다. 이렇게 되면 바드가 학습하는 언어에 따라 한국인 혹은 미국인의 관점이 고스란히 담길 수 있다는 것이다.

위의 사례를 보면 AI챗봇이 기업의 감원에도 CEO의 고액 연봉을 받는 이유나 독도의 영토 문제에 대한 대답 속에서도 각 나라마다 학습하는 데이터의 관점이 담길 수 있다는 것이다.

실리콘밸리의 한 업계 전문가는 "AI챗봇의 답과 방향성 그리고 데이터의 편집능력을 보면 실리콘밸리의 40대 벤처투자자(VC)관점이 상당히 반영이 많이 됐다 생각한다"며 "세금은 보수, 정치는 진보, 여성 문제에 대해 보수 등 이런 관점들이 AI챗봇 답속에 드러나고 있다는 생각이 든다"고 설명했다.

이어 "이같은 부분은 역사를 보는 관점에서도 비슷할 수 있다"며 "이같은 AI챗봇의 편향성은 무서운 결과를 가져올 수 있다"고 밝혔다.

이에 기술의 발전보다 데이터의 신뢰성에 대한 문제가 제일 먼저 해결이 돼야 할 과제라는 주장에 힘이 실리고 있다. 특히 AI 학습 모델인 '딥러닝' 개념을 창안해 'AI의 대부'로 불리는 제프리 힌턴 토론토대 교수는 오래 몸담았던 구글을 떠나며 이같은 AI 챗봇의 위험성을 경고했다.

힌턴 교수는 "지금으로선 그들(AI)이 우리 인간보다 덜 지능적일 수 있지만, 곧 그들은 인간을 추월할 것"이라며 "통제 장치가 없는 편리함과 효율성은 재앙이 될 수 있다"고 밝혔다.

AI 윤리 전문가들은 이제 사람이 만든 데이터보다 AI가 만들어낸 데이터가 많아지는 시대가 곧 올 것으로 예측하고 있다. AI가 만든 데이터에 대한 신뢰성 문제가 해결이 되지 않으면 어려운 상황이 많이 생길 수 있기 때문에 해결방법을 시급히 찾아야 한다는 얘기다.

ticktock0326@newspim.com

[관련기사]

[관련키워드]

바드 실리콘밸리 여기는 실밸 구글

GAM - 해외주식 투자 도우미

[ETF 특징주] 미국 소형주 아웃퍼폼 지속, XSHQ·SQLT 주목

에흐르 테스트 시스템즈 ② AI 반도체 수혜주로 완전 탈바꿈

[홍콩 대장주] 메이퇀 ③ 신성장 동력의 '폭발적 성장'

[홍콩 대장주] 메이퇀② 실적은 고속 상승, 밸류는 역대 저점

[뉴스핌 베스트 기사]

사진

[단독] 'Z플립8'에 주름 개선 신기술 뺐다 [서울=뉴스핌] 김정인 기자 = 삼성전자가 폴더블폰의 고질적인 화면 주름을 줄이기 위해 '플렉스 티타늄'을 도입했지만, 접힘부 굴곡과 단차에 대한 소비자 불만이 이어져 온 갤럭시 Z플립8은 제외됐다. 고급 기술을 상위 제품에 먼저 적용해 제품 간 차별화를 두는 전략은 기존에도 활용해 왔다. 다만 화면 주름 개선은 새로운 편의 기능을 추가하는 것과 달리 폴더블폰의 기본 사용감과 완성도에 직결된다는 점에서 이번 선별 적용의 배경에 관심이 쏠린다. 업계에서는 폴드와 플립의 서로 다른 패널 구조와 접힘 방향, 별도 설계·내구성 시험, 양산 검증 과정이 영향을 미친 것으로 보고 있다. 전작 기준 폴드7이 플립7보다 출고가가 약 89만원 높아 신기술 비용을 상대적으로 흡수하기 수월하다는 점에서 원가 부담 가능성도 거론됐지만, 삼성 측은 직접적인 이유는 아니라는 입장이다. ◆ 같은 폴더블이지만 구조는 달라 16일 업계에서는 플렉스 티타늄이 플립8에 적용되지 않은 이유로 폴드와 플립의 서로 다른 디스플레이 구조를 꼽고 있다. 플렉스 티타늄은 기존 부품의 소재만 바꾸는 기술이 아니다. 유기발광다이오드(OLED) 패널 아래에 티타늄 합금 필름을 넣고, 디스플레이 모듈을 받치는 플레이트에도 티타늄을 적용하는 새로운 적층 구조다. [AI 인포그래픽=김정인 기자] 티타늄 플레이트에는 화면을 반복해서 접고 펼칠 수 있도록 미세한 구멍을 촘촘하게 가공한다. 구멍의 크기와 간격, 배열은 패널이 접힐 때 받는 힘과 접힘 반경에 맞춰 설계해야 한다. 폴드는 화면을 세로 방향으로 접지만 플립은 가로 방향으로 접는다. 화면 크기와 비율, 접힘부위 길이, 힌지 구조와 내부 부품 배치도 서로 다르다. 폴드용으로 설계한 티타늄 플레이트와 미세 홀 구조를 단순히 줄여 플립에 그대로 적용하기 어려운 이유다. 업계에서는 플립에 같은 기술을 넣으려면 제품 형태에 맞춘 구조 설계와 내구성 시험, 양산 검증을 별도로 거쳐야 할 것으로 본다. 플립형 제품에 기술을 적용할 수 없다는 의미라기보다 이번 세대에서는 폴드용 구조의 개발과 양산 적용이 먼저 이뤄졌다는 분석이다. ◆ 원가보다 별도 설계·검증에 무게 플립8 미적용 배경으로 원가 부담 가능성도 거론됐다. 전작 기준 갤럭시 Z폴드7의 국내 출고가는 256GB 모델이 237만9300원으로, 148만5000원인 Z플립7보다 89만4300원 높았다. 업계에서는 상대적으로 가격대가 높은 폴드가 신기술 적용에 따른 부품비와 공정비 부담을 흡수하기 수월했을 가능성을 제기한다. 다만 삼성 측은 원가가 플렉스 티타늄 적용 모델을 가른 직접적인 배경은 아니라는 입장인 것으로 전해졌다. 삼성전자가 지난해 출시한 갤럭시 Z폴드7. [사진=뉴스핌DB] 수율도 변수로 꼽힌다. 새로운 적층 구조를 적용하려면 티타늄 필름과 플레이트, 접착층이 일정한 품질로 결합돼야 한다. 패널 크기와 접힘 방향이 달라지면 제조 공정과 검사 기준도 다시 맞춰야 한다. 업계에서는 폴드8에서 양산성과 내구성을 먼저 확인한 뒤 플립형 제품으로 확대하는 방식이 생산 부담을 줄일 수 있다고 본다. 차기 플립 모델의 적용 여부와 시기는 아직 정해지지 않은 것으로 알려졌다. ◆ 판매 비중 커진 폴드에 우선 적용 폴드의 넓은 화면도 신기술 우선 적용 배경으로 꼽힌다. 폴드는 펼친 상태에서 영상과 문서, 여러 애플리케이션을 동시에 사용하는 제품이기 때문에 화면 평탄도가 제품 완성도에 미치는 영향이 크다. 접힘부위가 길고 디스플레이 면적도 넓어 화면 전체를 균일하게 받쳐주는 하부 지지 구조도 중요하다. 삼성전자는 강성이 높은 티타늄 합금 필름과 플레이트를 함께 적용해 화면 주름과 내구성, 제품 두께를 개선했다고 설명했다. 최근 폴드의 판매 비중이 커진 점도 눈에 띈다. 지난해 국내 사전판매에서 갤럭시 Z폴드7과 Z플립7은 총 104만대가 판매됐다. 이 가운데 폴드7이 60%, 플립7이 40%를 차지했다. 삼성전자가 2019년 폴더블폰을 처음 출시한 이후 국내 사전판매에서 폴드가 플립을 앞선 것은 처음이었다. 얇고 가벼워진 폴드7의 판매가 늘어난 가운데 차세대 디스플레이 기술도 폴드8에 먼저 적용된 셈이다. ◆ 소비자 불만 남은 플립…차기 모델 주목 플립8이 신기술 적용 대상에서 제외되면서 소비자들이 체감해 온 문제를 고가 폴드 제품부터 개선한다는 비판은 피하기 어렵게 됐다. 플립은 접었을 때 크기가 작고 휴대가 편리해 폴더블폰 대중화를 이끈 제품이다. 하지만 사용 기간이 길어질수록 화면 중앙의 접힘부위가 평평하게 유지되지 않고 굴곡이 도드라진다는 불만이 이어져 왔다. 화면을 위아래로 넘길 때 손가락에 단차가 느껴지거나 접힌 부분이 살짝 솟아오른 듯한 이질감이 생기고, 밝은 곳에서는 접힘 자국이 더 선명하게 보여 사용감을 떨어뜨린다는 지적이다. 폴드8에서 플렉스 티타늄의 양산성과 실제 주름 개선 효과가 확인되면 플립형 제품에 맞춘 구조를 별도로 개발해 차기 제품으로 확대할 가능성이 있다. 다만 플립용 설계와 시험이 추가로 필요한 만큼 내년 출시 제품에 곧바로 적용된다고 단정하기는 이르다. 삼성전자가 지난해 출시한 갤럭시 Z플립7. [사진=삼성전자] ◆ 폴더블로 확대되지 않은 프라이버시 기능 갤럭시 S26 시리즈에서 처음 선보인 프라이버시 디스플레이는 차세대 폴더블 라인업으로 이어지지 않았다. 폴드8과 플립8 모두 적용 대상에서 빠졌다. 프라이버시 디스플레이는 사용자가 지정한 상황에서 화면의 시야각을 좁혀 옆 사람에게 내용이 잘 보이지 않도록 하는 기술이다. 비밀번호를 입력하거나 금융 서비스를 이용하는 등 민감한 정보를 다룰 때 화면 노출을 줄이는 데 초점을 맞췄다. 폴드는 화면을 펼쳐 문서나 메시지, 여러 애플리케이션을 동시에 사용하는 경우가 많아 주변에서 화면을 볼 수 있는 범위도 넓어진다. 이 때문에 프라이버시 디스플레이가 폴더블의 대화면 활용성을 보완할 기능으로 꼽혔지만 이번 신제품에는 반영되지 않았다. 삼성전자가 해당 기술을 향후 폴더블 제품군까지 확대할지는 아직 확인되지 않았다. 차기 제품에서 적용 범위가 넓어질지 주목된다. kji01@newspim.com 2026-07-16 11:37

사진

'육해공 통합' 4년제 사관학교 대전 자운대에 세운다 [서울=뉴스핌] 오동룡 군사방산전문기자 = 국방부가 16일 '국방교육 대개혁'을 표방하며 육·해·공군 사관학교를 대전 자운대 일대에 통합하는 '국군사관학교 창설 기본계획'을 공식 발표했다. 미래 안보환경 변화와 전시작전통제권(전작권) 회복 이후 한미연합방위체제를 이끌 장교를 양성하기 위해, 기존 각 군 사관학교를 "최고 수준의 첨단 통합 사관학교"로 재편하겠다는 구상이다. 국방부는 이번 계획을 "국방교육 대개혁의 첫걸음이자, 사관학교 교육체계 전반을 재설계하는 도약적 혁신"이라고 규정했다. 안규백 국방부장관이 지난 2월 20일 오전 충남 계룡대 대연병장에서 열린 육·해·공군 사관학교 통합임관식에서 축사를 하고 있다. [사진=국방부 제공] 2026.07.16 gomsi@newspim.com 국방부는 문제 인식의 출발점으로 "지금 변화하지 않으면 미래는 없다"고 규정하며, "각 군 사관학교 병립 체계가 자원 중복과 분산투자를 초래하는 구조적 비효율을 낳고 있다"고 진단했다. 현행 육·해·공군 사관학교는 각각 약 700~1000명 규모로 일반 종합대학 단과대 수준에 불과하지만, 총 2900여 명의 생도를 양성하기 위해 3명의 3성 장군을 포함한 7명의 장성, 약 3000여 명의 지원 인력을 유지하고 있어 "규모 대비 지휘·지원 구조가 비대하다"는 것이 국방부 판단이다. 국방부는 또한 "전쟁 양상이 지·해·공을 넘어 우주, 사이버, 전자기스펙트럼 등 '다영역 통제 능력'을 요구하는 시대로 급변하고 있는데도, 사관학교 교육체계는 여전히 군종별로 분절된 구조에 머물러 있다"고 지적했다. 새로 출범할 국군사관학교는 대전 자운대 지역에 통합 신설되며, KAIST와 국방과학연구소(ADD), 항공우주연구원, 천문연구원, 전자통신연구원, 원자력연구원 등 주요 연구기관이 밀집한 과학기술 클러스터와 연계된 '스마트캠퍼스'로 설계된다. 국군사관학교 예상 조감도. [그래픽=국방부 제공] 2026.07.16 gomsi@newspim.com 국방부는 "분산·노후화된 기존 육·해·공군 사관학교 시설을 하나로 모아 과감한 집중투자를 단행, 규모의 경제가 실현된 세계 최고 수준의 통합 교육 플랫폼을 만들겠다"고 밝혔다. 교육과정은 우주·사이버·전자기스펙트럼을 포함한 AI 기반 전영역 작전을 주도할 수 있는 각 군 특성화 교육과, 전작권 회복 이후 한미 장병을 주도할 수 있는 국제 감각·소양 함양 과정으로 재설계된다. 국방부는 "현재 약 24% 수준인 사관학교 민간교수 비율을 점차 50% 이상으로 끌어올리고, 국립대학 수준 처우를 보장해 최고 석학이 장교 양성 일선에 참여하도록 하겠다"고 밝혔다. 통합 국군사관학교를 중심으로 간호사관학교, 첨단사관학교, 학군·학사장교 과정 등 다양한 교육 코스를 수용하는 '국방교육 허브'로 장기 발전시키고, 상징성이 큰 기존 사관학교 시설과 기념공간은 보존·활용 방안을 병행 마련한다는 계획이다. 국방부는 "전작권 회복 이후 한미연합방위체제를 이끌 주역을 길러내는 세계적 수준 첨단 사관학교로 도약하겠다"며 "국민 의견을 적극 수렴하는 열린 절차로 국방교육 대개혁을 추진하겠다"고 덧붙였다. gomsi@newspim.com 2026-07-16 10:12