전체기사 최신뉴스 GAM 라씨로
KYD 디데이
글로벌 특파원

속보

더보기

[여기는 실밸] "헤이 구글, 웃긴 이유 설명해줘"...유머 학습하는 구글 AI

기사입력 : 2022년04월29일 06:56

최종수정 : 2022년04월29일 09:13

구글, 차세대 AI '패스웨이' 진화한 PaLM 공개
딥 러닝 아닌 퓨삿 러닝으로 응용·추론 가능
AI 편향된 사고 등 윤리적 이슈가 과제

[편집자주] '여기는 실밸'은 돈과 인재가 몰리는 실리콘밸리의 벤처투자자(VC)들이 주목하고 있는 유망한 기업들을 소개합니다. 향후 기업공개(IPO) 가능성이 있는 유망한 기업이나 유니콘 기업들을 브리핑 해드립니다. '여기는 실밸'에서 실리콘밸리의 최신 산업 트렌드 및 기업 정보들을 확인할 수 있습니다.

[실리콘밸리=뉴스핌]김나래 특파원="헤이 구글, '비관론자에게 돈을 빌려라. 그들은 기대하지 않을 것' 이라는 문장이 왜 웃긴지 설명해줘"

구글 인공지능(AI)가 이제 사람의 농담까지 이해해 웃긴 이유까지 설명이 가능해졌다. 위의 질문에 구글 AI는 "대부분 사람들은 돈을 빌려줄 때 상대방이 돈을 갚을 것으로 기대하지만, 비관주의자는 항상 최악의 상황을 가정하는 사람이므로 돈을 빌린다면 어쨌든 갚지 않을 것으로 기대할 것으로 생각하기 때문이다"라고 답할 것이다.

이외에도 굉장히 전문적이고 이해하기 어려운 농담도 구글AI는 해석할 수 있다. 예컨대, "구글 TPU팀에서 고래를 고용한 거 봤어? 커뮤니케이션을 잘하던데"라는 농담은 일반인이 들어서는 알아 듣기 어렵다.

[뉴스핌=김나래 기자] 구글 리서치에서 설명한 유머 글을 해석하는 작동 방식. [사진=구글 블로그] 2022.04.29 ticktock0326@newspim.com

이는 TPU칩의 팟(pod)을 고래에 비유한 것으로 TPU는 구글이 딥 러닝에 사용하는 일종의 컴퓨터 칩을 말한다. 구글 AI는 팟의 사전적인 의미가 고래와 같은 동물들의 무리를 말하기 때문에 이를 이용한 유머라는 것을 분석해준다. 즉, "구글 TPU팀에서 고래를 고용해서 통신을 시키는거야?"라는 해석을 확장해 설명해 줄 수 있다. 

구글 리서치는 최근 새로운 AI 언어 모델 'PaLM(Pathways Language Model)'을 공개하고 AI가 이를 인식하는 방식들을 소개했다. PaLM은 작년 10월 구글이 차세대 AI 아키텍처로 소개한 '패스웨이(Pathways)'를 적용했으며, 패스웨이는 단일 모델을 학습시키는 데 특화된 시스템을 말한다.

제프 딘 구글 리서치의 수석 부사장은 지난 10월 패스웨이에 대해 "개발자가 한 가지만이 아닌 수천 또는 수백만 가지를 수행하도록 단일 모델을 훈련할 수 있는 차세대 AI 아키텍처"라고 소개했다.

실제로 패스웨이를 통해 항공 사진으로 어떤 지역의 지형을 파악하게 되면, 이 데이터는 해당 지역에 홍수가 발생했을 때 물이 어떻게 흐를지 예측하는 데에도 사용될 수 있다.

딘 부사장은 "이 기술로 많은 개별 작업을 처리할 수 있을 뿐만 아니라 기존 기술을 활용하고 결합해 새로운 작업을 더 빠르고 효과적으로 학습할 수 있는 하나의 모델을 훈련하고 싶다"며 "이렇게 하면 모델이 한 작업에 대한 교육을 통해 학습한 내용을 예측하는 지까지 배울 수 있다"고 설명했다. 

그가 설명한 것처럼 기존 AI 모델은 딥 러닝을 통해 학습하며, 학습한 내용 하나마다 한 가지 문제나 예시를 해결할 수 있다. 따라서 딥 러닝으로 학습한 모델을 제대로 활용하려면 수백만 개의 예제를 학습시켜야 했다.

하지만 패스웨이는 딥러닝보다 한단계 나아간 '퓨삿 러닝'으로 단일 모델을 학습시켜도 이를 다른 작업이나 문제를 해결할 때 활용할 수 있다. 다시 말해 기존의 딥 러닝은 새로운 작업이 필요한 경우 다시 학습을 해야 적용할 수 있지만 이번 구글의 퓨삿 러닝은 기존 학습 내용을 응용하고 추론이 가능하다.

 구글 TPU의 모습. [사진=구글] 2022.04.29 ticktock0326@newspim.com

이에 PaLM은 패스웨이를 보다 구체적인 형태로 구현해 노력의 결실을 맺었다는 평가를 받고 있다. PaLM은 패스웨이로 훈련된 5400억 개의 매개변수가 포함됐으며, 이를 통해 수백 가지의 언어를 이해하고 생성할 수 있으며 지금까지 개발된 다른 언어 모델보다 학습 효율이 높다는 것이 장점이다.

구글도 "PaLM은 현재까지 교육에 사용된 가장 큰 TPU 기반 시스템 구성으로 교육을 확장하기 위해 패스웨이 시스템을 처음으로 대규모로 사용하는 것을 보여줬다"면서 "여러 클라우드 TPU v4 팟에서 수행된 해당 교육은 6144개의 칩으로 확장됐다"고 평가했다.

​이번 구글이 발표한 자료에 따르면 영어와 다국어 데이터 세트의 조합을 사용해 훈련된 PaLM은 29개 작업 가운데 28개가 다른 기존 언어모델(머스크의 오픈 AI인 GPT-3, AWS가 제공하는 서버리스 기술인 람다) 보다 성능면에서 앞섰다. 질의응답과 문장 완성, 문맥 이해, 상식 추론 등 처리 작업 성능이 월등했다. 

구글 리서치는 "PaLM은 원인과 결과를 구별하고 적절한 맥락에서 개념적 조합을 이해하고 있다"며 "영어가 아닌 언어, 코딩 및 산술 작업에 능숙함을 보여줬다"고 발표했다.

업계에서는 올해 더 많은 산업과 사용 사례에 서비스를 제공하기 위해 사용되는 대규모 언어모델(LLM)의 가속화된 성장이 이어질 것으로 보고 있다. 방대한 양의 산업별 데이터에 대해 교육을 받은 LLM은 전문 훈련과 감독이 없어도 심층 도메인 질문에 답할 수 있다. 또 언어를 번역하며 문서를 이해·요약하고, 스토리를 작성하고 프로그램을 계산이 가능하다.

하지만 본격적인 PaLM 상용화를 위해 해결해야 할 문제가 있다. AI가 온라인으로 학습하는 이상 잘못된 정보나 차별·혐오 등이 반영될 가능성이 있어 편향된 사고 오류를 줄이는 것이 관건이다.

실제로 구글에서는 AI의 편향성 문제가 이슈가 된 적이 있다. AI 윤리 확립에 앞장서고 있는 팀닛 게브루 박사는 이같은 대규모 언어 모델에 대한 윤리적 문제를 지적하며 인종 차별적 비방을 무심코 받아들이는 것부터 무슬림을 폭력과 연관시키는 등 편향된 사고에 대해 지적했다. 이 같은 대형 모델들의 편향성이 있으면 소외된 사람에게 더 타격이 클 수 있다는 위험성이 있기 때문이다. 

그는 구글 AI윤리팀을 신설하고 2020년 12월까지 근무했지만 이후 연구소를 운영하고 있다. 그는 당시 대규모 언어모델의 단점을 논문을 통해 지적한 바 있다.

이에 구글 리서치 연구원들도 윤리적으로 위험한 부분에 대해 과제로 언급했다. 구글 리서치는 향후 언어 모델의 악의적인 사용에 대한 가이던스와 확장 가능한 솔루션 개발과 함께 지속적인 연구주제로 보완해 나간다는 방침이다. 

ticktock0326@newspim.com

CES 2025 참관단 모집

[뉴스핌 베스트 기사]

사진
"尹 기자회견 대국민 사과 미흡" 71.2% [서울=뉴스핌] 이바름 기자 = 국민 10명 중 7명은 윤석열 대통령의 대국민 사과가 미흡하다고 생각하는 것으로 나타났다. 종합뉴스통신사 뉴스핌 의뢰로 여론조사 전문기관 미디어리서치가 지난 11일~12일 이틀간 전국 만 18세 이상 남녀 1002명을 대상으로 진행한 ARS 조사 결과 윤 대통령의 대국민 사과에 대해 '미흡했다(매우 미흡+다소 미흡)'고 응답한 비율이 71.2%로 집계됐다. '진정성 있다(다소 진정성+ 매우 진정성)'고 답변한 비율은 26.4%, '잘모름'은 2.4%로 나타났다.   '윤 대통령의 사과가 미흡했다'는 남녀 모두에서 과반을 넘었다. 남성은 64.9%, 여성은 62.9%가 '매우 미흡했다'고 답변했다. '다소 미흡했다'는 각각 8.3%, 6.2%였다. 남성 71.2%, 여성 69.1%가 윤 대통령 사과에 대해 '미흡했다'는 인식을 같이 하고 있는 셈이다. 연령별로 보면 1020세대와 40대가 특히 부정적으로 인식했다. 40대는 87.2%가 '미흡했다'고 답변했다. 구체적으로 '매우 미흡'이 81.0%, '다소 미흡'이 6.2%였다. '진정성 있다'는 12.3%로 '다소 진정성 있다'는 5.6%, '매우 진정성 있다'는 6.8%였다. '잘모름'은 0.5%였다. 만 18세~29세도 84.8%가 '미흡했다'고 응답했다. '매우 미흡'이 78.8%, '다소 미흡'이 6.0%로 나타났다. '진정성 있다'는 14.3%로 '다소 진정성 있다'가 2.4%, '매우 진정성 있다'는 11.9%였다. '잘모름'은 0.9%였다. 50대는 '미흡했다'가 75.2%(매우 미흡 69.6%, 다소 미흡 5.5%), '진정성 있다'는 23.5%(다소 진정성 7.0%, 매우 진정성 16.5%)로 조사됐다. '잘모름'은 1.3%였다. 30대는 '미흡했다' 68.2%(매우 미흡 62.2%, 다소 미흡 5.9%), '진정성 있다' 24.3%(다소 진정성 6.9%, 매우 진정성 17.5%), 잘모름 7.5%로 나타났다. 60대는 '미흡했다' 60.2%(매우 미흡 52.0%, 다소 미흡 8.1%), '진정성 있다' 38.4%(다소 진정성 17.7%, 매우 진정성 20.8%), '잘모름' 1.4%였다. 전 연령대에서 유일하게 70대 이상만 '진정성 있다'가 48.9%(다소 진정성 23.7%, 매우 진정성 25.3%)로, '미흡했다'고 응답한 46.9%(매우 미흡 34.4%, 다소 미흡 12.6%)를 앞질렀다. 지역별로는 광주·전남·전북이 '미흡했다'가 80.1%(매우 미흡 69.8%, 다소 미흡 10.3%)로 가장 많았다. '진정성 있다'는 16.5%(다소 진정성 7.1%, 매우 진정성 9.4%), '잘모름'은 3.4%였다. 다음으로 경기·인천은 '미흡했다' 74.8%(매우 미흡 69.3%, 다소 미흡 5.5%), '진정성 있다' 25.5%(다소 진정성 8.7%, 매우 진정성 15.8%), '잘모름' 0.7%였다. 서울은 '미흡했다' 74.2%(매우 미흡 64.3%, 다소 미흡 9.9%), '진정성 있다' 24.9%(다소 진정성 7.0, 매우 진정성 17.9%), '잘모름' 0.9%였다. 강원·제주는 '미흡했다' 71.0%(매우 미흡 66.2%, 다소 미흡 4.8%), '진정성 있다' 23.3%(다소 진정성 16.2%, 매우 진정성 7.1%), '잘모름' 5.7%로 나타났다. 부산·울산·경남은 '미흡했다' 65.9%(매우 미흡 55.4%, 다소 미흡 10.5%), '진정성 있다' 30.7%(다소 진정성 12.4%, 매우 진정성 18.3%), '잘모름' 3.4%였다. 대전·충청·세종은 '미흡했다' 64.7%(매우 미흡 61.0%, 다소 미흡 3.6%), '진정성 있다' 28.0%(다소 진정성 12.9%, 매우 진정성 15.1%), '잘모름' 7.3%로 조사됐다. 대구·경북은 '미흡했다' 59.4%(매우 미흡 54.6% 다소 미흡 4.8%), '진정성 있다' 38.5%(다소 진정성 15.8%, 매우 진정성 22.8%), '잘모름' 2.1%로 가장 낮았다. 지지정당별로는 여당을 제외하고 모두가 부정적인 답변이 많았다. 더불어민주당 지지자들은 윤 대통령의 사과가 '미흡했다'고 응답한 비율이 95.1%에 달했다. 이중 '매우 미흡'은 91.9%, '다소 미흡'은 3.1%였다. '진정성 있다'고 답변한 비율은 4.5%(다소 진정성 1.3%, 매우 진정성 3.2%)에 불과했다. '잘모름'은 0.4%였다. 반대로 국민의힘 지지자들은 62.6%가 '진정성 있다'고 대답했다. '다소 진정성이 있었다'는 26.1%, '매우 진정성이 있었다'가 36.7%로 집계됐다. '미흡했다'는 35.4%(매우 미흡 22.9%, 다소 미흡 12.4%), '잘모름'은 1.9%였다. 조국혁신당 지지자들은 '미흡했다' 95.8%(매우 미흡 94.7%, 다소 미흡 1.1%), '진정성 있다' 4.2%(다소 진정성 1.1%, 매우 진정성 3.1%)였다. 개혁신당은 '미흡했다' 90.0%(매우 미흡 77.9%, 다소 미흡 12.1%), '진정성 있다' 8.3%(다소 진정성 3.4%, 매우 진정성 4.9%), '잘모름' 1.7%였다. 진보당은 '미흡했다' 70.1%(매우 미흡 65.1%, 다소 미흡 5.0%), '진정성 있다' 29.9%(다소 진정성 2.3%, 매우 진정성 27.6%)로 조사됐다. 무당층은 '미흡했다' 78.6%(매우 미흡 71.3%, 다소 미흡 7.3%), '진정성 있다' 9.4%(다소 진정성 6.0%, 매우 진정성 3.4%), '잘모름' 12.0%였다. 국정지지별로는 '잘못하고 있다'는 응답자 중 94.8%가 '미흡했다'고 답변했다. '매우 미흡'이 87.9%, '다소 미흡'이 6.9%였다. '진정성 있다'는 3.1%(다소 진정성 2.0%, 매우 진정성 1.1%), 잘모름은 2.1%였다. 국정을 '잘 하고 있다' 응답자 중에서는 89.2%가 '진정성 있다'고 대답했다. '다소 진정성'은 32.5%, '매우 진정성'은 56.7%로 나타났다. '미흡했다'는 9.5%(매우 미흡 2.5%, 다소 미흡 7.0%), '잘모름'은 1.3%였다. 김대은 미디어리서치 대표는 "윤석열 대통령이 대국민담화 및 기자회견은 '끝장 회견'을 예고한 것과는 달리 국민이 원하는 '속 시원한' 대답은 나오지 않았다"며 "윤 대통령의 이날 답변은 대체로 두루뭉술하고 포괄적이었다"고 평가했다. 이어 "국민 앞에 고개는 숙였지만 정작 실제 답변에선 김건희 여사를 적극 두둔해 대국민사과 효과를 '반감'시켰다는 지적과 함께 문제 인식과 처방 모두에서 '국민 눈높이'에 크게 미흡 하다보니 이번에 조사한 대통령 국정지지율과 거의 비슷하게 나왔다"고 분석했다. 이번 여론조사는 성·연령·지역별 인구비례 할당 추출 방식으로 추출된 표본을 구조화된 설문지를 이용한 무선(100%) ARS 전화조사 방식으로 실시했으며 응답률은 3.6%, 신뢰수준은 95%, 표본 오차는 ±3.1%p다. 통계보정은 2024년 1월말 행정안전부 주민등록 인구통계를 기준으로 성별 연령별 지역별 가중 값을 부여(셀가중)했다. 자세한 내용은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. right@newspim.com 2024-11-14 06:00
사진
尹지지율 26.9%…'기자회견 효과 보수결집' [서울=뉴스핌] 박성준 기자 = 윤석열 대통령의 지지율이 20%대 중후반을 기록했다는 여론조사 결과가 14일 발표됐다. 종합뉴스통신사 뉴스핌 의뢰로 여론조사 전문업체 미디어리서치가 지난 11일~12일 이틀간 전국 만 18세 이상 남녀 1002명에게 물은 결과 윤 대통령의 국정운영에 대한 긍정평가는 26.9%로 집계됐다. 부정평가는 71.5%로 나타났다. '잘 모름'에 답한 비율은 1.6%다. 긍정평가(26.9%)는 지난 조사와 달라지지 않았고 부정평가는 0.4%포인트(p) 하락했다. 긍정평가와 부정평가 간 격차는 44.6%p다. 연령별로 보면 40대에서 긍정평가와 부정평가 격차가 극명하게 드러났다. 만 18세~29세에서 '잘함'은 17.1% '잘 못함' 81.1%였고, 30대에서는 '잘함' 21.3% '잘 못함' 77.2%였다. 40대는 '잘함' 10.8% '잘 못함' 88.3%, 50대는 '잘함' 24.2% '잘 못함' 75.4%로 집계됐다. 60대는 '잘함' 40.7% '잘 못함' 56.9%였고, 70대 이상에서는 '잘함' 50.8% '잘 못함' 46.2%로 집계됐다. 지역별로는 서울 '잘함' 23.6%, '잘 못함'은 73.8%로 집계됐다. 경기·인천 '잘함' 24.3% '잘 못함' 74.8%, 대전·충청·세종 '잘함' 27.3% '잘 못함' 72.1%, 강원·제주 '잘함' 14.8% '잘 못함' 74.8%로 조사됐다. 부산·울산·경남 '잘함' 33.3% '잘 못함' 65.0%, 대구·경북은 '잘함' 42.1% '잘 못함' 55.9%로 집계됐다. 전남·광주·전북은 '잘함' 18.3% '잘 못함' 79.9%로 나타났다. 성별로도 남녀 모두 부정평가가 우세했다. 남성은 '잘함' 26.2% '잘 못함' 72.6%, 여성은 '잘함' 27.6% '잘 못함' 70.4%였다. 김대은 미디어리서치 대표는 "기자회견에서 김건희 여사 관련 의혹에 대해 제대로 된 해명 대신 감싸기에만 급급했고, 명태균 씨 논란에 대한 해명도 제대로 되지 않아 결과적으로 불신만 더 키운 꼴이 됐다"며 "하지만 60-70대 이상과 영남권 등 전통적인 지지층에서는 탄핵 등의 위기감이 높아져 지지율이 오히려 상승했다"고 해석했다. 그러면서 "며칠 전 미국 대선에서 트럼프 전 대통령이 당선되면서 안보와 경제 등 위기감 고조로 보수층이 결집하며 추가적인 지지율 추락을 막을 수 있었다"고 덧붙였다. 차재권 부경대 정치외교학과 교수는 "기자회견에 대해 긍정평가와 부정평가가 동시에 존재한다"며 "형식적으로나마 기자회견을 하고 사과를 했다는 점에서 만족하는 보수 지지층이 있다"고 말했다. 이어 "지지율 자체는 큰 변동이 없지만 (이번 기자회견 때문에) 부정평가한 사람들이 나중에라도 다시 긍정평가할 가능성이 더 낮아졌다"이라며 "앞으로 지지율이 개선될 가능성은 거의 없다"고 분석했다. 이번 여론조사는 성·연령·지역별 인구비례 할당 추출 방식으로 추출된 표본을 구조화된 설문지를 이용한 무선(100%) ARS 전화조사 방식으로 실시했으며 응답률은 3.6%, 표본오차는 95% 신뢰수준에 ±3.1%p다. 통계보정은 2024년 1월말 행정안전부 주민등록 인구통계를 기준으로 성별 연령별 지역별 가중 값을 부여(셀가중)했다. 자세한 내용은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. parksj@newspim.com 2024-11-14 06:00
안다쇼핑
Top으로 이동