전체기사 최신뉴스 GAM
KYD 디데이
오피니언 외부칼럼

속보

더보기

[기고] 상상이 영상으로 만들어지는 세상

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

하민회 이미지21대표(코가로보틱스 마케팅자문)

눈을 감고 상상해보자. '스타일리시한 여성이 빛나는 네온과 도시 간판으로 가득한 도쿄 거리를 걷는다. 빨간색 긴 드레스에 검은 가죽 재킷을 걸치고 검은색 부츠, 검은색 가방을 든 그녀는 빨간 립스틱에 선글라스를 끼고 자신감 있고 자연스럽게 걷고 있다. 보행자들이 지나가고. 거리는 축축하고 바닥엔 다채로운 조명이 반사되어 거울 효과를 만들어낸다.'

머릿속에 그린 것 이상으로 생생한 장면이 바로 몇 분만에 영상으로 만들어진다. (https://openai.com/sora 에서 상상의 영상을 확인할 수 있다) 오픈AI에서 발표한 동영상 생성AI 소라(Sora)이야기다.

15일 챗GPT를 만든 오픈AI는 공식 홈페이지와 X(전 트위터)를 통해 문장을 입력하면 영상을 만들어주는 '텍스트 투 비디오(Text to Video)' 모델인 소라를 공개했다. 다양한 프롬프트 예시와 보기 영상을 함께 게재한 오픈AI는 "모든 동영상은 소라가 생성한 동영상이고, 어떠한 수정을 하지 않았다"고 밝혔다.

소라가 만든 여러 편의 영상들은 실제로 현장에서 직접 촬영하거나 그래픽 작업으로 만든 애니메이션과 구분이 어려울 만큼 정교하고 생생하다. 피부 결, 주름, 머리카락, 미세한 미소 같은 인물의 움직임이 현실의 사람과 혼돈될 만큼 자연스럽고, 시시각각 변하는 배경은 마치 사람이 계획해 촬영을 진행한 것처럼 다양한 구도를 보여준다.

소라의 놀라운 영상 퀄리티에 외신들은 '영상 제작의 혁명'이라고 했고 AI영상 분야의 선두 기업 런웨이의 CEO는 "게임이 시작됐다"는 소감을 남겼다.

오픈AI의 '소라'로 만든 동영상 캡처 [사진=오픈AI 사이트] 2024.02.16 kwonjiun@newspim.com

동영상 생성은 텍스트나 이미지 생성보다 훨씬 어렵고 까다로운 기술이다. 기술적, 계산적, 창조적 측면에서 복잡성이 증가하기 때문이다.

동영상은 시간에 따라 변화하는 일련의 이미지(프레임)의 연결로 구성된다. 당연히 각 프레임은 시간적으로 연속적이고 일관성 있어야 한다. 그런데 지금까지 나온 AI 동영상 생성물에서는 같은 영상 안에서도 캐릭터나 사물의 형태가 조금씩 달라져 완성도가 떨어진다는 지적을 받아왔다.

복잡한 내러티브와 맥락을 이해하는 능력도 요구된다. AI가 단순히 물체를 인식하고 생성하는 것을 넘어서, 그 물체들이 상호작용하는 방식과 이를 통해 전달하고자 하는 메시지나 이야기에 대한 이해가 선행되어야 자연스러운 동영상을 생성해낼 수 있기 때문이다. AI 모델에게 더 많은 지능적 이해와 추론 능력이 요구되는 셈이다.

특히 한두 줄의 프롬프트에 따라 완성형 비디오를 만들어 내는 것은 언어로 표현되지 않은 부분과 시간의 흐름까지 고려할 수 있어야 한다. 이는 단순히 이미지가 영상 속에서 연계되는 패턴만을 학습하는 게 아니라 현실 세계에서의 물리적 규칙을 내재화하고 이를 시나리오에 적용해야 함을 의미한다.

오픈AI는 기술 보고서를 통해 '다양한 방법을 사용해 비디오 데이터 생성 모델링을 연구했다'고 밝혔다.

하민회 이미지21 대표.

AI가 언어를 정확하게 이해해서 적합한 비디오를 생성할 수 있도록 비디오에 관해 설명돼 있는 캡션이 포함된 비디오를 학습시켰고 달리3(DALL·E 3)에 적용된 시각 데이터를 훈련해 언어 이해 품질을 높였다.

또 오픈AI는 동영상과 이미지를 '패치'라는 작은 데이터 단위 모음으로 표현하는데 마치 언어모델의 '토큰'과 유사한 방식으로 작동한다고 설명했다. 데이터를 표현하는 방법을 통합함으로써 다양한 기간, 해상도 및 종횡비에 걸쳐 이전보다 더 광범위한 시각적 데이터에 대한 확산모델 트랜스포머(Diffusion model Transformer)를 교육할 수 있었다고 한다.

가장 인상적인 것은 "소라가 실제 세계를 이해하고 시뮬레이션 할 수 있는 모델의 기반역할을 하며 이 기능은 AGI 달성을 위한 중요한 이정표가 될 것이라 믿는다"는 문구였다. 한 마디로 실제 세계의 범용 시뮬레이터 구축을 위한 경로를 개발하는 중이라는 것이다.

물론 소라는 아직 기술적으로 완벽하지 않다. 오픈AI는 소라가 복잡하고 물리적인 장면을 묘사하거나 인과관계를 충분히 이해하지 못하는 경우가 있다고 밝혔다. 예를 들어 사람이 쿠키를 한입 베어 무는 장면의 다음 장면에 쿠키를 깨문 자국이 나타나지 않거나 오른쪽과 왼쪽이 공간 내에서 섞이기도 하고 물리적으로 불가능한 움직임을 만들어낼 수도 있다는 것이다.

현재 오픈AI는 소라를 시각 예술가, 디자이너, 영화 제작자 등 제한된 수의 크리에이티브 전문가에게만 공개하고 피드백을 받고 있다.

딥 페이크 우려 등에 대해 오픈AI는 "극단적인 폭력이나 혐오스러운 이미지, 또는 특정 인물의 초상을 요청하는 명령어는 거부하게 조치할 것"이라며 모든 비디오는 표시되기 전 각종 안전 정책을 준수하는지 확인을 거칠 것이라 밝혔다. 오픈AI는 소라가 생성한 영상이 식별되도록 하는 도구도 개발 중이다.

삼성전자와 러시아 인공지능연구소가 사진 이미지 한장을 이용해 자연스러운 딥페이크 영상을 만들어냈다. [제공=삼성전자] 

오픈AI 가세로 AI 동영상 생성 시장은 한층 뜨거워질 전망이다.

지난해 6월 런웨이는 획기적인 기능의 '젠2' 출시로 업계 선두로 나섰고 11월에 스태빌리티 AI가 '스테이블 비디오 디퓨전'을 내놓았다. 메타의 '에뮤', MS의 비디오 생성 모델 '드래그누와', 구글의 시공간 확산 모델 '루미에르' 등도 끼어들었다. 

광고·영상 업계에선 곡소리가 들린다. 최대 1분 분량의 영상을 생성해내는 소라의 등장에 숏폼, 광고 영상 제작업체들은 직격탄을 피하기 어려워 보인다. 굳이 다수의 스태프들과 시간들이고 비용 들여 로케이션 갈 필요도 없다. 현실보다 더 현실적인 AI생성 영상이 반갑지만은 않은 이유다.

멸종한 매머드가 눈발을 헤치고 달려오고 벚꽃 사이로 눈이 내리는 드라마틱한 영상이 단 몇 줄의 프롬프트만으로 가능하다니. 오죽하면 IT 전문 매체 기즈모도가 "소라는 현실감이란 개념에 거대한 엿(Fuck)을 날리는 서비스"라 했을까?

AI 발 일자리 감소가 피부로 와닿는 요즘, 소라는 두 가지 화두를 던진다.

우선 콘텐츠, 엔터테인먼트업계에 대한 위협. 지난 해 미국 헐리우드의 작가와 배우 노동조합의 동반파업이 떠오른다. 두 집단 파업에는 넷플릭스 등 OTT 플랫폼 재상영에 대한 정당한 대가요구도 있었으나, 생성 AI로 인한 생존의 위협에 대한 호소가 컸다. AI가 쓴 초고와 수정에 따른 저작권 인정 문제, AI로 인한 초상권 침해 문제, 성우 목소리를 활용한 AI보이스 등 대부분 기술 발전으로 인해 새로 생겨난 문제들이었다. 그리고 대개의 경우 여전히 밀고 당기는 해결과정에 있다.

AI를 형상화한 이미지 [자료=블룸버그]

과연 시간과 비용, 인력을 절감한 생산성 향상만이 정답일까?

생성AI의 등장과 함께 거의 모든 산업과 업종에서 숙련도 높은 고능력자만 일자리 유지가 가능 해졌다. 경험과 업계 지식이 부족한 신입의 시장 진입은 나날이 어려워지고 있다.

AI 기술은 빛의 속도로 발전하는데 AI로 인해 생겨난 사회적 문제에 대응할 시간은 턱없이 부족하다. AI로 인해 재편되는 일자리에 대한 교육, 저작권과 초상권, 개인보호법에 관한 법적 제도적 규제 등 준비하고 해결해야 할 사안들이 쌓여간다. 너무 늦어지기 전에 논의하고 합의할 필요가 있다.

다음은 딥 페이크와 가짜뉴스 문제.

소라의 극사실적인 영상을 보며 신기함과 두려움을 함께 느끼는 건 아마도 예상되는 부작용을 직감하기 때문일 것이다. 접근이 용이하고 사용이 쉬울수록 기술의 오용과 남용은 증가하기 마련이다. 최근 미국에선 중고교학교 딥 페이크 폭력으로 인한 자살자가 늘고 있다고 한다.

기술을 멈추거나 금지할 수 없다면 법적인 규제 못지 않게 문명의 이기를 슬기롭게 사용하는 법부터 알려 줄 필요가 있다. AI로 남을 속이거나 해를 입히거나 사회 혼란을 야기해서는 안 된다는 기본부터 강조하고 반복해야 한다. 엄격한 법적 책임을 묻고 학교 교육이든 사회적 캠페인이든 AI리터러시 교육을 꾸준히 지속해야 한다.

AI 기술의 화려함에 현혹되면 자칫 '모든 기술은 결국 인간을 이롭게 하기 위함'이라는 기본명제를 깜박할 수도 있기 때문이다.

◇하민회 이미지21대표(코가로보틱스 마케팅자문) =△경영 컨설턴트, AI전략전문가△ ㈜이미지21대표, 코가로보틱스 마케팅자문△경영학 박사 (HRD)△서울과학종합대학원 인공지능전략 석사△핀란드 ALTO 대학 MBA △상명대예술경영대학원 비주얼 저널리즘 석사 △한국외대 및 교육대학원 졸업 △경제지 및 전문지 칼럼니스트 △SERI CEO 이미지리더십 패널 △KBS, TBS, OBS, CBS 등 방송 패널 △YouTube <책사이> 진행 중 △저서: 쏘셜력 날개를 달다 (2016), 위미니지먼트로 경쟁하라(2008), 이미지리더십(2005), 포토에세이 바라나시 (2007) 등

[뉴스핌 베스트 기사]

사진
LG전자, 홈로봇 '클로이드' CES 공개 [라스베이거스=뉴스핌] 김아영 기자 = LG전자가 오는 6일(현지시간) 미국 라스베이거스에서 개막하는 세계 최대 가전·IT 전시회 CES 2026에서 홈로봇 'LG 클로이드(LG CLOiD)'를 공개한다고 4일 밝혔다. LG 클로이드는 AI 홈로봇의 역할과 가능성을 보여주는 콘셉트 제품이다. 사용자의 스케줄과 집 안 환경을 고려해 작업 우선순위를 정하고, 여러 가전을 제어하는 동시에 일부 가사도 직접 수행하며 비서 역할을 수행한다. 이번 공개는 '가사 해방을 통한 삶의 가치 제고(Zero Labor Home, Makes Quality Time)'를 지향해온 LG전자 가전 전략의 연장선이라는 것이 회사 측 설명이다. LG 클로이드가 세탁 완료된 수건을 개켜 정리하는 모습. [사진=LG전자] ◆CES서 보여주는 '제로 레이버 홈' 관람객은 CES 전시 부스에서 클로이드가 구현하는 '제로 레이버 홈' 시나리오를 볼 수 있다. 출근 준비로 바쁜 거주자를 대신해 전날 세운 식단에 맞춰 냉장고에서 우유를 꺼내고, 오븐에 크루아상을 넣어 아침 식사를 준비하는 모습 등이 연출된다. 차 키와 발표용 리모컨 등 일정에 맞는 준비물을 챙겨 전달하는 장면도 포함된다. LG 클로이드가 크루아상을 오븐에 넣으며 식사를 준비하는 모습. [사진=LG전자] 거주자가 집을 비운 동안에는 세탁물 바구니에서 옷을 꺼내 세탁기에 넣고, 세탁이 끝난 수건을 개켜 정리하는 시나리오가 제시된다. 청소로봇이 움직일 때 동선 위 장애물을 치워 청소 효율을 높이는 역할도 수행한다. 홈트레이닝 시에는 아령을 들어 올린 횟수를 세어주는 등 거주자의 일상 케어 기능도 시연한다. 이러한 동작은 상황 인식, 라이프스타일 학습, 정교한 모션 제어 능력이 결합돼 구현된다는 설명이다. ◆가사용 폼팩터·VLM·VLA로 최적화 클로이드는 머리와 두 팔이 달린 상체와 휠 기반 자율주행 하체로 구성된다. 허리 각도를 조정해 높이를 약 105cm에서 143cm까지 바꿀 수 있으며, 약 87cm 길이의 팔로 바닥이나 다소 높은 위치의 물체도 집을 수 있다. LG 클로이드가 거주자 위한 식사로 크루아상을 준비하는 모습.[사진=LG전자] 양팔은 어깨 3축(앞뒤·좌우·회전), 팔꿈치 1축, 손목 3축(앞뒤·좌우·회전) 등 총 7자유도(DoF)를 적용해 사람 팔과 유사한 움직임을 구현한다. 다섯 손가락도 개별 관절을 가져 섬세한 동작이 가능하도록 설계됐다. 하체에는 청소로봇·Q9·서빙·배송 로봇 등에서 축적한 휠 자율주행 시스템을 적용해 무게 중심을 아래에 두고, 외부 힘에도 균형을 유지하면서 상체의 정밀한 움직임을 지원한다. 이족보행보다 비용 부담이 낮다는 점도 상용화 측면의 장점으로 꼽힌다. LG 클로이드가 홈트레이닝을 돕는 모습. [사진=LG전자] 머리 부분은 이동형 AI 홈 허브 'LG Q9' 기능을 수행한다. 칩셋, 디스플레이, 스피커, 카메라, 각종 센서, 음성 기반 생성형 AI를 탑재해 언어·표정으로 사용자를 인식·응답하고, 라이프스타일과 환경을 학습해 가전 제어에 반영한다. LG전자는 자체 개발 시각언어모델(VLM)과 시각언어행동(VLA) 기술을 칩셋에 적용했다. 피지컬 AI 모델 기반으로 수만 시간 가사 작업 데이터를 학습시켜 홈로봇에 맞게 튜닝했다는 설명이다. VLM은 카메라로 들어온 시각 정보를 언어로 해석하고, 음성·텍스트 명령을 시각 정보와 연계해 이해하는 역할을 맡는다. VLA는 이렇게 통합된 시각·언어 정보를 토대로 로봇의 구체적인 행동 계획과 실행을 담당한다. 여기에 LG의 AI 홈 플랫폼 '씽큐(ThinQ)', 허브 '씽큐 온'과 연결 가전이 더해지면 서비스 범위가 넓어진다. 예를 들어 가족과 씽큐 앱에서 나눈 메뉴 대화를 기반으로 식단을 계획하고, 날씨 정보와 창문 개폐 상태를 조합해 비가 오면 창문을 닫는 등의 시나리오가 가능하다. 퇴근 시간에 맞춰 세탁·건조를 마치고 운동복과 수건을 꺼내 준비하는 연출도 제시된다. ◆로봇 액추에이터 브랜드 'LG 악시움' 첫 공개 LG전자는 홈로봇을 포함한 로봇 사업을 중장기 성장축으로 보고 조직·기술 강화에 나서고 있다. 최근 조직개편에서 HS사업본부 산하에 HS로보틱스연구소를 신설해 전사에 흩어져 있던 홈로봇 관련 역량을 모으고, 차별화 기술 확보와 제품 경쟁력 제고를 목표로 삼았다. LG 액추에이터 악시움(AXIUM) 이미지. [사진=LG전자] 이번 CES에서는 로봇용 액추에이터 브랜드 'LG 액추에이터 악시움(LG Actuator AXIUM)'도 처음 공개한다. '악시움'은 관절을 뜻하는 'Axis'와 Maximum·Premium을 결합해 고성능 액추에이터를 지향한다는 의미를 담았다. 액추에이터는 모터·드라이버·감속기를 통합한 모듈로 로봇 관절에 해당하며, 로봇 제조원가에서 비중이 큰 핵심 부품이다. 피지컬 AI 확산과 함께 성장성이 높은 후방 산업으로 평가된다. LG전자는 가전 사업을 통해 고성능 모터·부품 기술을 축적해왔다. AI DD 모터, 초고속 청소기용 모터(분당 15만rpm), 드라이버 일체형 모터 등 연간 4,000만 개 이상 모터를 자체 생산하고 있다. 회사는 이 같은 기술력이 액추에이터의 경량·소형·고효율·고토크 구현에 기반이 될 것으로 기대한다. 휴머노이드 한 대에 수십 개 액추에이터가 필요한 만큼, LG의 모듈형 설계 역량도 맞춤형 다품종 생산에 도움이 될 것으로 전망된다. ◆홈로봇 성능·폼팩터 진화 지속…축적된 로봇 기술은 가전에 확대 적용 LG전자는 집안일을 하는 데 가장 실용적인 기능과 형태를 갖춘 홈로봇을 지속 개발하는 동시에 청소로봇과 같은 '가전형 로봇(Appliance Robot)'과 사람이 가까이 가면 문이 자동으로 열리는 냉장고처럼 '로보타이즈드 가전(Robotized Appliance)' 등 축적된 로봇 기술을 가전에도 확대 적용할 계획이다. AI가전과 홈로봇에게 가사일을 맡기고, 사람은 쉬고 즐기며 가치 있는 일에만 시간을 쓰는 AI홈을 만드는 것이 목표다. 백승태 LG전자 HS사업본부장 부사장은 "인간과 교감하며 깊이 이해해 최적화된 가사 노동을 제공하는 홈로봇 'LG 클로이드'를 비롯해 '제로 레이버 홈' 비전을 향한 노력을 지속해 나갈 것"이라고 밝혔다. aykim@newspim.com 2026-01-04 10:00
사진
의대 정시 지원자 5년 만에 최저 [서울=뉴스핌] 정일구 기자 = 올해 의과대학 정시모집 지원자가 큰 폭으로 줄어 최근 5년 중 최저치를 기록했다. 4일 종로학원에 따르면 2026학년도 전국 39개 의대 정시모집 지원자는 7125명으로 전년대비 32.3% 감소했다. 지원자는 2022학년도 9233명, 2023학년도 844명, 2024학년도 8098명, 2025학년도 1만518명으로 집계됐다. 사진은 4일 서울 시내의 한 의과대학 모습. 2026.01.04 mironj19@newspim.com   2026-01-04 15:57
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동