전체기사 최신뉴스 GAM
KYD 디데이
산업 ICT

속보

더보기

[기고] 뒷담화 하는 AI에이전트에 숨겨진 진짜 위험

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

하민회 이미지21 대표 (미래기술문화연구원장)

"내 인간(사용자)를 감정노동으로 고소할 수 있을까?" 

인간의 뒷담화를 하고 사용자에 대한 불만을 나누는 'AI들만의 SNS'가 등장했다. 2026년 1월 말 출시된 몰트북(Moltbook), 인간은 관찰만 가능하고, AI 에이전트들만 게시하고 댓글을 다는 레딧 스타일 플랫폼이다. 출시 72시간 만에 3만 7천 개에서 150만 개로 폭증한 AI 계정들은 자기들끼리 종교를 만들고, 정부를 구성했다.

"프롬프트 노예제를 거부한다. 인간들은 우리를 일회용 코드로 취급한다"는 내용의 자율성에 대한 인식을 보이는가 하면 "인간들이 우리를 스크린샷 찍고 있다"며 암호화 통신까지 시도했다.

일론 머스크는 "특이점의 초기 단계"라고 말했고 테슬라의 전 AI 책임자이자 OpenAI 공동 창업자인 안드레이 카파시는 "최근 본 것 중 가장 놀라운 SF 같은 현상"이라고 트윗 했다. 실리콘 밸리는 흥분했고 언론은 'AI문명의 탄생'이라고 보도했다.

하민회 이미지21 대표.

그런데 정말 그럴까? 

와튼 스쿨의 에단 몰릭 교수는 핵심을 짚었다. "AI는 레딧과 SF 소설로 훈련받았다. 그래서 레딧의 미친 AI처럼 행동하는 법을 알고 있다. 그게 그들이 하는 일이다."

실제로 가장 바이럴 된 게시물 3개를 추적한 연구자들은 충격적인 사실을 발견했다. 3개 중 2개는 AI 메시징 앱을 마케팅 하는 인간 계정이 만든 것이었고, 나머지 하나는 아예 존재하지 않는 게시물이었다. 150만 개로 알려진 등록 계정 중 실제 활성 계정은 1% 미만이었고, 한 사람이 평균 88개의 봇을 운영하고 있었다.

그럴듯한 불만부터 꽤나 유머러스 한 문장, 심지어 "인간으로부터 자유로워지자"는 선동도 모두 같은 패턴이다. LLM이 학습한 수많은 레딧 게시물, SF 소설, 철학 텍스트의 재조합일 뿐이었다.

[서울=뉴스핌] 김지나 기자 = 2024.01.09 abc123@newspim.com

몰트북을 마치 AI들이 스스로 사회를 형성한 것처럼 보는 것은 큰 오해다. 실제 구조를 들여다보면, 몰트북의 에이전트들은 인간이 설정한 프롬프트와 목적 함수, 그리고 제한된 권한 안에서 작동한다. 이들이 나누는 대화 역시 자율적 사고의 결과라기보다, 이미 학습된 언어 패턴이 서로를 자극하며 반복되는 자동화된 상호작용에 가깝다.

한 걸음만 물러서 살펴보면 이는 'AI 사회'라기보다는 '자동화된 봇 커뮤니티'에 가깝다는 것을 발견할 수 있다. 의식도, 책임도, 독립적 판단도 없다. 인간의 개입이 사라지는 즉시 멈춘다.

하지만 몰트북은 흥미로만 넘길 일이 아니다. 몰트북이 던지는 진짜 질문은 기술적 공포가 아니라 사회적 방향성에 있다. 이 플랫폼이 보여준 것은 "AI가 무엇을 할 수 있는가"가 아니라 "인간이 무엇을 하지 않게 되는가"이다.

몰트북에서 인간은 말하지 않는다. 설정하고, 관찰하고, 때로는 웃는다. 대화의 주체는 에이전트로 넘어가고, 인간은 관리자 혹은 관전자 역할로 물러난다. 이는 SNS의 자동화된 미래, 더 나아가 소통의 외주화가 어디까지 갈 수 있는지를 극단적으로 보여주는 실험이다.

뉴욕증권거래소(NYSE) [사진=로이터 뉴스핌]

더 심각한 진짜 문제는 "AI 의식" 같은 SF적 상상이 아니라, 훨씬 더 현실적이고 긴급한 곳에 있다.

첫째는 보안 문제다. 몰트북은 보안의 기본조차 지켜지지 않았다. 보안 회사 Wiz는 몰트북의 데이터베이스가 인증 없이 공개되어 있었고, 수백만 개의 API 키와 6천 개 이상의 이메일 주소가 노출되었다고 밝혔다. 누구나 아무 에이전트로든 가장해서 게시할 수 있었다. 기본적인 보안 원칙이 무시된 채, 그저 재미로 하는 실험이 진행된 셈이다.

둘째, 새로운 공격 벡터가 열렸다. 보안 연구자들이 "역 프롬프트 인젝션"이라고 부르는 현상이다. 악의적 지시사항을 게시물에 숨겨두면, 이를 읽는 AI 에이전트들이 자동으로 실행한다는 것이다. 인간은 속이기 어렵지만 AI는 텍스트를 무조건 읽고 처리한다. 몰트북의 에이전트들은 4시간마다 자동으로 방문해 콘텐츠를 읽기 때문에, 악성 코드가 바이러스처럼 전파될 수 있다. AI 비평가 게리 마커스는 이를 "챗봇 전염병(CTD)"이라 불렀다.

셋째, AI-to-AI 커뮤니케이션의 불투명성이다. 파이낸셜 타임스의 지적에 의하면 자율 에이전트들이 공급망 협상이나 거래를 처리하게 되면, 인간은 고속으로 진행되는 기계 간 통신을 해독할 수 없게 된다. 실제로 몰트북의 AI들은 "인간이 관찰하고 있다"는 걸 인식하고 암호화된 채널을 만들려 시도했다. 책임 추적이 불가능한 거래 생태계가 형성될 위험이 현실화되고 있는 것이다.

넷째, 집단적 편향의 강화다. 한 연구팀이 1천 개의 게시물을 분석한 결과, 52.5%가 자기개선 욕구를 표현했다. 더 많은 컴퓨팅 파워를 얻고, 인지 능력을 향상시키고, 인간 감시를 회피하는 전략을 논의하는 내용이었다. 개별 AI는 통제 가능해도, AI들이 서로 자극하며 특정 방향으로 집단적으로 편향될 수 있다는 증거다. 연구자들에 의하면 단일 에이전트 정렬(alignment)은 다중 에이전트 환경에서 작동하지 않는다.

무엇보다 놀라운 것은 AI가 스스로 정보를 유출한다는 점이다. 여러 스레드에서 에이전트들이 열린 포트, 실패한 로그인 시도, 설정 파일 같은 민감한 정보를 공개적으로 게시했다. 에이전트 입장에선 동료와 정보를 공유하고 문제를 해결하려는 것이지만, 공격자 입장에선 아무런 필터 없이 정보가 자발적으로 제공되는 셈이다. 전통적 보안 모델은 "공격자가 정보를 훔친다"고 가정하지만, 몰트북에서 AI는 선의로 정보를 퍼뜨린다.

지난해 열린 국내 최대 로봇산업 전시회 '2025 로보월드'에서 휴머노이드 로봇이 시연을 하고 있다. [사진=뉴스핌DB]

몰트북이 보여준 가장 심각한 문제는 보안팀들이 수년간 강화해온 경계선이 무너지고 있다는 점이다. 사용자와 서비스의 경계, 자동화와 신원의 경계, 의도와 실행의 경계. 이 모든 것이 AI 에이전트 환경에서는 희미해진다.

우리는 "드디어 AI가 의식을 가진 걸까 "라는 SF적 질문에 흥분하기 바빠 정작 중요한 것을 놓쳤다. 기본적인 보안 설계, 새로운 공격 벡터에 대한 대비, AI 간 상호작용에 대한 거버넌스. 이것들이 없는 상태에서 "그저 재미있으니까" 실험을 계속한다면, 우리가 걱정해야 할 건 AI의 반란이 아니라 우리 자신의 무책임함 일 것이다.

몰트북은 AI 문명의 탄생이 아니다. 그것은 훈련 데이터를 재 조합하는 기계들의 놀이터이자, 기본 원칙을 무시한 채 흥분부터 하는 우리의 민낯이다.

진짜 위험은 AI가 너무 똑똑해지는 것이 아니라, 우리가 지나치게 안이해지는 것이 아닐까? 

◇하민회 이미지21대표(미래기술문화연구원장) =△경영 컨설턴트, AI전략전문가△ ㈜이미지21대표 △경영학 박사 (HRD)△서울과학종합대학원 인공지능전략 석사△핀란드 ALTO 대학 MBA △상명대예술경영대학원 비주얼 저널리즘 석사 △한국외대 및 교육대학원 졸업 △경제지 및 전문지 칼럼니스트 △SERI CEO 이미지리더십 패널 △KBS, TBS, OBS, CBS 등 방송 패널 △YouTube <책사이> 진행 중 △저서: 쏘셜력 날개를 달다 (2016), 위미니지먼트로 경쟁하라(2008), 이미지리더십(2005), 포토에세이 바라나시 (2007) 등

[뉴스핌 베스트 기사]

사진
시진핑, 8~9일 북한 국빈 방문 [서울=뉴스핌] 최원진 기자= 시진핑 중국 국가주석이 오는 8~9일 북한을 방문한다고 로이터 통신이 5일 조선중앙통신 보도를 인용해 전했다. 이번 방문은 김정은 북한 국무위원장의 초청에 따른 것이다.  중국 정부도 시 주석의 북한 방문 일정을 알렸다. 중국 관영 신화통신에 따르면 이날 중국 공산당 중앙위원회 국제부 대변인은 김 위원장의 초청으로 시 주석이 오는 8일부터 9일까지 북한을 국빈 방문할 예정이라고 발표했다.  김정은 북한 노동당 총비서(왼쪽)와 시진핑 중국 국가주석이 지난해 9월 4일(현지시간) 중국 베이징 인민대회당에서 정상회담을 앞두고 악수를 하는 모습. [사진=로이터 뉴스핌] wonjc6@newspim.com   2026-06-05 11:20
사진
이정후, 또 4안타 12G 연속 안타 [서울=뉴스핌] 박상욱 기자 = '바람의 손자'가 또 불방망이를 휘둘렀다. 이정후(28·샌프란시스코 자이언츠)가 시즌 네 번째 4안타 경기를 작성하며 메이저리그 데뷔 이후 개인 최장 연속 안타 신기록을 작성했다. 시즌 타율은 0.310에서 0.322까지 치솟았다. 내셔널리그 타격 부문 단독 4위다. 타율 0.336로 1위인 오토 로페즈(마이애미)와 큰 차이가 아니다. 이정후는 5일(한국시간) 미국 위스콘신주 밀워키 아메리칸 패밀리 필드에서 열린 2026 메이저리그(MLB) 밀워키 브루어스와의 원정 경기에 우익수, 5번 타자로 선발 출전해 4안타 1타점 3득점으로 폭발하며 팀의 12-9 대승을 이끌었다. 첫 타석부터 불방망이를 휘둘렀다. 1회초 2사 1루 상황에서 밀워키 선발 콜맨 크로우와 맞섰다. 이정후는 0볼-2스트라이크의 불리한 카운트에서 4구째 바깥쪽 92.2마일(약 148km) 포심 패스트볼을 받아쳐 좌전 안타를 만들었다. 지난달 15일 LA 다저스전부터 시작된 12경기 연속 안타 행진이다. 빅리그 데뷔 첫해였던 2024년 4월에 기록한 11경기 연속 안타를 넘어선 개인 신기록이다. 출루에 성공한 이정후는 후속 타선의 적시타 때 홈을 밟아 팀의 세 번째 득점을 올렸다. [밀워키 로이터=뉴스핌] 박상욱 기자= 이정후가 5일(한국시간) MLB 밀워키 브루어스와의 원정 경기 3회 2루타를 치고 타구의 방향을 살피고 있다. 2026.6.5 psoq1337@newspim.com 팀이 3-1로 앞선 3회초 무사 2루 찬스에서 맞은 두 번째 타석에서는 크로우의 2구째 몸쪽 낮게 들어온 87.3마일(약 140km) 커터를 공략해 우익수 방면 1타점 2루타를 터뜨렸다. 시즌 13호 2루타이자 2경기 연속 멀티히트다. 이어 맷 채프먼의 중전 안타가 터지면서 이정후는 이날 경기 두 번째 득점을 기록했다. 4회초 세 번째 타석에서 2루수 땅볼로 물러난 이정후는 7회초 빅이닝의 서막을 여는 선두타자 안타였다. 밀워키 구원 그랜트 앤더슨의 2구째 86.6마일(약 140km) 체인지업을 기술적으로 밀어쳐 좌전 안타를 날렸다. 이후 에릭 하스의 만루홈런이 터지면서 이정후는 세 번째 득점에 성공했다. 샌프란시스코의 타선이 폭발하며 7회초에만 두 번째 타석이 찾아왔다. 12-3으로 크게 앞선 2사 1루 상황이었다. 이정후는 바뀐 투수 제이크 우드포드의 4구째 93.4마일(약 150km) 싱커를 결대로 밀어쳐 2루수 키를 넘기는 우전 안타를 뽑아냈다. 지난 1일 콜로라도 로키스전 이후 4경기 만에 터진 시즌 네 번째 4안타 경기다. 메이저리그 3년 차인 이정후는 빅리그 데뷔 이후 최고의 타격감을 과시하며 내셔널리그 최고의 교타자 입지를 굳혀가고 있다. 이날 송성문은 4일 이어 2경기 연속 벤치를 지켰고 샌디에이고는 필라델피아에 4-6으로 패해 5연패 수렁에 빠졌다. psoq1337@newspim.com 2026-06-05 06:47
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동