LLM 모델 기반으로 '출생 순간'·'동창회' 등 추론
아직 '브레인스토밍' 단계...구글 제품 적용 여부는 '아직'
[휴스턴=뉴스핌] 고인원 특파원= 구글이 인공지능(AI) 기술을 기반으로 휴대전화 사진이나 검색 결과 등의 데이터를 활용해 사람들의 인생을 하나의 '조감도'처럼 내려다볼 수 있는 '엘먼 프로젝트'를 선보였다.
미국 CNBC가 입수한 문건에 따르면, 구글 포토팀은 최근 구글의 새로운 생성형 인공지능(AI) '제미나이'를 시연하는 사내 고위급 간부 회의에서 엘먼을 시연했다.
미국의 유명 전기 작가이자 문학 평론가인 리처드 데이비드 엘먼의 이름을 따서 명명된 '엘먼 프로젝트'의 핵심 아이디어는 구글이 최근 공개한 제미나이와 같은 대규모 LLM 모델을 사용해 사용자의 검색 결과를 수집하고, 저장된 사진에서 패턴을 찾아낸 후, 챗봇을 통해 과거에는 불가능하다 여겨졌던 질문에 답하는 것이다.
이를 두고 엘먼팀은 '당신의 인생의 스토리텔러가 되는 것'이라고 설명했다.
제미나이 발표.[사진=블룸버그] 2023.12.08 mj72284@newspim.com |
◆ LLM 모델 기반으로 '출생'·'동창회' 등 인생의 중요한 순간 추론 가능
CNBC가 입수한 프레젠테이션에 따르면, 엘먼은 과거와 현재의 사진들, 검색 결과 등을 이용해 사용자의 특정 사진들에 대해 단순히 '몇 픽셀의 어떤 장면의 사진'이라는 기계적인 설명에서 벗어나 인생 전체적인 맥락에서 어떤 의미를 가지는 사진인지 보다 깊이 있게 설명할 수 있다.
예를 들면 엘먼은 LLM을 바탕으로 여러 정보를 취합해 아이의 출생 순간과 같은 인생의 중요한 순간을 추론할 수 있다.
CNBC가 입수한 프레젠테이션은 "(엘먼이) LLM을 사용해 (특정 사진이) 잭의 출생 순간이라는 것을 추론할 수 있으며, 잭이 제임스와 젬마의 첫째이자 외동아이라는 것도 알 수 있다"고 설명한다.
또 엘먼은 한 사용자가 최근 동창회에 다녀왔다는 것도 추론해 냈다. LLM으로 다양한 자료를 분석한 결과, 사용자가 졸업한 지 정확히 10년이 지났고 10년 동안 보지 못한 얼굴들이 가득한 사진을 보니 동창회 참석 장면이라는 것이다.
CNBC는 입수한 프레젠테이션에서 엘먼 팀이 '엘먼 챗'을 시연하는 모습도 볼 수 있었다고 전했다. 해당 영상에서 한 사용자가 엘먼 챗에게 "내가 애완동물을 키우나요?"라는 질문을 던지자 엘먼 챗은 "빨간 비옷을 입은 개를 키우고 있다"고 답하며 사용자가 키우는 개 이름과 함께 가장 자주 보는 가족 구성원 두 명의 이름도 제시했다.
또 다른 채팅에서는 한 사용자가 형제·자매가 언제 마지막으로 방문했는지 물었고, 또 다른 사용자는 이사를 고려 중인데, 현재 살고 있는 곳과 비슷한 도시를 나열해 달라고 요청했다. 엘먼은 두 가지 질문 모두에 답을 내놓았다.
이 외에도 엘먼은 사용자의 데이터에 저장된 사진을 바탕으로 식습관을 추론해 내기도 했으며("파스타와 피자 사진이 여러 장 있는 것으로 봐서 이탈리아 요리를 좋아하는 것 같다"), 사용자의 스크린 샷을 기반으로 현재 어떤 제품에 관심이 있으며, 업무나 여행 계획에 대해서도 파악해 냈다.
또한 구글 맵, 문서, 인스타그램 등을 통해 사용자가 즐겨 찾는 웹사이트와 앱도 파악할 수 있다고 엘먼 팀은 설명했다.
인공지능(AI) 일러스트레이션.[이미지=로이터 뉴스핌] 2023.12.08 mj72284@newspim.com |
◆ 아직 '브레인스토밍' 단계...구글 제품 적용 여부는 '아직'
저장된 사진과 검색 기록만으로 한 사람의 삶을 통째로 들여다볼 수 있다는 엘먼의 아이디어는 놀라우면서도 한편으로는 누군가 내 삶을 몰래 들여다볼 수 있다는 공포감도 자아낸다. 하지만 구글 측은 엘먼은 아직 초기 단계이며 당장 구글 제품에 접목할 계획에 대해서는 언급하지 않았다.
구글의 대변인은 CNBC와의 인터뷰에서 "구글포토는 AI를 사용해 사람들이 사진과 동영상을 검색하는 데 도움을 주었으며, LLM을 통해 더 유용한 경험을 제공할 수 있을 것으로 기대한다"면서도 "현재 (엘먼이) 초기 탐색 단계에 있는 브레인스토밍 개념이며 언제나 그렇듯이 구글은 사용자의 개인정보 보호를 최우선으로 책임감 있게 프로젝트를 발전시켜 나갈 것"이라고 밝혔다.
또한 CNBC는 구글이 엘먼을 구글포토나 다른 제품에 적용할지 여부는 아직 확실하지 않다고 전했다. 구글이 블로그에 게시한 포스트에 따르면, 구글포토 사용자 수는 10억명이 넘으며, 4조 개에 달하는 사진과 동영상이 저장돼 있다.
앞서 6일 구글은 AI의 기반이 되는 거대언어모델(LLM) '제미나이'(Gemini)를 공개했다. 제미나이는 오픈AI의 챗GPT의 LLM인 'GPT'와 같은 AI 모델로, 오픈AI의 최신 모델인 'GPT-4'보다 성능이 우수하다고 구글은 밝혔다.
koinwon@newspim.com