마이크로소프트에 한때 시총 1위 반납
정말 뒤처졌나, 애플 침묵 행보 저의는
언론사에 LLM 학습 라이선스 계약 타진
정제된 문장·검증 데이터 등 고품질 학습
이 기사는 1월 12일 오후 4시36분 '해외 주식 투자의 도우미' GAM(Global Asset Management)에 출고된 프리미엄 기사입니다. GAM에서 회원 가입을 하면 9000여 해외 종목의 프리미엄 기사를 보실 수 있습니다.
[서울=뉴스핌] 이홍규 기자 = 미국 애플(종목코드: AAPL)이 11일(현지시간) 주식시장에서 한때 마이크로소프트에 시가총액 1위를 반납했다. 주식시장이 열광하는 생성형 인공지능(AI) 분야에서 마이크로소프트가 선두에 서고 있다는 인식이 반영된 결과로 생성형 AI의 대조류(大潮流)가 일으키는 기술 업계의 변화상을 드러내는 단면이다.
애플 스토어 [사진=블룸버그통신] |
생성형 AI의 개발·상용화를 잇달아 선언하는 기술 업계의 분위기와 다르게 '뒤처졌다'는 지적까지 감수하며 대외적으로 침묵을 이어오는 애플의 '저의(底意)'를 둘러싸고 투자자들의 관심은 더욱 증폭되고 있다. 언론 보도를 통해 개발은 진행 중이라는 것 자체는 거의 모두가 아는 사실이 됐지만 애플이 구상하는 전략이나 상업화 계획에 대해서는 구체적으로 알려진 것이 없어서다.
현재까지의 언론 보도를 종합하면 애플의 생성형 AI 개발은 'Ajax'로 불리는 대규모언어모델(LLM)을 중심으로 전개되고 있다. Ajax 성능이 최근 어느 수준까지 도약했는지는 구체적으로 파악된 바 없지만 작년 9월 당시 성능·규모의 지표가 되는 파라미터(매개변수) 수가 2000억여개로 오픈AI의 초기 LLM 모델 GPT-3(후속 GPT-4의 파라미터는 일각에서 1조7000억개로 알려짐)을 능가하는 것으로 전해진 바 있다.
*애플은 작년 10월 컬럼비아대학교의 연구원들과 공동으로 '페렛(Ferret)'이라는 명칭의 오픈소스 LLM을 공개한 적이 있다. 프렛은 일부 성능지표에서 GPT-4를 능가하는 것으로도 소개됐으나 상업화 목적이 아닌 관련 모델에 대한 의견 수집 및 개선 방법을 도모하는 연구용으로 공개된 것이라 주목도가 낮았다. 누구나 LLM을 필요에 맞게 수정하고 복제할 수 있는 뜻을 가진 오픈소스라고는 했지만 연구용으로만 활용돼야 한다는 전제가 달렸다.
애플이 생성형 AI의 열띤 홍보를 벌이는 다른 업체들과 달리 잠행을 유지하는 것은 제품 출시까지 말을 아끼는 특유의 관행과 더불어 기술적 복잡성, 개인정보 우선이라는 가치관이 맞물린 복잡다단한 영역이어서다. 기술 복잡성의 예로 애플의 음성비서 시리(Siri)에 새 명령어를 추가하려면 데이터베이스를 다시 구축해야 하는데 복잡한 설계 탓으로 매번 최장 6주의 기간이, 검색 기능 등 고도화된 기능을 추가하려면 총 1년여의 세월이 소요될 수 있다고 한다.
또 프라이버시 관련 문제의 예로는 생성형 AI 기술을 탑재한 Siri가 사용자의 행동이나 선호도를 예상하고 이를 바탕으로 개인화된 추천을 제공할 때 개인정보가 침해되는 경우가 발생할 수 있다는 점이다. Siri가 아마존의 알렉사(Alex)나 구글의 구글어시스턴트(Google Assistant)보다 뒤늦게 출시된 배경이기도 하다. 블룸버그통신에 따르면 애플의 존 지아난드레아 머신러닝(ML, 기계학습) 및 AI 책임자는 종전부터 타사 개발 상황을 보면서 보수적으로 접근하고 싶다는 의향을 드러냈다고 한다.
현재까지 전해진 이야기를 보면 애플의 생성형 AI 개발 구상은 크게 ①고급화 ②외부 데이터센터와 디바이스에서의 구현 병행 등 2가지로 나뉘는 듯하다. ①전략은 최근 애플이 자사 LLM 훈련을 위해 언론사에 접근해 라이선스 계약 체결을 타진 중이라는 언론 보도를 통해 엿볼 수 있는데 언론사의 정제된 문장이나 검증된 데이터 등을 통해 소위 '고품질' 정보를 학습시키려는 의도가 있다. 인터넷상에서 존재하는 방대한 자료를 수집해 발생하는 오(誤)정보나 답변의 편향성 등 기술 신뢰성을 저해하는 요소를 사전 배제하겠다는 의도인 셈이다.
애플이 언론사들에 제시한 총계약 금액은 최소 5000만달러, 계약 단위는 '수년'으로 알려졌다. 다만 애플이 요구한 기사 아카이브 접근 권한이 너무 광범위하고 관련 콘텐츠 활용에 따라 발생할 수 있는 법적 문제 책임은 언론사가 진다는 점을 요구하고 있어 관련 언론사가 난색을 표하는 입장이라고 한다. 그런데도 일부는 애플의 접근 방식에 대해 인터넷에서 무단으로 정보를 수집해 활용하는 다른 생성형 AI 모델과는 달라 긍정적으로 평가하고 협상 타결을 낙관하는 것으로 알려졌다.
▶②편에서 계속
bernard0202@newspim.com