AI 핵심 요약
beta- 삼성전자가 30일 그록3 LPU 양산을 공식화했다.
- 젠슨 황 CEO가 3월 GTC에서 삼성 제조를 공개하며 감사 인사했다.
- 4나노 공정의 수율 안정성과 설계 유연성이 AI 경쟁력으로 입증됐다.
!AI가 자동 생성한 요약으로 정확하지 않을 수 있어요.
LLM 추론 특화 초저지연 AI 가속기...생산은 테일러 4나노
4나노 공정 성숙도·확장성 갖춰…AI 핵심 생산 플랫폼으로 부상
[서울=뉴스핌] 서영욱 기자 = 삼성전자가 4나노 공정을 기반으로 한 추론 특화 인공지능(AI) 가속기 '그록(Groq)3 언어처리장치(LPU)'의 양산을 공식화했다. 기존에 확보한 수주 물량이 실제 양산 단계에 진입하면서 4나노 파운드리의 수율 안정성과 설계 유연성을 바탕으로 한 경쟁력이 입증됐다는 평가가 나온다.
◆젠슨 황 "땡큐, 삼성"...LLM 추론 특화 LPU '그 칩'이 주인공
30일 삼성전자와 반도체 업계에 따르면 삼성전자는 최근 홈페이지를 통해 "차세대 LPU 제품을 올 하반기부터 양산할 예정"이라고 밝혔다. 해당 제품은 '그록3 LPU'다.
앞서 지난 3월 미국 새너제이에서 열린 GTC 2026에서 젠슨 황 최고경영자(CEO)는 '그록3'를 처음 공개하며 "삼성전자가 제조를 맡아 올 3분기부터 출하가 시작될 예정"이라고 밝힌 바 있다. 그러면서 "삼성에 감사하다"고 말해 양사 협력 관계가 재조명을 받기도 했다.
여기에 이번 삼성전자의 공식 발표로 양산 일정이 구체화되면서 해당 칩이 실제 생산 단계에 진입했음이 확인됐다. 생산은 현재 가동을 준비 중인 미국 텍사스주 테일러의 4나노 파운드리 공장에서 이뤄질 예정이다.

LPU는 대형언어모델(LLM)이 실제 서비스에서 답을 생성하는 '추론(inference)' 과정을 전담하는 전용 칩이다. LLM은 학습 단계에서 방대한 데이터를 통해 패턴을 익힌 뒤, 서비스 단계에서는 질문에 대해 단어(토큰)를 하나씩 순차적으로 생성하는데, 이때 응답 속도와 지연 시간이 성능을 좌우한다. LPU는 이 토큰 생성 과정을 빠르고 일정하게 처리하도록 설계돼 초저지연 응답에 강점을 갖는다.
반면 그래픽처리장치(GPU)는 대규모 연산을 병렬로 처리해 모델을 학습시키는 데 최적화된 구조다. 이 때문에 최근 AI 시스템은 GPU가 학습을 담당하고, LPU와 같은 전용 칩이 추론을 맡는 방식으로 역할이 분화되는 흐름을 보이고 있다.
◆수율·성능 잡은 4나노…AI 핵심 공정 부상
이번 양산 계획은 4나노 공정의 위상 변화와도 맞닿아 있다. 삼성전자의 4나노는 성숙 공정의 안정성과 선단 공정의 성능을 동시에 확보한 '완성형 공정'으로 평가된다. 최선단 공정 대비 초기 수율 리스크를 낮추면서도 성능과 전력 효율을 확보한 '중간 지점' 공정으로, 이미 수년간 축적된 양산 데이터를 기반으로 안정성이 검증됐다.
특히 설계 유연성이 강점이다. 동일 공정 내에서 고성능 중심 설계와 저전력 설계를 모두 구현할 수 있어 AI 칩은 물론 모바일·자동차·통신 등 다양한 분야에 대응할 수 있다. 배선 구조 개선을 통해 데이터 이동 효율도 높아지면서 AI 칩처럼 데이터 처리 비중이 큰 구조에서 실제 성능을 끌어올리는 효과가 있다는 평가다.

양산 안정성도 경쟁력으로 꼽힌다. 대형 다이 구조를 갖는 AI 칩은 수율 확보가 어려운 만큼 공정 안정성이 핵심인데, 4나노는 장기간 생산 경험을 통해 수율과 공정 변동성을 안정화한 상태다. 생산 일정과 비용 예측이 가능한 수준에 도달하면서 AI·고성능컴퓨팅(HPC) 분야에서 현실적인 선택지로 부상하고 있다.
반도체업계 관계자는 "4나노 공정은 AI와 고성능 컴퓨팅(HPC)을 비롯해 고대역폭메모리(HBM), 자동차용 반도체, 통신 칩 등 다양한 분야에서 동시에 활용되는 흐름을 보이고 있다"며 "특정 용도에 국한된 기술이 아니라 성능과 전력 효율, 안정성을 모두 갖춘 범용 플랫폼으로 자리 잡고 있다는 평가가 나온다"고 말했다.
syu@newspim.com












