조철민 삼성전자 시스템LSI사업부 상무, 인공지능반도체포럼 조찬 강연
“갤럭시S25에 구글 나노 버전2 적용 논의, 이미 시작”
“엑시노스 SW 개발 인력, 2~3년 내 2배 늘릴 것”
[헤럴드경제=김민지 기자] 내년에 출시될 삼성전자 갤럭시S25 시리즈에 구글의 차세대 생성형 AI ‘제미나이 나노’ 버전2가 적용된다. 삼성전자는 최근 구글과 생성형 AI를 포함한 갤럭시S25의 온디바이스 AI진화를 위한 관련 협업을 시작했다. 엑시노스 온디바이스 AI 소프트웨어(S/W) 개발 인력을 향후 2배로 늘리겠다는 로드맵도 밝혔다.
조철민 삼성전자 시스템LSI사업부 AP S/W개발팀장 상무는 17일 오전 서울 인터콘티넨탈 서울에서 열린 인공지능반도체포럼 조찬강연회에서 ‘엑시노스 프로세서의 온디바이스 AI 기술’이라는 주제로 강연을 열고 “멀티 모달로 구현될 구글 ‘제미나이 나노’ 버전2을 어떻게 온디바이스 AI에서 구현할지 논의를 시작했다”며 “다음주 열릴 구글 부트캠프에서 프라이빗 미팅을 가져 다음(갤럭시S25 시리즈)의 생성형 AI를 어떻게 개발할지 논의할 예정 ”이라고 밝혔다.
제미나이 나노는 구글이 자체 개발한 생성형 AI 모델 ‘제미나이’의 경량화 버전이다.
그는 “▷스페큘레이티브 디코딩(Speculative Decoding)과 ▷얼리 엑싯(Early Exit) 거대언어모델(LLM)을 차기 갤럭시 시리즈에 적용하려고 고민하고 있다”며 “구글 제미나이 나노 버전 2에 어떻게 적용할 수 있을지 검토하고 있다”고 말했다. 해당 기술들은 내년에 출시될 갤럭시S25 시리즈에 적용될 것으로 보인다.
온디바이스 AI 분야에서의 소프트웨어 중요성을 강조하며, 향후 삼성 내에 관련 개발 인력을 늘릴 계획이라고도 밝혔다.
조 상무는 “온디바이스 AI에 삼성에 크게 2가지 소프트웨어 부문 ▷엑시노스 AI 스튜디오, ▷엑시노스 AI 스택이 있는데, 이 소프트웨어를 개발하는 인력만 현재 약 200명 정도 있다”며 “이를 2~3년 내에 두 배 정도로 키울 생각을 갖고 있다”고 말했다.
엑시노스 AI 스튜디오는 오프라인 툴체인으로, AI 모델에 대한 양자화(Quantization)나 컴파일 등 최적화를 할 수 있는 자동 툴을 제공한다. 엑시노스 AI 스택은 실제 제품에서 해당 바이너리를 구동하는 런타임 프레임워크(Runtime framework)다.
조 상무는 실제로 일부 대학 연구실에서 엑시노스를 활용해 AI를 개발하고 있다는 점도 강조했다.
그는 “지난해 저희 AP S/W개발팀에서 ‘엑시노스 포털’을 개설해 엑시노스와의 협업을 원하는 대학 연구실 후보지를 받았다”며 “저희 소프트웨어를 활용해 자체 AI 모델을 개발하는 학교들이 있는데, 이를 활용해 생태계를 만들려고 한다”고 말했다.
조 상무는 시스템LSI사업부에서 삼성 자체 모바일 AP ‘엑시노스’의 생성형 AI 솔루션을 포함한 소프트웨어 개발팀을 이끌고 있다. 엑시노스 2400은 세계 최초의 AI 스마트폰으로 출시된 갤럭시S24 시리즈의 기본·플러스 모델에 탑재됐다. 실시간 통번역 등 다양한 AI 서비스를 가능하게 한 핵심이다.
그는 갤럭시S24 시리즈가 소비자들이 AI를 실제로 체험하게 된 최초의 제품이라고도 강조했다.
조 상무는 “챗GPT가 나오면서 사람들이 AI를 접할 기회가 조금씩 생기기 시작했는데, 주변의 디바이스를 통해 AI가 어떤 것인지 체감할 수 있는 첫번째가 갤럭시S24”라며 “PC보다 스마트폰이 AI를 경험하기에 굉장히 좋은 창구가 될 수 있을 것”이라고 말했다.
작은 스마트폰에서 AI 모델을 구동하기 위한 시행착오도 컸다고 설명했다. 그는 “조그마한 스마트폰 내 한정된 메모리 사이즈 안에서 AI 서비스를 구현하려면 정말 많은 노력이 필요하다”며 “이를 통해 3종의 생성형 AI와 77종의 딥러닝 AI를 갤럭시S24 에서 구동할 수 있게 됐다”고 말했다.
향후 온디바이스 AI와 클라우드 AI가 융합된 솔루션이 개발될 수 있다는 전망도 내놨다. 클라우드 AI의 높은 프로세싱 성능이 강점이지만, 보안 문제와 천문학적 비용 등이 걸림돌로 지적된다. 반면, 온디바이스 AI는 각각의 기기에서 데이터를 처리하기 때문에 보안 문제가 적고, 비용도 훨씬 저렴하다.
조 상무는 “현재 클라우드에서 생성형 AI 서비스를 제공하는 업체 중에 수익을 내는 회사가 없어 이에 대한 고민이 크다”며 “클라우드와 엣지(온디바이스)가 향후 결합되는 해법이 나올 수 있을 것”이라고 말했다.