kt cloud, 12월까지 KT 초거대 AI 학습용 GPU 인프라 구축
2022-10-25 09:52


kt cloud 직원들이 하이퍼스케일 AI 존이 구축된 인터넷데이터센터(IDC)에서 장비를 점검하고 있다. [kt cloud 제공]

[헤럴드경제=김현일 기자] kt cloud가 오는 12월까지 KT 대덕2연구센터에 초거대 인공지능(AI) 학습용 GPU 인프라를 구축한다고 25일 밝혔다. 하이퍼스케일 AI 컴퓨팅(HAC) 인프라를 구축해 성능과 운영 효율성 검증을 거쳐 본격적인 초거대 AI 사업 시장 공략에 나선다는 전략이다.

초거대 AI란 대용량의 연산이 가능한 GPU 인프라를 바탕으로 대규모 데이터를 학습해 사람처럼 스스로 사고할 수 있도록 설계된 AI다.

초거대 AI 사업을 추진 중인 KT는 GPU 컴퓨팅 인프라를 확보하기 위해 kt cloud의 HAC와 엔비디아의 GPU 어플라이언스를 병행 도입하기로 결정했다.

HAC는 여러 대의 GPU를 논리적으로 결합해 하나의 GPU처럼 사용하며 수백 수천개의 GPU 클러스터링을 지원한다. 대규모 연산이 필요할 때 다중, 동적 할당기술을 통해 원하는 만큼만 GPU 자원을 할당받고, 연산 후 즉시 반납할 수 있어 탄력적으로 서비스를 이용할 수 있는 것이 장점이다. GPU 사용기간, 할당자원만큼 비용이 책정돼 고가의 장비 구축 부담도 줄일 수 있다.

kt cloud의 HAC는 지난해 12월 출시된 세계 최초 종량제 GPU 서비스다. AI 모델 대형화에 필요한 ▷비즈니스 민첩성 ▷비용 효율성 ▷개발 유연성·연속성 ▷프로그래밍 호환성의 강점을 갖추고 있다. HAC의 GPU는 비용 효율이 높은 것으로 평가받는 AMD 제품을 사용했다.


HAC(하이퍼스케일 AI 컴퓨팅) 서비스. [kt cloud 제공]

kt cloud가 초거대 AI 언어모델 학습 테스트를 진행한 결과 HAC는 동등한 조건의 기존 구축형 서비스 대비 30~50%의 비용절감 효과가 있는 것으로 나타났다. kt cloud는 서버 팜을 지속적으로 증설해 향후 최대 10분의 1 수준의 효율적 비용으로 동급 연산 자원을 제공할 수 있을 것으로 기대하고 있다.

kt cloud는 이번 사업 참여로 HAC의 초거대 AI 주요 사업 레퍼런스를 확보하게 됐다. 초거대 AI 학습 성능개선과 재학습결과 등을 검토 및 보완해 글로벌 탑티어 수준까지 기술력을 끌어올린다는 계획이다.

윤동식 kt cloud 대표는 “HAC는 초거대 AI 연구 및 서비스 개발에 필수인 대규모 인프라를 제공하는 혁신 기술이자 서비스”라며 “초거대 AI 산업의 문턱을 낮춰 대규모 GPU 인프라가 필요한 AI 전문기업·스타트업 등과 성공 사례를 만들어가고 있다. 국내외 AI 선도기업들과 초거대 AI 산업 성장을 이끌어 갈 것”이라고 전했다.



joze@heraldcorp.com



랭킹뉴스


COPYRIGHT ⓒ HERALD CORPORATION. All Rights Reserved.