본문
What is Cerebras?
Cerebras는 2015년에 설립되어, AI와 HPC(고성능 컴퓨팅)의 미래를 위한 새로운 차원의 시스템을 구축하기 위해 앞장서고 있습니다.
실리콘밸리, 토론토, 벵갈루루에 사무소를 두고 있으며, 북미, 아시아, 유럽 전역의 고객들과 협력하고 있습니다.
Cerebras의 혁신은 Time Magazine, Forbes AI 50, Fortune 50 AI에 소개되며 전 세계적으로 주목 받고 있습니다.
Cerebras는 단순한 칩을 넘어, 칩·시스템·소프트웨어·컴파일러·머신러닝·SDK·서비스를 아우르는 완전한 가속화 솔루션을 제공합니다. 이를 통해 고객이 인공지능 모델을 더욱 빠르고 효율적으로 구현할 수 있도록 지원합니다.
웨이퍼 스케일 엔진 (Wafer-Scale Engine)
Cerebras 기술의 핵심 기반
ü 4조 개 트랜지스터
ü 46,225 mm² 실리콘 면적
ü 희소 행렬 연산에 최적화된 90만 코어
ü 125 페타플롭스 AI 연산 성능
ü 44GB 온칩 메모리
ü 25 페타바이트/초 메모리 대역폭
ü 30 페타바이트/초 패브릭 대역폭
ü TSMC 5nm 공정
단일 칩처럼 간단하게 — CS-3 클러스터 학습
가장 큰 모델도 Cerebras에서 — 병렬 프로그래밍이나 CUDA 없이 손쉽게 실행하고 확장할 수 있습니다.
GPU 대비 훨씬 빠르고 효율적인 대규모 모델 학습이 가능합니다.
수천 대 CS-3 시스템까지 복잡한 분산 과정 없이 간단하게 확장할 수 있습니다.
웨이퍼 스케일
엔진(WSE)이 CS-3 서버를 구동,
CS-3 서버는 Cerebras AI 슈퍼컴퓨터의 동력이 됩니다.
웨이퍼 스케일 엔진
핵심 기술 (판매 불가)
|
CS-3 서버
랙 스케일 시스템
|
Cerebras AI 슈퍼컴퓨터
데이터센터에 구축된 시스템
|
|
|
|
ü 크로스 레티클 스티칭 – 웨이퍼 수준에서 다이를 연결하는 독자 기술 ü 수율 – 결함을 피하기보다 견뎌낼 수 있도록 설계된 혁신적 구조 ü Cerebras 컴파일러 소프트웨어 – GPU용으로 작성된 모델을 Cerebras 하드웨어에서 매끄럽게 실행하도록 설계 | ü 열팽창에도 안정적인 패키징 기술 – 열 팽창으로 인한 물리적 스트레스를 제어하기 위한 독자적 소재와 기술 개발 ü 효율적인 전력 공급 및 냉각 솔루션 – 웨이퍼 전면에 균일한 전력과 냉각을 제공하는 동시에, 연산 단위당 전력 소비를 획기적으로 줄인 혁신적 공급 시스템
| ü 웨이퍼 스케일 클러스터 – 최대 2,048대 CS-3 시스템까지 확장 가능하도록 설계되어, 최대 24조 파라미터 모델을 하나의 논리적 장치처럼 학습할 수 있음 ü 통합 메모리와 데이터 병렬 학습만 사용하여 코드 복잡성을 97% 감소 ü 랙당 CS-3 2대 구성 설계
|
2020년부터 업계 최초의 웨이퍼-스케일 AI 시스템에서 수율 확보, 패키징, 전력/냉각 공급, 소프트웨어 구동을 실현해 왔습니다.
Cerebras 추론 성능

