역사상 가장 큰 칩을 죽이는 미국 AI 칩 "흑마"

다수의 외국 언론 보도에 따르면, 최근에, 미국 AI 칩 스타트 업인 CerebrasSystems는 "TheCerebrasWaferScaleEngine"이라고 불리는 칩 중 가장 큰 칩을 출시했다. (이하 WSE라고 함)에는 1.2 조 트랜지스터가 있습니다.

칩 역사상 1971 년 인텔의 첫 4004 프로세서는 2,300 개의 트랜지스터 만 가지고 있었고 가장 최근의 고급 마이크로 디바이스 프로세서는 330 억 개의 트랜지스터 만있었습니다. 삼성은 또한 2 조 개의 트랜지스터가있는 플래시 메모리 칩 (eUFS 칩)을 구축했지만 AI 컴퓨팅에는 적합하지 않습니다.

가장 큰 기록을 자랑하는 칩인 WSE는 AI 컴퓨팅을 위해 탄생했습니다.

이 데이터는 42,225-square-mm 칩에 400,000 개의 코어를 가지고 있으며, 이는 초당 100PB의 총 대역폭을 제공하는 세분화 된 모든 하드웨어 인트라 메시 네트워크 통신 네트워크로 연결되어 있습니다. 더 많은 코어, 더 많은 로컬 메모리 및 저 지연, 고 대역폭 아키텍처는 AI 작업을 가속화하기위한 최상의 아키텍처를 만듭니다. WSE는 가장 큰 GPU보다 56.7 배 더 크며 18GB의 온 칩스 램이 있습니다.

실제로 오늘날 칩의 대부분은 12 인치 실리콘을 기반으로하는 멀티 칩 통합입니다. 그러나 CerebrasSystems의 칩은 트랜지스터가 단결정 실리콘 웨이퍼에 상호 연결된 별도의 칩입니다. 상호 연결된 설계를 통해 모든 트랜지스터를 전체적으로 고속으로 작동 할 수 있습니다.

명시 적으로 설명하면,이 제품은 컴퓨터 학습, 컴퓨팅 성능 및 스토리지 대역폭 이상, 죄송합니다. 사람의 수준 또는 새로운 어휘 비트 바이트 (페타 바이트, 1PB = 1024TB = 10 ^ 6GB = 2 ^ 50 비트)이며 속도는 약 3,000 배입니다 NVIDIA의 최대 그래픽 프로세서 (GPU, 부동 소수점 컴퓨팅 성능, AI 관련 연구에 일반적으로 사용됨) 및 스토리지 대역폭은 1000 배입니다.

이러한 강력한 기능은 칩의 1.2 조 트랜지스터에서 비롯됩니다. 1971 년 인텔의 4004 프로세서에는 2,300 개의 트랜지스터가있는 것으로 알려져 있습니다. 무어의 법칙에 따르면,“18 개월마다 칩의 트랜지스터 수가 두 배가됩니다.”올해에는 정확히 1 조 개의 트랜지스터와 하나 이상의 트랜지스터가 있어야합니다. 실현 될 수있는 컴퓨팅 성능이 1 포인트 증가합니다. 둘째, 칩 아키텍처 설계와 칩 인터커넥트 및 통신 방식도 매우 발전하여 1.2 조 트랜지스터 사이의 시너지 효과를 매우 동 기적으로 만들어 나노초 수준을 지연시킨다. 런타임시이 1.2 조 트랜지스터는 A 트랜지스터가 동기화 된 것과 같습니다.

인공 지능 분야에서 칩의 크기는 매우 중요합니다. 큰 칩은 정보를 더 빠르게 처리하므로 응답을 생성하는 시간이 더 짧습니다. 관찰 시간 또는 "훈련 시간"단축 연구원들이 더 많은 아이디어를 테스트하고 더 많은 데이터를 사용하며 새로운 문제를 해결할 수 있습니다. 구글, 페이스 북, OpenAI, 텐센트, 바이두 등 많은 사람들이 오늘날 인공 지능 개발의 근본적인 한계는 모델을 훈련시키는 데 너무 오래 걸린다고 믿고있다. 따라서 교육 시간을 줄이면 산업 발전 과정에서 큰 병목 현상이 제거됩니다.

물론 칩 제조업체는 일반적으로 큰 이유로 칩을 생산하지 않습니다. 단일 웨이퍼에서는 일반적으로 제조 과정에서 일부 불순물이 나타납니다. 약간의 불순물은 칩 고장을 일으킬 수 있으며 심지어 여러 칩을 심각하게 분해합니다. 단일 웨이퍼에 하나의 칩만 제조되는 경우, 불순물을 함유 할 확률은 100 %이며, 불순물로 인해 칩이 완전히 파손될 수 있습니다. 그러나 CerebrasSystems의 칩 설계는 미미하여 하나 또는 소량의 불순물이 전체 칩을 무효화하지 않도록 보장합니다.

Cerebras Systems의 CEO 펠드먼은 "우리 회사의 WSE 칩은 인공 지능을 위해 설계되었으며 교차 연결 *, 수율, 전력 출력과 같은 수십 년 동안 칩 크기를 제한하는 기술적 과제를 해결하는 기본 혁신 기술을 포함하고있다"고 밝혔다. 그리고 포장. 모든 아키텍처 결정은 인공 지능 작업의 성능을 최적화하는 것입니다. 결과적으로 WSE 칩은 작업량에 따라 전력과 공간이 거의없이 수백 또는 수천 번의 기존 솔루션을 제공합니다. 성능. "

이러한 성능 향상은 신경망 훈련의 모든 요소를 가속화하여 달성됩니다. 신경망은 다단계 계산 피드백 루프입니다. 입력이 루프를 더 빠르게 통과할수록 루프는 더 빨리 학습하거나 "트레인"한다. 루프를 통해 더 빠르게 입력을 얻는 방법은 루프 내에서 계산 및 통신 속도를 높이는 것입니다.

통신 아키텍처에서 클러스터 통신 아키텍처는 WSE에서 릴레이 프로세서를 사용하기 때문에 기존의 통신 기술에서 전력 소비의 일부로 인해 발생하는 대역폭과 지연을 극복합니다. 2 차원 어레이 구조를 사용하여 400,000 개의 WSE 기반 프로세서를 함께 연결함으로써 클러스터 아키텍처는 초당 최대 100 비트 (초당 1017 바이트)의 전체 대역폭으로 낮은 대기 시간과 높은 대역폭을 달성합니다. . 추가 소프트웨어가 설치되어 있지 않더라도 이러한 클러스터 구조는 글로벌 정보 처리를 지원할 수 있으며 수신 된 정보는 해당 프로세서에서 처리됩니다.

이 제품의 경우 대량 생산 및 방열이 주요 과제 일 수 있습니다. 그러나 WSE의 출현으로 자체 하이라이트로 충분합니다.

Linley Group 수석 애널리스트 Linley Gwennap은 "CerebrasSystems는 웨이퍼 스케일 패키지 기술에 큰 진전을 이루 었으며 실리콘 칩의 프로세싱 성능은 누구의 상상력보다 훨씬 뛰어나다"고 말했다. 이 업적을 달성하기 위해이 회사는 고속 다이-투-모드 통신 활성화, 제조 결함 해결, 대형 칩 패키징, 고밀도 전원 공급 장치 및 냉각 제공 등 업계를 괴롭히는 일련의 엔지니어링 과제를 해결했습니다. 시스템. CerebrasSystems 단 몇 년 만에 새로운 기술을 개발하고 제품을 제공하는 다른 분야의 최고 엔지니어들을 한자리에 모으는 것은 놀라운 성과입니다. "

TiriasResearch의 수석 분석가이자 설립자 인 Jim McGregor는 다음과 같이 성명에서 말합니다. "지금까지 재구성 된 그래픽 프로세서는 컴퓨팅 성능을위한 인공 지능에 대한 엄청난 수요를 충족 시켰습니다. 오늘날의 솔루션에는 수백 가지의 재구성 된 그래픽이 있습니다. 프로세서는 서로 연결되어 있으며 설치, 수백 킬로와트의 전력을 사용하고 인공 지능 소프트웨어를 광범위하게 수정하여 기능을 달성하는 데 몇 달이 걸립니다. 대조적으로, 단일 칩 WSE 칩의 절대 크기는 더 많은 계산, 고성능 메모리 및 더 큰 대역폭을 가능하게합니다. WSA 칩은 느슨한 연결, 느린 메모리, 캐시 기반 및 웨이퍼 규모 패키지 통합 기술을 통한 통합을 피합니다. 그래픽 중심 프로세서 칩에 내재 된 기존의 성능 제한.

2016 년에 설립 된 CerebrasSystems는 데이터 센터 교육을위한 데이터 제품 제공에 중점을 둔 초기부터 업계에서 신비 롭고 키가 낮습니다. "세계에서 가장 기대되는 100 개의 칩 회사"로 선정되었습니다. CBInsights에 의해. 데이터에 따르면이 회사는 2016 년에 2,500 만 달러의 Series A 파이낸싱을 완료했습니다. 투자자는 잘 알려진 벤처 캐피탈리스트 벤치 마크였으며 나중에 여러 번의 파이낸싱을 받았습니다. 2017 년 9 월 기준, 총 1 억 1 천 2 백만 달러의 자금이 8 억 8 천 2 백만 달러에 달했습니다.

회사 창립 팀의 배경 또한 매우 강력합니다. 칩 회사 인 SeaMicro를 설립 한 Andrew Feldman의 공동 설립자이자 CEO는 2012 년 3 억 3,300 만 달러에 AMD에 인수되었습니다. SeaMicro가 AMD에 인수 된 후, 원래 급우들은 대부분 작업을 계속하기 위해 AMD에 입사했습니다. 따라서 Andrew Feldman이 사업을 계속하기 위해 주도권을 잡았을 때, 많은 오래된 동료들이 따르기로 선택했고, 다른 주요 팀원 대부분은 주로 설립자와 함께했습니다 앤드류 펠드먼

언급 할 가치가있는 것 중 하나는 Gary Lauterbach입니다. Sun이 하루 중반 인 1990 년대에 Gary Lauterbach는 회사의 수석 칩 디자이너로 일했습니다. 나중에 SeaMicro에서 그는 주로 저전력 서버 설계에 종사했습니다. 회사는 창립 초기에 많은 저전력 소비를 축적했다고 말할 수 있습니다. 칩 설계의 베테랑 인 이는 의심 할 여지없이 평균적인 스타트 업에서 승리 한 것입니다.

그런 다음 2018 년에 또 다른 헤비급이 Celebras Systems에 합류했으며 전 건축 및 데이터 센터 부사장 CTO Dhiraj Mallick은 공식적으로 엔지니어링 및 비즈니스 부사장을 역임했습니다. 인텔 재임 기간 동안 2018 년 2 분기 매출은 전년 대비 10 억 달러 증가했습니다. 2018 년 상반기에이 회사의 데이터 센터 매출은 100 억 달러로 증가했습니다. 그것은 인정 된 기술과 비즈니스 천재입니다. 또한 SeaMicro 및 AMD의 AndrewFeldman의 오래된 동료입니다. 이 회사에는 현재 194 명의 직원이 있습니다.

CerebrasSystems는 미래에 갈 길이 멀지 만 AI가 컴퓨터 아키텍처와 칩 패키징 기술의 물결을 가져오고 있다고 상상하기는 어렵지 않습니다. 우리는 더 흥미롭고 예기치 않은 AI 칩을 목격 할 것으로 기대할 수 있습니다.