스타트 업은 최대 100x 더 나은 임베디드 컴퓨팅 효율을 주장합니다

0
5
스타트-업은-최대-100x-더-나은-임베디드-컴퓨팅-효율을-주장합니다
스타트 업은 최대 100x 더 나은 임베디드 컴퓨팅 효율을 주장합니다

가장자리에서 삶을 살 수있는 CPU가 증가하고 있습니다. 즉, 오랫동안 계산하기 어려운 장소에 내장되어 있고 환경에서 스크라운 할 수있는 배터리 전력 또는 에너지에서 살아남은 컴퓨팅. 아키텍처에서 고유 한 비 효율성으로 좌절합니다 매우 전력 마이크로 프로세서스타트 업의 창립자 효율적인 컴퓨터 에너지 효율을 위해 일반 목적 프로세서를 처음부터 재창조하기로 결정했습니다.

Cofounder는“우리는 CPU의 능력을 가지고 있지만 한두 가지 더 효율적인 일을하고 있습니다. 브랜든 루시아.

그 결과, Electron E1과 그에 따른 컴파일러는 이제 개발자와 초기 파트너로 향하고 있습니다. 루시아에 따르면 기음-프로그래밍 가능한 프로세서는 센서 데이터에 대한 빠른 푸리에 변환을 수행하거나 기계 학습을위한 컨볼 루션을 수행하는 등 일반적인 임베디드 시스템 작업에서 상업용 초대형 CPU보다 10 배와 100 배 더 나은 효율성을 제공하고 있습니다.

주요 혁신은 칩에 공간적으로 모든 프로그램의 지침을 공간적으로 배치 할 수있는 아키텍처를 발명하는 것이 었습니다. 폰 노이만 건축Lucia는 말합니다.

데이터 흐름을위한 패브릭

Von Neumann Architecture는 수십 년 동안 컴퓨팅을 지배했습니다. 기본적으로 프로세서에 데이터와 관련하여 무엇을 해야하는지 알려주는 메모리에서 지시를받습니다. 그런 다음 다음 명령을 선택하고 다음 명령을 선택합니다.

간단하게 들리지만 실제로 많은 오버 헤드가 제공됩니다. Lucia는“초당 수십억 번, 메모리에서 지시를 받고 있습니다. 또한 프로세스가 중단되는 것을 방지하기 위해 현대 CPU는 다음에 어떤 지시가 나오는지 추측해야하며 지점 예측 그리고 여전히 더 많은 오버 헤드.

대신, E1은 데이터가 이동하는 공간 경로로서의 지시 시퀀스를 맵핑합니다. 기본적으로 E1은 “타일”배열입니다. 각각은 박탈 된 프로세서 코어와 같습니다. 일련의 지침을 수행 할 수는 있지만 명령 페치, 브랜치 예측 및 기타 오버 헤드가 부족합니다. 타일은 특별히 설계된 프로그래밍 가능한 네트워크로 연결됩니다.

E1의 컴파일러는 EFFCC 컴파일러C 또는 기타 공통 언어 및 플랫폼으로 작성할 수있는 프로그램을 읽고 프로그램의 각 명령어를 타일에 할당합니다. 그런 다음 데이터가 하나의 타일로 들어가고 처리되도록 네트워크를 설정하고, 결과는 프로그램을 실행하기 위해 올바른 시퀀스로 다음 타일에 대한 입력이됩니다. 프로그램이 if/the/else를 만날 때와 같은 시퀀스가 분기 될 때, 타일의 공간 패턴도 마찬가지입니다. Lucia는“이것은 철도의 스위치 트랙과 같습니다.

Lucia는“다른 데이터 흐름 스타일 아키텍처가있었습니다. 구글의 TPU 그리고 아마존의 추론 예를 들어, 칩은 수축기 배열이라는 데이터 흐름 아키텍처를 중심으로 설계되었습니다. 그러나 수축기 어레이 및 기타 데이터 흐름 노력은 소프트웨어가 요구할 수있는 모든 데이터 경로의 하위 집합으로 제한된다고 Lucia는 말합니다.

대조적으로, E1의 네트워크 직물은 프로그램이 요청할 수있는 임의의 경로를 허용합니다. 이에 대한 중요한 것은“While Loop”과 같은 소위 임의의 재발을 지원하는 직물의 능력입니다. (생각 :“빛은 빨간색이지만 브레이크를 눌렀습니다.”) 그러한 루프에는 피드백 경로가 필요합니다. Lucia는“처음 볼 때보 다 어렵다는 것이 밝혀졌습니다. E1 패브릭은 범용 컴퓨팅을 허용하는 방식으로 피드백 경로 주위에 값을 전달할 수 있습니다. “다른 많은 데이터 흐름 아키텍처는 그 너트를 깨뜨릴 수 없기 때문에 일반적인 목적을 수행하지 않습니다.… 제대로 얻는 데 몇 년이 걸렸습니다.”

각각 3 개의 카테고리와 3 개의 막대가있는 막대 차트. 가장 왼쪽 막대는 각 범주에서 가장 작습니다. 효율적인 컴퓨터에 따르면, E1은 기계 학습을위한 매트릭스 곱셈, 빠른 푸리에 변환 및 컴퓨터 비전을위한 컨볼 루션의 세 가지 일반적인 작업에서 2 개의 경쟁 팔 프로세서보다 적은 에너지를 소비합니다.효율적인 컴퓨터

미시간 대학교 컴퓨터 과학 및 공학 교수에 따르면 토드 오스틴E1과 같은 칩은 효율적인 아키텍처의 좋은 예입니다. 왜냐하면 지침을 가져 오기, 일시적으로 데이터를 보관하고 네트워크 경로가 사용되는지 확인하는 것과 같이 순전히 계산이 아닌 것들에 관여하는 실리콘의 일부를 최소화하기 때문입니다.

Lucia의 팀은“범용 컴퓨팅을 위해 매우 낮은 힘을 얻을 수 있도록 많은 영리한 일을하고 있습니다.”라고 말합니다. Rakesh Kumar일리노이 대학의 컴퓨터 건축가 Urbana-Champaign. 스타트 업의 도전은 경제학 일 것이라고 그는 말했다. “Ultralow-Power 회사는 저전력, 매우 저렴한 마이크로 컨트롤러의 경쟁으로 인해 어려움을 겪었습니다. 주요 과제는 새로운 기능을 식별하고 고객이 비용을 지불하게하는 것입니다.