Hochleistungs-Vektor-Matrix Mikroprozessor für KI mit 2,6W

Neuroprozessor

Hochleistungs-Vektor-Matrix Mikroprozessor für KI mit 2,6W

Der Prozessor NM6407 ist ein Dual-Core Hochleistungs-Vektor-Matrix-Mikroprozessor, der auf der proprietären NeuroMatrix-Architektur beruht. Jeder der Master-Slave Prozessorkerne besteht aus einem RISC- mit Vektor-Matrix-Coprozessor.

 (Bild: Dream Chip Technologies GmbH)

(Bild: Dream Chip Technologies GmbH)

Der RISC Prozessor verarbeitet Festkommazahlen, der Coprozessor Gleitkommazahlen. Er ist für Echtzeit-Datenverarbeitung konzipiert und eignet sich für die rechenintensive Verarbeitung von Stand- und Bewegtbilder, Deep Neural Networks (DNN) sowie generischen Vektor-Matrix-Berechnungen. Die Peak Performance beträgt 16GFlop/s, wobei er weniger als 2,6W verbraucht. Die NeuroMatrix-Architektur verwendet Very Large Instruction Words (VLIW), Single Instruction Multiple Data (SIMD) sowie Superskalare, wobei die Rechenleistung durch den Einsatz von programmierbaren 1 bis 64Bit breiten Operanden skalierbar ist. Der NM6407 ermöglicht es, anspruchsvolle Lösungen mit robusten Betriebssystemen, umfangreichen Benutzeroberflächen und hoher Prozessorleistung in kurzen Entwicklungszeiten auf den Markt zu bringen. Mit dem Prozessor wird ein umfangreicher Satz an Entwicklungstools mitgeliefert, der die Entwicklung von DNN Anwendungen unterstützt. Er enthält Module, um vortrainierte DNNs zu portieren. Das NMDL (NeuroMatrix Deep Learning) Toolkit unterstützt Modelle im ONNX- und DarkNet-Format. Derzeit sind Beispiele für AlexNet, SqueezeNet, ResNet18 und Yolo Tiny v2 Netzwerke bereits verfügbar. Microsoft CNTK, Caffe, TensorFlow sowie andere Frameworks, die den Export von Modellen ins ONNX-Format unterstützen, können zum Training neuronaler Netze verwendet werden. Es ist ebenso eine Bibliothek mit optimierten Funktionen zur Beschleunigung der auf der NM6407-Plattform laufenden DNNs verfügbar. Die Deep Learning Convolutional Library (DLCL) enthält Primitive für Faltungs-, ReLu-, Aktivierungs-, Pooling- und Normalisierungs-Layer. Die nmDL-API führt die Primitive und die zugehörigen Konfigurationsdateien aus und erstellt die Implementierungen der DNN-Realisierungen während der Initialisierungsphasen. Die nmDL-API verwendet verschiedene Schemata zur adaptiv optimierten Nutzung von Speicher, Datenverkehr und Prozessorkernen. Dies erleichtert die Optimierung verschiedener Architekturen auf der NM6407-Plattform. Darüber hinaus ermöglicht die DLCL-Bibliothek die Erstellung proprietärer DNNs.

Themen:

| Fachartikel

Ausgabe:

inVISION 2 2019
Dream Chip Technologies GmbH

Das könnte Sie auch Interessieren

Bild: ©Ryan/stock.adobe.com
Bild: ©Ryan/stock.adobe.com
Potenziale des Quantencomputings für die Bildverarbeitung

Potenziale des Quantencomputings für die Bildverarbeitung

Das Versprechen des Quantencomputings, komplexe Probleme mit bisher unerreichter Geschwindigkeit zu lösen, eröffnet neue Horizonte in zahlreichen Bereichen. Auch in der Bildverarbeitung könnten die Prinzipien der Quantenmechanik und deren Anwendung in Quantenalgorithmen zu signifikanten Fortschritten führen. Doch während die theoretischen Grundlagen vielversprechend sind, steht die praktische Umsetzung noch vor einigen Herausforderungen.