AMD Embedded R-Series Plattform Inspiriert Zu Innovativen Neuen Applikationen in Small Form Factor Board Designs
Total Page:16
File Type:pdf, Size:1020Kb
AMD WHITE PAPER AMD Embedded R-Series Plattform Inspiriert zu innovativen neuen Applikationen in Small Form Factor Board Designs AMD Embedded Solutions 1 AMD WHITE PAPER AMD Embedded R-Series Plattform Inhaltsverzeichnis 1. Einleitung 3 2. APUs: Große Performance in kleiner Verpackung 4 2.1 APUs unter die Haube geschaut 5 3. Auswirkung auf kleine Formfaktoren 7 3.1 Wie klein ist klein? 7 3.2 Betrachtung des Thermal-Designs 11 4. Die AMD R-Series APUs auf SFF Boards nutzen 13 4.1 COM Express® und seine Varianten 13 4.1.1 Umsetzung mit AMD R-Series APU 14 4.2 Das stapelbare SUMIT™ Erweiterungsinterface 15 4.2.1 SUMIT Signale 16 4.2.2 Legacy Support 16 4.2.3 Umsetzung mit AMD R-Series APU 17 4.3 COMIT™ 18 4.3.1 COMIT Signale 18 4.3.2 Umsetzung mit AMD R-Series APU 19 4.4 PC/104 Standards 19 4.4.1 PCI/104-Express™ und PCIe/104 20 4.4.2 Umsetzung mit AMD R-Series APU 21 4.5 Qseven® 23 4.5.1 Der MXM Konnektor 24 4.5.2 Umsetzung mit AMD R-Series APU 24 5. Fazit 25 6. Weiterführende Informationen 26 AMD Embedded Solutions 2 AMD WHITE PAPER AMD Embedded R-Series Plattform 1. Einleitung In den letzten Jahren hat sowohl die Nachfrage der Verbraucher nach Multimedia-reichen, tragbaren Handheld-Geräten als auch die Nachfrage der Industrie und der Verteidigungstechnik nach Miniaturisierung mehrere große Trends in der Technologie und im Design von Embedded Systemen hervorgebracht und beschleunigt: ▲ Neue, kompakte High-Speed-Interconnect Schemata, die völlig unabhängig von Formfaktor- Standards für Boards sind, wurden definiert und weiterentwickelt (sie werden gemeinhin als "Connectorology" bezeichnet. Dieser Begriff wirkt zunächst obskur. Er erlangt aber in der Industrie zunehmend allgemeine Anerkennung). ▲ Modulare Designs wie COMs (Computer-On-Modules) oder stapelbare Board-Systeme, die die Entwicklung der Prozessor-basierten Boards von den I/O-Boards trennen, reduzieren den Bedarf nach Inhouse-Designs und erweitern die Vielfalt und Verfügbarkeit von Modul- Lösungen, die off-the-shelf verfügbar werden. ▲ Immer kleinere Formfaktoren. ▲ Legacy-Standards bleiben weiterhin verfügbar und finden weiterhin ihre Anwendung sowohl auf Board-Formfaktoren als auch bei Interconnect-Systemen, um so die Systemkosten gering zu halten und eine schnelle Markteinführung sicherzustellen, obwohl auch neue serielle Hochgeschwindigkeits-I/O-Schnittstellen zunehmend implementiert werden, um eine höhere Leistung bei den Peripheriegeräten zu unterstützen. ▲ Die Feature-Sets diversifizieren sich zunehmend, aufgrund der raschen Verbreitung einzigartiger Anwendungen, die sehr spezifische Anforderungen stellen. ▲ Die umfassende Energie-Effizienz und Verwaltbarkeit wird wichtiger als einzig nur hohe Leistung oder geringer Stromverbrauch. Neue Prozessoren und Chipsätze steigern weiterhin die Leistung und senken den Energiebedarf. Und um Small-Form-Faktor Ansprüchen gerecht zu werden, werden CPU, Grafik und I/O-Funktionen sehr schnell in Zwei-Chip-(und sogar Single-Chip)-Lösungen integriert. Dies zwingt nun Board- und Systemlieferanten, neue standardisierte Methoden zu entwickeln, die den Entwurf von modularen und skalierbaren Systemen ermöglichen, die nur minimale Änderungen bei der vorhandenen Software und beim Chassis-Design erfordern. Und da sich alle diese CPUs, Plattformen und Interconnect-Schemata kontinuierlich weiterentwickeln, hat sich eine natürliche (und notwendige) symbiotische Beziehung zwischen den verschiedenen Akteuren auf dem Markt gebildet: Konsortien, Normungsgremien und andere Partnerschaften stellen dabei sicher, dass sowohl die daraus resultierenden Produkte als auch die Benutzer dieser Produkte den vollen Nutzen aus all diesem technologischen Fortschritt ziehen können. In den letzten Jahren waren Systemdesigner ziemlich geschickt darin, Desktop- und Mobil-PC-Lösungen "kraftschlüssig" in Embedded-Formfaktoren zu implementieren, die ein hohes Maß an Leistung erforderten. Am anderen Ende der Skala haben neue Low-Power-x86er-(und Nicht-x86er)-Lösungen zu einer ganzen Generation von neuen, innovativen Handheld- und Mobil-Geräten inspiriert. Aber trotz weiterer Verbesserungen bei Leistung und Energieeffizienz stehen Designer von kleinen Formfaktoren und tragbaren Systemen immer noch vor großen Herausforderungen, wenn sie in ihre ehrgeizigsten Plattformen State-of-the-Art-Lösungen integrieren wollen, die einen traditionellen Zuschnitt aus CPU- und Grafik-Prozessor bieten. Es tut sich folglich eine Lücke auf, da es bis jetzt keine Lösung gibt, die hohe Performance-pro-Watt Level bei hoher Integration und Packungsdichte bietet, um echtes High- AMD Embedded Solutions 3 AMD WHITE PAPER AMD Embedded R-Series Plattform End-Processing und Grafikleistung auf diskretem Niveau auf hoch mobilen Formfaktor-Designs im Handheld-Format zu bieten. Bis jetzt... Die neue AMD Embedded R-Series Plattform überbrückt die Lücke zwischen Hochleistungs-PC- Lösungen und energiesparenden Embedded-Lösungen, indem sie eine beispiellose Kombination aus Leistung, Energieeffizienz und Integration in den Embedded-Markt bringt. Entwickler können mit ihr Applikationen entwickeln, die auf mobilen und anderen kleinformatigen Geräten immersives Multimedia und visuell beeindruckende Erfahrungen bei gleichzeitiger Minimierung der Produkt-Lebenszyklus- Kosten bieten. Die AMD R-Series Plattform ist die nächste Generation der bewährten Accelerated Processing Units (APU) von AMD. Sie kombiniert die Leistung von AMDs CPU-Technologie mit einer AMD Radeon™ Grafikperformance der diskreten DirectX11-Klasse® in einem einzigen Device. In diesem Whitepaper erkunden wir AMDs neueste APU-Plattform und ihre Bedeutung für Small Form Factor (SFF) Embedded-Designs. Zudem bieten wir einen Überblick über einige der neuesten und beliebtesten Konnektoren und Board-Standards, die es System-Designern ermöglichen, eine höhere Performance und mehr Funktionen in kleinere Designs zu packen. 2. APUs: Große Performance in kleiner Verpackung Im vergangenen Jahrzehnt folgten die Fortschritte in der Halbleitertechnologie weiterhin dem Mooreschen Gesetz, das besagt, dass auf gegebener Silizium-Fläche in etwa alle zwei Jahre eine Verdoppelung der Transistoren erfolgt. Wegen dieser ständig steigenden Transistor-Kapazität haben sich Architekten von traditionellen x86er-CPUs darauf fokussiert, Leistungsverbesserung insbesondere durch Techniken wie die Erhöhung der Taktraten, die Erweiterung der Größe und Anzahl der On-Chip-Caches sowie das Hinzufügen weiterer Prozessorkerne zu erzielen. Als solche sind die Performance-Gewinne auch enorm und sie haben es ermöglicht, dass PCs beim Multitasking viel effizienter wurden; aber so schnell diese modernen PC-Prozessoren auch sind, sie alleine können immer noch nicht die Power für Bilder, Videos und digitale Signalverarbeitung liefern, die viele der aktuell aufkommenden, interaktiven Embedded- Multimedia-Anwendungen verlangen, und die eine geringe Leistungsaufnahme für Small- Form-Faktoren erfordern. Im Gegensatz zu herkömmlichen PC-Anwendungen, die in erster Linie auf skalaren Datenstrukturen und seriellen Algorithmen basieren, brauchen die aufkommenden neuen Embedded Anwendungen – wie die medizinische Bildgebung oder intelligente Kameras – Prozessoren, die riesige Datenmengen bewältigen können, die aus Hunderten, wenn nicht Tausenden von einzelnen Threads bestehen, die parallel manipuliert und bearbeitet werden müssen. Graphics Processing Units (GPUs), ursprünglich zur Verbesserung und Beschleunigung des Renderings von 3D-Bildern gedacht, haben sich zu leistungsfähigen, programmierbaren Vektor-Prozessoren entwickelt, die eine Vielzahl von Daten-intensiven Algorithmen und Anwendungen beschleunigen können – was gemeinhin als "Stream Processing" bezeichnet wird. GPUs, wie die der bekannten AMD Radeon™ Serie, können eine Fließkomma-Rechenleistung von mehreren Teraflops auf einer einzigen PCI Express™-Grafikkarte bieten, die als Erweiterungskarte in PCs implementiert wird. Mit jeder neuen Generation, angefangen von der AMD Radeon™ X1000 bis hin zur neuesten Radeon HD 7000-Serie, wurden Features hinzugefügt und Limitierungen beseitigt: Von der Vertex-Verarbeitung von Stream- Operationen über die flexible Verzweigung und Array-Manipulation bis hin zu Append-Buffern und AMD Embedded Solutions 4 AMD WHITE PAPER AMD Embedded R-Series Plattform atomaren Operationen. Heute haben Dutzende der in AMD Radeon GPUs verfügbaren Prozessorkerne sogenannte Deep Pipelines und sind zueinander nahezu identisch, sodass sie hochgradig skalierbar sind und eine hervorragende Plattform für GPGPU-Berechnungen (General-Purpose GPU) von hochgradig parallelen Workloads darstellen. Im Gegensatz zu den konventionellen, sequenziell verarbeitenden CPUs, die nur eine bescheidene Parallelität in Form von Multi-Threading und mehreren Kerne bieten, sind moderne GPUs für massives paralleles Computing optimiert – egal ob für Grafik oder andere Aufgaben. Kleinere Die-Geometrien und Innovationen im Bereich des Silizium-Designs ermöglichten es AMD, die erste Familie zu erschaffen, die CPU + GPU-Lösungen auf einem Chip-Die integriert. Mit Hunderten von Rechenkernen können diese heterogenen Multi-Core Prozessoren oder APUs dazu beitragen die Größe und den Verbrauch von eingebetteten Systemen signifikant zu reduzieren und gleichzeitig die Leistung zu steigern. Moderne GPUs sind zudem viel besser skalierbar, als die Handvoll Kerne eines CPU-zentrierten Ansatzes, und können eine um Größenordnungen höhere Leistungssteigerung für Embedded-Anwendungen im Small Form Factor Design bieten. Anwendungen findet man unter anderem in der medizinische