SystemBuilderChallenge 2001 - SP-it
Transcription
SystemBuilderChallenge 2001 - SP-it
SystemBuilderChallenge 2001 Inhaltsverzeichnis Speicher - Wie funktioniert ein DRAM? - Spezifikationen - Begriffserklärung • Zykluszeit • Zugriffszeit • CAS Latency - Was ist DDR? - Was ist Rambus? - Schlusswort 1 SystemBuilderChallenge 2001 Produktportfolio 72 pin SIMM Alte PC-Generation, Industrie Applikationen 168 pin Unbuffered DIMM PC Standard (bis 133 MHz) 168 pin Registered DIMM Server Applikation 184 pin RAMBUS Neue Technologie (bis 800 MHz, serial) 184 pin DDR Neue Technologie (bis 266MHz, parallel) 144 pin SO-DIMM Notebook 2 SystemBuilderChallenge 2001 Wie funktioniert ein DRAM? Die einzelne Speicherzelle ist sehr einfach aufgebaut. Ein Kondensator speichert die Information (0 oder 1) einer Speicherzelle (Bit) Zellansteuerung durch einen Transistor Isoliert (speichert) Information Freischalten zum Ein- und Auslesen 3 SystemBuilderChallenge 2001 Wie funktioniert ein DRAM? Das Gate des Transistors ist mit einer Wortleitung verbunden. Ist die Wortleitung auf LOW ist der Transistor hochohmig (Schalter zu) Die Ladung des Kondensators ist isoliert und bleibt gespeichert. Ist die Wortleitung auf HIGH ist der Transistor niederohmig (Schalter auf) Der Kondensator ist mit der Bit-Leitung verbunden. Schreiben oder Lesen der Speicherzelle. Schreiben/Information speichern: Kondensator nimmt Pegel der Bitleitung an Lesen: Bitleitung nimmt Pegel des Kondensators an Zusätzliche Schaltungen sind notwendig für Ladungserhaltung, definierte Signale etc. 4 SystemBuilderChallenge 2001 Wie funktioniert ein DRAM? WL = Wortleitung (aktiviert) BL = Bitleitung (liest/schreibt) C = Kondensator Vereinfachtes Schaltbild 5 SystemBuilderChallenge 2001 Kernkomponenten eines SDRAM Entscheidend für die Qualität eines Speichermoduls - die Modulplatine (PCB) - verwendete SDRAM-ICs - Programmierung des SPD 6 SystemBuilderChallenge 2001 PC100 / 133 Spezifikationen PC100/133 konforme DIMMs Detaillierte, eindeutige Beschriftung Die Spezifikation für DIMMs basieren größtenteils auf den im Dezember 1996 vom JEDEC-Komitee verabschiedeten Standard Die folgende Auflistung fasst die wichtigsten Kernaussagen der PC100 / 133-Spezifikation von Intel und deren Bedeutung zusammen. 7 SystemBuilderChallenge 2001 PC100 / 133 Spezifikationen Leiterbahnbreite und Leiterbahnabstand Leiterbahnbreite: 0.15mm Min. Leiterbahnabstand: 0.25mm Taktsignalleitungen min. Leiterbahnabstand: 0.30mm Diese Werte verhindern ein Übersprechen zweier benachbarter Leitungen und helfen, die Impedanzen der Platine zu kontrollieren. 8 SystemBuilderChallenge 2001 PC100 / 133 Spezifikationen Anordnung und Anzahl der SDRAMs SDRAMs mit Gehäusen für die direkte Oberflächenmontage. Ein- oder beidseitige Platzierung der ICs auf der Platine. Platzierung unter Berücksichtigung der min. und max. Leiterbahnlängen. 9 SystemBuilderChallenge 2001 PC100 / 133 Spezifikationen Leiterplatten in 4- oder 6-Layer Technologie DIMM-Platine kann aus 4 oder 6 Leiterbahnebenen bestehen. Reihenfolge und Abstände zwischen den Ebenen sind festgelegt. Signalführung: 2 bzw. 4 Layer Spannungs - und Masseversorgung: 2 Layer Die 6-Layer-Technik sorgt bei hohen Taktfrequenzen für niedrige Rauschpegel und eine erhöhte Datenintegrität. 10 SystemBuilderChallenge 2001 Taktleitungen DIMM-Module können entweder 2 oder 4 Takteingänge (Clock) nutzen. Multiple Takteingänge erlauben bessere Synchronisierung der Signallaufzeiten zu SDRAM-ICs. Bessere Synchronisierung der Flanken des Systemtakts an Chipsatz und Speicher. Mit nur einem Takteingang ist dies nicht zu gewährleisten. 4 Takteingänge sind besser als 2. 11 SystemBuilderChallenge 2001 Terminierung der Datenleitungen Terminierungen an den Taktleitungen verhindern Signalreflexionen. Starke Reflexionen können den Signalpegel verfälschen und Missinterpretationen hervorrufen. => Datenintegrität nicht mehr gewährleistet. Reflexionen steigen mit der Frequenz und sind gerade bei den 100- und 133-MHz-Modulen nicht zu vernachlässigen. Einige DIMM-Platinen älterer Generation oder Billig-DIMMs verzichten auf die Terminierung. 12 SystemBuilderChallenge 2001 SPD Spezifikationen Detaillierte SPD Spezifikationen SDRAM benötigt für den Betrieb eine Vielzahl kritischer Parameter. PC100/133-Module müssen laut Spezifikation ein SPD-EEPROM auf der Platine besitzen. Der kleine, meist achtpolige Chip hat eine Speicherkapazität von 2 kBit und speichert alle wichtigen Parameter und Organisationsangaben des DIMMs. Insgesamt sind es über 40 verschiedene Werte. 13 SystemBuilderChallenge 2001 SPD Spezifikationen Zu den wichtigsten SPD Spezifikationen zählen: Speichertyp Kapazität Zugriffszeit Zykluszeit Taktfrequenz CAS-Latency Beispielsweise ist der Speichertyp im Byte 2 des SPD gespeichert. Für welche Zykluszeit (Taktfrequenz) das Modul ausgelegt ist, kann dem Byte 9 entnommen werden. Der Wert 75h beispielsweise steht für 7,5 ns und kennzeichnet ein PC133-DIMM. 14 SystemBuilderChallenge 2001 SPD Spezifikationen BIOS liest die Parameter aus dem SPD des DIMMs aus. Der Chipsatz des Mainboards übernimmt die Daten und stellt Speicheransteuerung entsprechend ein. Im BIOS kann in der Regel zwischen Automatic oder einer manuellen Einstellung der Konfigurationsparameter ausgewählt werden. Die automatische Konfiguration ist vorzuziehen. Dann werden die Speichermodule nicht ausserhalb der Spezifikation betrieben. Ein instabiler Betrieb ist bei Überreizung der Parameter meist die Folge. 15 SystemBuilderChallenge 2001 SPD Spezifikationen Lt. Spezifikation muss das SPD schreibgeschützt sein, um ein versehentliches oder gewolltes Löschen/Ändern der gespeicherten Daten zu verhindern. Das Write-Protect-Signal des EEPROMs ist hierzu auf Pin 81 des DIMMs gelegt und gleichzeitig über einen 47k-Widerstand auf Masse gezogen. Damit will man findigen Naturen einen Riegel vorschieben, indem sie einfach die Daten des EEPROMs ändern und ein PC100- oder PC133Modul vorgaukeln. 16 S+P Roadshow PC100 / 133 Spezifikationen 17 S+P Roadshow PC100 / 133 Spezifikationen Gespeicherte Informationen im SPD-EEPROM. Auszug der Intel SPD Spezifikation Revision 1.2A 18 SystemBuilderChallenge 2001 Performance Bei DIMMs bestimmen hauptsächlich drei Parameter die Performance: - Zykluszeit - Zugriffszeit - CAS-Latency Dabei werden die Zugriffszeit und Zykluszeit oft in einen Topf geworfen und falsch interpretiert. In den Anzeigen von Versendern sowie in Schaufenster-Aushängen finden sich immer wieder verwirrende Angaben. 19 SystemBuilderChallenge 2001 Performance Die Performance eines SDRAMs hängt von den Parametern Zykluszeit, Zugriffszeit und CAS-Latency ab. 20 SystemBuilderChallenge 2001 Zykluszeit Zykluszeit ist 10 ns bei 100 MHz Die steigende Flanke des Systemtakts wiederholt sich also alle 10 ns. PC100-SDRAMs müssen innerhalb dieser Zeit im BURST-Zugriff (Byte/Wort lesen/schreiben) ihre Daten liefern können. Intel hat in seinen Spezifikationen eine Zykluszeit von 8 ns für 100-MHz SDRAMs vorgegeben. Der theoretische Grenzwert liegt damit bei einer Taktfrequenz von 125 MHz und ist als Sicherheitspuffer gedacht. SDRAMs mit einer Zykluszeit von 10 ns sind daher nicht PC100-konform und nur für den 66-MHz-Betrieb spezifiziert. Bei PC133-SDRAM müssen alle 7,5 ns ihre Daten im Burst-Zugriff liefern können. 21 SystemBuilderChallenge 2001 Zugriffszeit Zugriffszeit = Clock Access Time Zeit nach der steigenden Taktflanke bis zum gültig werden der Daten. Sie muss kleiner sein als die Zykluszeit des Taktsignals, sonst werden die Daten erst gültig, wenn schon der nächste Takt beginnt. Ein kontinuierlicher Datenstrom mit jedem Takt wäre nicht möglich. Die PC100-Spezifikation sieht eine Zugriffszeit von 6 ns vor. (Intel räumt allerdings auch eine Ausnahme ein: Sind nur zwei DIMM-Bänke belegt, können Module mit einer Zugriffszeit von 7 ns eingesetzt werden.) Die Zugriffszeit ist auch in der PC100-Beschriftung angegeben (PC100-322-620). Bei PC133-Modulen ist die Zugriffszeit auf 5,4 ns festgelegt. 22 SystemBuilderChallenge 2001 CAS Latency CAS Latency (CL) Zeitspanne in Anzahl Taktzyklen zwischen dem Anlegen der Spaltenadresse und den ersten gültigen Daten am Ausgang. 100 MHz SDRAM: CL2 oder CL 3. CL3 Speicher: Arbeitet mit einer Latency von 3 bei 100 MHz Arbeitet mit einer Latency von 2 bei 66 MHz CL2 Speicher: Arbeitet mit einer Latency von 2 bei 100 MHz Korrekte CL3 Beschriftung: PC100-322-620. 133 MHz SDRAM: CL2 oder CL 3. CL3 Speicher: Arbeitet mit einer Latency von 3 bei 133 MHz Arbeitet mit einer Latency von 2 bei 100 MHz CL2 Speicher: Arbeitet mit einer Latency von 2 bei 133 MHz Korrekte CL3 Beschriftung: PC133-333-0115. Korrekte CL2 Beschriftung: PC133-222-0115 Tests haben ergeben, dass z.B. Mosel Vitelic Module mit CL2 stabil laufen. 23 SystemBuilderChallenge 2001 Was ist DDR? Double Data Rate SDRAM: - basiert auf normalen SDRAM und nutzt intern vier unabhängige Bänke. - Datentransfer erfolgt bei beiden Flanken des Taktsignals => Dadurch sind Laufzeitverzögerungen sehr kritisch. 24 SystemBuilderChallenge 2001 Synchronisierung bei DDR Synchronisierung des Datentransfers - durch den normalen Systemtakt - bidirektionales Strobe-Signal DQS Das parallel zu den Daten laufende Signal dient dem Chipsatz und dem Speicher als Referenz für die Gültigkeit der Daten auf dem Bus. Durch das Strobe-Signal ist ein leichtes Abdriften des Bustaktes zwischen Chipsatz und Speicher unproblematisch. 25 SystemBuilderChallenge 2001 bidirektionales Strobe-Signal DQS - Exaktes Timing - Anschlüsse für DQS und Daten müssen die gleichen physikalischen Bedingungen wie Leiterbahnlänge und –kapazität, in sehr kleinen Toleranzen, haben. - Änderungen der Übertragungsparameter durch Temperatur- oder Spannungsschwankungen wirken sich somit auf DQS und die Daten gleichermassen aus. 26 SystemBuilderChallenge 2001 Double Impact Durch die Nutzung beider Taktflanken verdoppelt sich der Datendurchsatz - Beim Lesebefehl generiert und steuert das DDR-SDRAM das bidirektionale Strobe-Signal und zeigt dem Chipsatz mit der steigenden und fallenden Flanke die gültigen Daten an. - Beim Schreibvorgang generiert und steuert der Chipsatz das Strobe-Signal und zeigt damit dem Speicher die Gültigkeit der einzulesenden Daten mit beiden Flanken an. 27 SystemBuilderChallenge 2001 DDR Double Impact: Durch die Nutzung beider Taktflanken verdoppelt sich der Datendurchsatz bei DDR-SDRAM. 28 SystemBuilderChallenge 2001 DDR Spannungsversorgung / -verbrauch - 2,5V Versorgungsspannung für DDR-Speicher. PC266 Speicher benötigen einen zusätzlichen Spannungsregler => geringerer Leistungsverbrauch - 20 Prozent kleinere Kapazität der Speicherkondensatoren in den DRAM-Zellen benötigt. => geringerer Leistungsverbrauch Durch beide Massnahmen reduziert sich der Leistungsbedarf von PC266-Speicher im Idealfall auf die Hälfte von PC133-SDRAMs. Gerade für Notebooks ist DDR-SDRAM somit eine höchst interessante Speichertechnik, um die Akkulaufzeit zu erhöhen. 29 SystemBuilderChallenge 2001 DDR Energiesparer: Die niedrigere Betriebsspannung macht PC266-Speicher sehr genügsam. 30 SystemBuilderChallenge 2001 Geschichte des Rambus? Entwickelt wurde das Konzept für ein serielles Speicherinterface von der 1990 gegründeten Firma Rambus mit Sitz in Kalifornien. Erste funktionierende RDRAMs konnte Toshiba 1992 präsentieren. 1995 wird Rambus in Workstations von SGI verwendet, Ebenfalls eingesetzt in Nintendo-64-Videospielkonsolen und Grafikkarten von Cirrus Logic mit dem Grafikchip GD546X. Um die Technologie in die PC-Architektur zu adaptieren, schloss Intel im Dezember 1996 mit Rambus ein Abkommen. Im Zuge einer vereinfachten Namensgebung wird heute nur noch die Bezeichnung RDRAM oder RIMM verwendet. 31 SystemBuilderChallenge 2001 Was ist Rambus? Die gemeinsam entwickelten Direct RDRAMs (DRDRAM) nutzen wie DDR-SDRAM beide Taktflanken für die Datenübertragung. Die Rambus-Lösung besteht aus drei Komponenten - Rambus-Controller (memory interface) - Rambus-Channel (Drei byte breit) - RDRAM. Ein System kann aus mehreren unabhängigen Channels bestehen. Intels 840-Chipsatz für den Workstation- und Servereinsatz kann zwei Rambus-Channels ansteuern. 32 SystemBuilderChallenge 2001 Rambus - Channel Interface Das Channel Interface von Rambus Datenbusbreite: 16- oder 18-Bit- (bei Error Correction Code) Adressbusbreite: 8 Bit getrennte Leitungen für die Zeilenund Spaltenansteuerung. Gleichzeitige, unabhängige Zugriffe auf Zeilen und Spalten sind möglich, während noch Daten des vorhergehenden Befehls übertragen werden. Jedes einzelne RDRAM-IC besitzt die volle Datenbreite des Channels. 33 SystemBuilderChallenge 2001 Rambus - Channel Interface Gegenüber 64-Bit-Speicherbussen muss aber die Taktung des Channels entsprechend hoch sein, um konkurrenzfähige Bandbreiten zu erreichen. Die derzeit maximale Taktfrequenz ist 400 MHz Die Übertragungsrate wird durch wie bei DDR-RAM durch Ausnutzung beider Taktflanken mit effektiv 800 MHz umgesetzt. Ein Maximum von 1,6 GByte/s ist bei jedem einzelnen Chip und somit pro Channel erreichbar. Bei zwei Channels wie beim Intel 840 verdoppelt sich die maximale Bandbreite entsprechend auf 3,2 GByte/s. 34 SystemBuilderChallenge 2001 Rambus Die Rambus-Architektur kann mehrere unabhängige Rambus-Channels verwalten. 35 SystemBuilderChallenge 2001 Rambus Datentransfer Der interne Datentransfer eines RDRAMs zur Speichermatrix unterscheidet sich von der Datenbreite und Taktung des Channels erheblich: Intern wird ein 128-Bit-breiter Datenpfad (144 Bit mit ECC) mit einer Taktfrequenz von 100 MHz genutzt. Somit lassen sich alle 10 ns 128 Bit von und zur Speichermatrix transferieren - dies entspricht der Channel-Transferrate von 1,6 GByte/s. Eine interne RDRAM-Logik teilt die Daten in 16-Bit-Pakete auf, bevor sie über die I/O-Pins mit der Channel-Taktfrequenz von 800 MHz auf den Bus übertragen werden. 36 SystemBuilderChallenge 2001 Rambus Datentransfer Durch die volle Datenbreite der ICs verteilen sich die Daten bei Zugriffen nicht über alle Bausteine, sondern sind zusammenhängend in einem Chip gespeichert. Jeder Channel kann bis zu 32 RDRAM-Chips verwalten. Überlappende Transfers zwischen den Chips und dem Rambus-Controller heben die Effizienz für einen kontinuierlichen Datenstrom. Hinzu kommt die hohe Bankanzahl der einzelnen RDRAMs. Bis zu 16 Bänke pro IC können parallel Befehle abarbeiten und sorgen für hohe Effizienz bei starkem Datenverkehr auf dem Bus. Nachteil: Die Chips erhitzen sich bei Burst-Zugriffen stark, was zusätzliche Kühlmassnahmen erfordert. Rambus-Module sind deshalb mit einem zusätzlichen Kühlblech versehen, das für eine ausreichende Wärmeabfuhr sorgt. 37 SystemBuilderChallenge 2001 Rambus Datentransfer Ein Rambus-Channel besteht aus Controller, RDRAMs und der Terminierung am Ende. 38 SystemBuilderChallenge 2001 Rambus Datentransfer Topologie eines Rambus-Channels mit abgeschlossenem Bus. 39 SystemBuilderChallenge 2001 Datentransferrate Speichertyp Berechnung Max. ohne Latency Max. mit Latency PC800 RDRAM 800 MHz x 2Byte 1600 MB/s 1080 MB/s (1 Kanal) PC800 RDRAM 800 MHz x 2Byte 6400 MB/s 4320 MB/s (4 Kanäle) DDR SDRAM PC2100 266 MHz x 8byte 2128 MB/s 1350 MB/S PC133 SDRAM 133 MHz x 8 Bytes 1064 MB/s 800 MB/s PC100 SDRAM 100 MHz x 8 Bytes 800 MB/s 500 MB/s 40 SystemBuilderChallenge 2001 Latency der Speicherarten 41 SystemBuilderChallenge 2001 Latency der Speicherarten RDRAM PC800 DDR RAM-cl2,5 SDRAM PC133-cl2 SDRAM PC133-cl3 SDRAM PC100 Component Latency 38,75 37,50 30,00 45,00 40,00 Adress Delay 10,00 2 x 7,50 2 x 7,50 2 x 7,50 2 x 10,00 Data Delay 18,75 3 x 7,50 3 x 7,50 3 x 7,50 3 x 10,00 Latency 67,50 75,00 67,50 82,50 90,00 42 SystemBuilderChallenge 2001 Speicherarten im Vergleich Component Latency Zeitspanne in Anzahl Taktzyklen zwischen dem Anlegen der Spaltenadresse und dem ersten gültigen Datenbit am Ausgang RDRAM: Zykluszeit von 1.25 ns. Gesamtzeit zum Anlegen der Adresse und warten auf die Takt-Synchronisierung = 38.75 ns SDRAM: Zeit zum Anlegen der Adresse plus CAS Latency 3 x 7.5 (Adresse)+ 3 x 7.5 (CL3) = 45 ns 43 SystemBuilderChallenge 2001 Speicherarten im Vergleich Zusätzliche Latency SDRAM Sogenannte Bubbles: Nach dem Schreiben oder Lesen dauert es eine gewisse Zeit (Takte) bis die Speicherinformation wieder stabilisiert ist und zuverlässig manipuliert werden kann Dies ist kein Problem von RDRAM. 44 SystemBuilderChallenge 2001 RDRAM Energieverbrauch Stromaufnahme (Micron Studie) RDRAM PC800 @ 1.6 GB/s 4.6 W (beste Bandbreite per Watt) 1. Qrtl. DDR PC2100 @ 2.1 GB/s 9.1 W SDRAM PC133 @ 1.1 GB/s 11.6 W 0 5 PC133 10 PC2100 15 PC800 45 SystemBuilderChallenge 2001 RDRAM Energieverbrauch RDRAM kennt vier Einstellungen für Strom Active, Standby, NAP, Powerdown RDRAM benötigt nur einen Baustein zum Schreiben oder Lesen. Alle anderen Bausteine haben einen niedrigeren Stromverbrauch RDRAM schreibt ein ganzes Wort in einem Chip. Dadurch entsteht mehr lokale Hitze. Jeder RDRAM hat einen eigenen Temperatursensor. Der Metallkörper auf dem RDRAM dient vornehmlich um die Hitze einzelner Baugruppen besser zu verteilen, zum mechanischen Schutz und zur Abschirmung. 46 SystemBuilderChallenge 2001 Speicherarten im Vergleich Benchmarks (Lies, Damned Lies, and Benchmarks) Für Applikationen großem Speicherbedarf und Speichertransaktionen, z.B. CAD, Audio/Video-Editing, etc. gelten in etwa folgende Performancevorteile Von PC133 nach DDR266: < 5% Von PC133 nach RDRAM: etwa 40% bei bestimmten Funktionen, z.B. Rendering 47 SystemBuilderChallenge 2001 Speicherarten im Vergleich Probleme DDR-SDRAM Im Prinzip ein übertakteter Standard-DIMM Im Gegensatz zu RDRAM keine zusätzlichen elektrischen Verbesserungen für höhere Signalstablilität Grosse Toleranzen zwischen den einzelnen Herstellern Evtl. Heruntertakten auf CL3 oder CL4 durch Chipset zur Erlangung von „Betriebsstabilität“ Nicht notwendigerweise weit genug heruntergetakt für stabilen Langzeitbetrieb 48 SystemBuilderChallenge 2001 Siemens Memory Products Weitere WEB-Adressen zum Thema RAM www.rambus.com www.rimm.com www.intel.com www.chipanalyst.com/q/tech_lib/dram/dram_toc2.html www.infineon.com/products/ics/31/31.htm www.hardwarecentral.com/hardwarecentral/reviews/2445/1/ www.hardwarecentral.com/hardwarecentral/reports/1686/1/ www.hardwarecentral.com/hardwarecentral/reviews/1787/1/ www.hardwareanalysis.com 49