Auch DB2 setzt auf In-Memory-Verarbeitung

Mitte des Jahres will IBM Version 10.5 seiner relationalen Datenbank DB2 veröffentlichen, die In-Memory-Verarbeitung und spaltenorientierte Speicherung erlaubt. Das Unternehmen spricht von einem enormen Geschwindigkeitszuwachs.

In Pocket speichern vorlesen Druckansicht 60 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Christian Kirsch

DB2 Version 10.5, die spätestens Mitte des Jahres vorliegen soll, wird mit BLU (Blink Ultimate) eine neue Storage Engine enthalten. Sie legt Daten spaltenorientiert im Hauptspeicher ab und soll dadurch wesentlich schneller sein als die bisherigen DB2-Versionen. IBM spricht von einer Geschwindigkeitssteigerung bei analytischen Abfragen um das 8- bis 25-fache. Diese Zahlen gehen auf einen hausinternen Benchmark zurück, am allgemein zugänglichen TPC-H hat sich IBM seit 2007 nicht mehr beteiligt.

Auch beim Speicherverbrauch will IBM drastische Einsparungen erreicht haben: Bei Testkunden soll er gegenüber der Vorversion auf bis zu ein Zehntel geschrumpft sein. Die dabei verwendete Kompression trägt auch zum Tempozuwachs bei: Die Datenmenge wird per Huffman-Algorithmus reduziert, ohne die Sortierreihenfolge zu verändern. Dadurch liefern Vergleiche für komprimierte Daten dasselbe Ergebnis wie für die unkomprimierten. Für die einzelnen Speicherseiten gespeicherte Metadaten, etwa das Minimum und Maximum der jeweiligen Spaltenwerte, soll unnötiges Lesen von Seiten vermeiden und weiteres Tempo bringen. Die letztlich für die jeweilige Abfrage relevanten Spaltenwerte verarbeiten die CPU-Cores parallel.

Laut IBM erfordere BLU, das an alle DB2-Kunden mit dem Upgrade auf 10.5 ausgeliefert werden soll, keine Änderungen an Clients und Datenbankschemata. Es sei lediglich nötig, die benötigten Tabellen einmalig in das spaltenorientierte Format zu konvertieren. Indizes und handoptimierte SQL-Abfragen wären bei den BLU-Tabellen überflüssig. BLU, an dem auch die deutsche IBM-Niederlassung mitwirkte, geht auf das Projekt Blink (PDF-Dokument) zurück. Daran arbeitete das IBM-Forschungszentrum in Almaden seit 2007.

Die nicht nur von IBM eingesetzte In-Memory-Technik und die spaltenweise Speicherung könnten die klassischen Data Warehouses unter Druck setzen: Wenn sich OLAP- und OLTP-Abfragen mit derselben Hard- und Software ausführen lassen, sind dedizierte DWH-Systeme nicht mehr nötig. (ck)