MapR beschleunigt HBase-Anwendungen

Die neue M7-Distribution richtet sich an NoSQL-Datenbanken nutzende Unternehmen und verspricht über eine überarbeitete Architektur eine signifikante Beschleunigung von HBase-Anwendungen.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 2 Min.
Von
  • Alexander Neumann

MapR hat seine Hadoop-Distribution um eine weitere Konfektionierung erweitert, die sich explizit an NoSQL-Datenbanken nutzende Unternehmen richtet und über die bisherigen Distributionen vom MapR hinausgeht. Diese laufen mit den Bezeichnungen M3 und M5. Erstere stellt eine kostenlose Community-Version dar, während das kostenpflichtige M5 zusätzliche Funktionen wie Mirroring oder Unterstützung für Snapshots enthält, für die das Unternehmen auch Support bietet.

Die neue M7-Distribution geht noch einen Schritt weiter, indem es den auf Hadoop aufbauenden Kay-Value-Store Apache HBase signifikant beschleunigt. HBase kombiniert Speicherung und Echtzeit-Analysen mit Hadoops MapReduce-Verfahren. Doch laut MapR hat HBase bislang nicht sein wahres Potenzial erreicht, da immer wieder betriebliche Probleme wie ungleichmäßige Leistung, Datenverluste und komplexe administrative Abläufe auftreten, die auch durch die Einschränkungen eines nur einmal beschreibbaren Speichersystems – dem Hadoop File Ssystem (HDFS)– entstehen. Deswegen hat MapR in M7 die Architektur überarbeitet.

Mit M7 entfällt die Schichtenarchitektur von HBase. HBase-Anwendungen greifen so direkt auf Daten zu, mit nur einem Netzwerk-Hop. Es entfallen dadurch Verzögerungen infolge zusätzlicher Kommunikationsschichten. Die M7-Architektur integriert Dateien und Tabellen in eine einzelne Datenspeicherung. Das soll eine einfache Verwaltung und Entwicklung, Zuverlässigkeit und eine bessere Leistung und Skalierung für HBase-Anwendungen ermöglichen.

Beta-Status hat darüber hinaus die Integration der auf den Apache-Techniken Lucene und Solr basierenden kommerziellen Suchplattform von LucidWorks. Anwender können dadurch auf dem Hadoop File System oder auf anderen Dateisystemen abgelegte Daten durchforsten. LucidWorks Search vereinfacht das Installieren von Lucene oder Solr. Darüber hinaus unterstützt die Technik mehrere Datenquellen nativ und enthält eine grafische Benutzeroberfläche sowie ein Sicherheits-Framework. Die Suchoptionen will MapR will in allen dreien Distributionen anbieten. (ane)