Hortonworks kündigt HDP 3.0 an

Die Hortonworks Data Platform 3.0 ermöglicht die Containerisierung von Big-Data-Anwendungen und Deep Learning Workloads.

In Pocket speichern vorlesen Druckansicht
Hortonworks kündigt HDP 3.0 und erweiterte Partnerschaften mit Google, Microsoft und IBM an
Lesezeit: 2 Min.
Von
  • Alexander Neumann

Der Big-Data-Experte Hortonworks ermöglicht in der für das nächste Quartal angekündigten Version 3.0 seiner Hortonworks Data Platform (HDP) die Containerisierung von Anwendungen. Die Ankündigung erfolgte auf dem DataWorks Summit US in San Jose, wo außerdem die Ausweitung der Cloud-Partnerschaften mit Microsoft, Google und IBM bekannt gegeben wurde.

Hortonworks Data Platform 3.0 basiert auf der Version 3.1 des Big-Data-Frameworks Apache Hadoop, die im April veröffentlicht wurde. Das Highlight unter den HDP-Neuerungen ist die Containerisierung, die Kunden die Möglichkeit geben soll, Container für den Einsatz neuer Analysen zu nutzen und Apps schnell zu starten, um Zeit und Ressourcen zu sparen. Es werden darüber hinaus auch Deep-Learning-Anwendungen mit TensorFlow (Technical-Preview-Status) unterstützt, die auf umfangreiche und teure GPU-Ressourcen angewiesen sind.

In der neuen Version hat das Data-Warehouse-Tool Apache Hive, das eine SQL-ähnliche Schnittstelle für die Abfrage von in Hadoop gespeicherten Daten bietet, offenbar endlich den gewünschten Reifegrad erreicht. In früheren Releases wurde viel darüber gesprochen, die Erfahrung mit Hive zu verbessern, sei es bei der Gesamtleistung, der ACID-Compliance oder der Indizierung. Nun ist Hive wohl zu einer wirklich integrierten Datenbank geworden, die alle je erwünschten Dinge mitbringe.

Weitere von Hortonworks genannte Features der Version 3 sind die Skalierbarkeit und Verfügbarkeit mit NameNode-Federation, mit der Kunden auf Tausende von Knoten und eine Milliarde Dateien skalieren können sollen. Die höhere Verfügbarkeit mit mehreren Name Nodes und Standby-Funktionen ermöglicht offenbar ununterbrochene Cluster-Operationen, wenn ein Name Node ausfallen sollte. Schließlich ist von einer Verbesserung der Integration mit Apache Spark die Rede.

Der Hadoop-Spezialist hat zudem den Ausbau dreier Cloud-Angebote angekündigt, darunter eine tiefer gehende Integration mit Google Cloud Storage und ein neues Angebot von IBM Hosted Analytics mit Hortonworks, ein integriertes Angebot bestehend aus HDP, IBM DB2 Big SQL und IBM Data Science Experience IBM Cloud. Mehr zur Partnerschaft mit IBM finden Leser in einem Blog-Beitrag von IBM. Der dritte ist die Erweiterung der sechsjährigen Partnerschaft mit Microsoft, die es Kunden ermöglichen soll, die Hortonworks-Produkte Data Platform, DataFlow und DataPlane nativ auf Microsofts Azure IaaS zu implementieren. (ane)