Spark: Erweiterungen und Tools für das Datenverarbeitungsframework

Um Spark hat sich im Laufe der Zeit ein umfangreiches Ökosystem an Extensions entwickelt. Sie machen das Datenverarbeitungsframework vielseitig einsetzbar.

Artikel verschenken

20.11.2018, 08:53 Uhr

Lesezeit: 13 Min.

iX Magazin

Von

Ramon Wartala

Spark: Erweiterungen und Tools für das Datenverarbeitungsframework
- Spark mit Daten versorgen
- Datenströme kanalisieren und analysieren
- Modelle effektiv gegeneinander testen
- Automatisch protokollieren mit ModelDB
- Machine-Learning-Algorithmen in Spark
- Mehr Übersicht dank Tracking
- Spark optimal einstellen

Artikel in iX 8/2018 lesen

Das offene Apache Spark und sein kommerzieller Bruder DataBricks Runtime sind im Bereich (Big) Data Engineering, Datenanalyse und Machine Learning für viele Unternehmen die erste Wahl. Zu einem großen Teil liegt das an der Flexibilität, der Quelloffenheit und der damit einhergehenden Marktdurchdringung. Im Laufe der letzten Jahre erschienen etliche Erweiterungen für Spark, die es zu mehr machen als nur einem weiteren Framework für Cluster Computing. [Link auf https://www.heise.de/ix/artikel/2018/08/links/126.shtml]

Alle großen Anbieter von Hadoop-Distributionen wie Cloudera, Hortonworks oder MapR unterstützen Spark innerhalb ihrer Systeme. In der Cloud bekommt man Spark bei Microsoft in Form von Azure HDInsight, bei Google mit Cloud Dataproc, bei Amazon mit Elastic Map Reduce und bei IBM mit IBM Analyics for Apache Spark.

Auch klassische Großunternehmen wie SAP bieten Anwendungserweiterungen, die Daten in Spark verarbeiten. So lassen sich mit SAPs In-Memory-Engine Vora 2.0 Daten direkt in Spark Dataframes einlesen oder in Vora-Tabellen persistieren. Für die hauseigene Produktlinie HANA ist der Spark Controller 2.0 für die Anbindung zuständig. In-Memory Daten aus den SAP-HANA-Systemen lassen sich dabei problemlos in Spark übertragen, die entsprechende Konfiguration von Smart Data Access – HANAs virtuelle Zugriffsschicht – vorausgesetzt.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Smartes Klimagerät: Ecoflow Wave 2 im Test

Wenn man ein Balkonkraftwerk betreibt, ist ein Klimagerät kein Luxus mehr. Denn wenn es richtig heiß ist, steht auch genügend günstiger Solarstrom bereit.

Kurztests: Gaming-Grafikkarte, LAN-Adapter und Raspi-Gehäuse

Neben einer lüfterlosen Grafikkarte haben wir auch einen LAN-Adapter und ein Aluminiumgehäuse für den Raspberry Pi 5 getestet.

Fernsehen mit und ohne Kabel: So gucken Mieter weiter

Nach der Umstellung auf DVB-T2 vor gut fünf Jahren grätscht nun das Nebenkostenprivileg in den gewohnten TV-Empfang. Diese Alternativen gibt es.

DeutschlandCard, Miles & More, Payback: Welches Bonusprogramm sich lohnt

Bonusprogramme belohnen Ihren Einkauf mit Punkte und Meilen. Ob sich das Sammeln lohnt, hängt auch von den jeweiligen Partnern und den Abkürzungen im System ab.

Gefährdete Router: Verkehr mit dubiosen Internetdomains verhindern

Unbekannte haben einen dubiosen Server unter dem Domainnamen fritz.box betrieben. Wir zeigen, wie man unerwünschten Verkehr mit zweifelhaften Servern vermeidet.

Banknoten neben den Feldern eines Gasherds

Das deutsche Gasnetz: Was daraus werden soll und was Verbraucher wissen müssen

Erdgas steht vor dem Aus und das Gasnetz vor dem Umbau: In welche Richtung es sich entwickeln kann und was das für die Gaskunden bedeutet.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Smartes Klimagerät: Ecoflow Wave 2 im Test

Wenn man ein Balkonkraftwerk betreibt, ist ein Klimagerät kein Luxus mehr. Denn wenn es richtig heiß ist, steht auch genügend günstiger Solarstrom bereit.

Kurztests: Gaming-Grafikkarte, LAN-Adapter und Raspi-Gehäuse

Neben einer lüfterlosen Grafikkarte haben wir auch einen LAN-Adapter und ein Aluminiumgehäuse für den Raspberry Pi 5 getestet.

Fernsehen mit und ohne Kabel: So gucken Mieter weiter

Nach der Umstellung auf DVB-T2 vor gut fünf Jahren grätscht nun das Nebenkostenprivileg in den gewohnten TV-Empfang. Diese Alternativen gibt es.

DeutschlandCard, Miles & More, Payback: Welches Bonusprogramm sich lohnt

Bonusprogramme belohnen Ihren Einkauf mit Punkte und Meilen. Ob sich das Sammeln lohnt, hängt auch von den jeweiligen Partnern und den Abkürzungen im System ab.

Gefährdete Router: Verkehr mit dubiosen Internetdomains verhindern

Unbekannte haben einen dubiosen Server unter dem Domainnamen fritz.box betrieben. Wir zeigen, wie man unerwünschten Verkehr mit zweifelhaften Servern vermeidet.

Das deutsche Gasnetz: Was daraus werden soll und was Verbraucher wissen müssen

Erdgas steht vor dem Aus und das Gasnetz vor dem Umbau: In welche Richtung es sich entwickeln kann und was das für die Gaskunden bedeutet.

nach oben

Alle Angebote

Newsletter heise-Bot

${intro} ${title}

${intro} ${title}

Spark: Erweiterungen und Tools für das Datenverarbeitungsframework

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Smartes Klimagerät: Ecoflow Wave 2 im Test

Kurztests: Gaming-Grafikkarte, LAN-Adapter und Raspi-Gehäuse

Fernsehen mit und ohne Kabel: So gucken Mieter weiter

DeutschlandCard, Miles & More, Payback: Welches Bonusprogramm sich lohnt

Gefährdete Router: Verkehr mit dubiosen Internetdomains verhindern

Das deutsche Gasnetz: Was daraus werden soll und was Verbraucher wissen müssen

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Smartes Klimagerät: Ecoflow Wave 2 im Test

Kurztests: Gaming-Grafikkarte, LAN-Adapter und Raspi-Gehäuse

Fernsehen mit und ohne Kabel: So gucken Mieter weiter

DeutschlandCard, Miles & More, Payback: Welches Bonusprogramm sich lohnt

Gefährdete Router: Verkehr mit dubiosen Internetdomains verhindern

Das deutsche Gasnetz: Was daraus werden soll und was Verbraucher wissen müssen

Spiele

1 Jahr nur 1,90 € pro Woche

Das digitale Abo für IT und Technik.