SQL-Dialekt und Vorhersagen für Google Storage

Zwei neue APIs sollen in der Cloud gespeicherte Daten besser auswerten können.

In Pocket speichern vorlesen Druckansicht 21 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Christian Kirsch

Mit seinem Storage-Dienst bietet Google eine Cloud-Datenbank für unstrukturierte Daten, deren Fähigkeiten sich bislang auf die Abfrage kompletter Objekte beschränken. Auf seiner I/O-Konferenz kündigte Google nun zwei weitere Schnittstellen an, die Vorhersagen und SQL-ähnliche Abfragen erlauben.

Die BigQuery genannte API besteht aus einem SELECT-Statement mit den aus SQL bekannten Teilen FROM, WHERE, GROUP BY und ORDER BY. Das fehlende HAVING können Subqueries ersetzen. Getreu den Paradigmen der NoSQL-Anhänger gibt es kein JOIN zum Verbinden zweier Tabellen.

Spezifisch für BigQuery ist das Schlüsselwort WITHIN zum Aggregieren in verschachtelten Datenstrukturen. Das Beispiel für seine Verwendung legt nahe, dass Tabellen aus JSON-ähnlichen Strukturen bestehen. Klare Aussagen dazu gibt es aber nicht: Die FAQ verweist zu dem Thema lediglich auf die Google-Ingenieure, die beim Importieren eigener Daten helfen sollen. Bislang gibt es nur einige Testdatensammlungen für das Experimentieren mit BigQuery.

Deutlich beschrieben sind die Anforderungen hingegen bei der Prediction-API. Nach einer Lernphase soll sie aus einem übermittelten Datensatz einen Wert vorhersagen. Als ein Beispiel führt die Entwicklerdokumentation empirische Daten über den Zusammenhang zwischen dem Kauf von Wein und anderen Lebensmitteln an; ein weiteres ermittelt aus einem Textfragment dessen Sprache. Als Eingabe für das Training verarbeitet die Prediction-API lediglich CSV-Dateien, deren erstes Feld jeweils das Ergebnis als Text enthält. Die folgenden Felder können Zahlen oder Texte sein. Wird die Schnittstelle nach abgeschlossenem Training mit einer solchen Kombination gefüttert, liefert sie den dazu am besten passenden Textwert zurück.

Beide Schnittstellen verwenden REST und sind bislang nicht öffentlich zugänglich. Interessenten können sich online registrieren. (ck)