Komponenten

Aster Data Updates 'Frontline' Analytic Database

TE0-141 – Teradata Exam 14 Test Basics Questions

TE0-141 – Teradata Exam 14 Test Basics Questions
Anonim

Startup Aster Data Systems veröffentlichte am Dienstag die Version 3.0 seiner analytischen nCluster-Datenbank und umrahmte sie als ideal für das "Data Warehousing".

"Wir betrachten Data Warehousing traditionell als Back-Office-Aufgabe", schrieb Aster CEO Mayank Bawa in einem Blog Post Dienstag. "Das Data Warehouse kann in separate Ladefenster geladen werden, Ladevorgänge können spät ausgeführt werden (der Nettoeffekt ist, dass Geschäftsbenutzer ihre Berichte verspätet erhalten), Lasten, Backups und Scale-Up können Data Warehouses offline schalten - was seither in Ordnung ist Diese Aufgaben können außerhalb der Geschäftszeiten (Nächte / Wochenenden) erledigt werden. "

Aber die Kunden von Aster, zu denen auch aCerno, ein Internet-Werbenetzwerk, gehört, nutzen Datenanalysen für ihre Einnahmen", sagte Bawa.

Aster's nCluster 3.0 verteilt Workloads auf mehrere Server und macht es einfach, zusätzliche Maschinen für mehr Leistung hinzuzufügen. Die Software teilt auch die verschiedenen Komponenten einer Datenanalyse-Arbeitslast in einzelne Teile auf.

Eine "Lade" -Stufe beschäftigt sich mit dem Laden und Exportieren von Daten in und aus externen Quellen; Ein "Worker" -Layer speichert Daten auf lokal angeschlossenen Festplatten zur Abfrage; und eine Schicht von "Queen" -Knoten führt eine intelligente Abfrageplanung und -verarbeitung durch.

Inzwischen arbeiten Benutzer mit dem Cluster, als ob es eine einzelne Entität wäre.

Die Möglichkeit, Segmente des Clusters selektiv zu skalieren, bedeutet, dass Benutzer Ressourcen hinzufügen können In den Bereichen, in denen sie am meisten benötigt werden, sagt Aster.

Zu ​​diesen Kernfunktionen fügt die Version 3.0 eine Reihe von Funktionen für die "Immer-An" -Benutzung hinzu, einschließlich der Fähigkeit, Kapazität hinzuzufügen, Daten neu auszugleichen und Daten wiederherzustellen System ist live.

Aster arbeitete auch, um die Parallelisierung im ganzen System hinzuzufügen, nach einem offiziellen Unternehmen.

"Wir wollen Systeme bauen, die 10x, 100x mehr Daten verarbeiten können als jedes andere System heute. Aber das ist es auch viele Daten für jeden einzelnen Commodity-Server ", sagte CTO Tasso Argyros in einem Blogbeitrag. "Wir haben also viel F & E-Aufwand in die Parallelisierung jeder einzelnen Funktion des Systems gesteckt - nicht nur beim Abfragen, sondern auch beim Laden, Datenexport, Backup und Upgrades. Außerdem erlauben wir unseren Benutzern zu wählen, wie viel sie alle parallelisieren wollen Diese Funktionen, ohne dass das gesamte System vergrößert werden muss. "

Das Release enthält auch Unterstützung für MapReduce, eine ursprünglich von Google entwickelte Programmiertechnik, die es Entwicklern erleichtert, Programme zum Analysieren großer Datenmengen zu schreiben. Aster's Konkurrent Greenplum hat kürzlich auch die MapReduce-Unterstützung angekündigt.

Zusätzliche Funktionen umfassen die Möglichkeit, Datenkompressionsstufen für einzelne Tabellen auszuwählen, ein "Ein-Klick" -Erweiterungs-Tool; und bessere Sicherheitsfunktionen wie LDAP (Lightweight Directory Access Protocol) für die Authentifizierung und die Möglichkeit, Benutzerrechte auf Cluster-, Datenbank- und Tabellenebene zu verwalten.

Viele der anfänglichen Kunden von Aster, zu denen auch MySpace gehört, sind Web-fokussiert, sagte Curt Monash, Präsident von Monash Research.

"Ein großer Teil des Wachstums und der Möglichkeiten im Data Warehousing liegt im Umgang mit relativ neuen Arten von Daten", sagte er. "Es gibt große Data Warehouses, die sich mit traditionellen OLTP-Transaktionsdaten befassen, aber Aster ist nicht notwendigerweise ein führender Konkurrent bei der Analyse. Der beste Punkt bei der Analyse großer Datenmengen sind derzeit Webdaten und damit verbundene Netzwerkereignisse."

Monash zitiert Parallelverarbeitung Verwaltung und Unterstützung für MapReduce als Aster's Hauptstärken: "Aster ist ein Startup mit einem relativ unreifen Produkt, aber sie haben viel darüber nachgedacht, wie man die parallele Verarbeitung einfach verwalten kann."

NCluster 3.0 läuft auf Standard-x86-Servern. Die Preisgestaltung basiert auf der Menge der verwalteten Daten. Das Unternehmen sagte zuvor, dass die Kosten bei 100.000 US-Dollar beginnen.