Websites

Crunching Daten auf der Billig

Data-Warehousing-Software-Systeme sind teuer, aber viele Unternehmen waren dennoch bereit, tief zu graben und darauf zu wetten, dass Analysen neue Einsichten in ihr Geschäft und einen Wettbewerbsvorteil liefern.

In einem Anfang dieses Jahres veröffentlichten Bericht sagte das Marktforschungsinstitut IDC den Markt für Data-Warehousing-Plattformen voraus wird von rund 7,9 Milliarden US-Dollar im Jahr 2009 auf rund 10,8 Milliarden US-Dollar im Jahr 2013 anwachsen.

Die gute Nachricht für IT-Unternehmen, die mit Analysen beginnen wollen, aber nicht über das Budget verfügen, ist die jüngste Entwicklung von freier Software Optionen, die ziemlich ernsthafte Daten-knirschende Feuerkraft verpacken.

Im Oktober kündigte Greenplum eine Single Node Edition seiner MPP (Massively Parallel Processing) -Datenbank an. MPP-Architekturen teilen Daten-Workloads in mehrere Teile auf, die unabhängig voneinander auf einem Array von Servern verwaltet werden.

Die Single-Node-Version kann im Produktionsmodus auf einem x86-Server mit bis zu zwei CPU-Sockets und unbegrenzten Kernen verwendet werden. Es kann auch in einer einzelnen virtuellen Maschine mit bis zu acht virtuellen Kernen bereitgestellt werden. Es gibt keine Speicherkapazität. Single Node Edition kann auch in eine breitere Greenplum-Implementierung eingebunden werden.

Ebenfalls im Oktober hat Calpont die InfiniDB Community Edition veröffentlicht, eine quellorientierte Open-Source-Datenbank. Die columnare Methode kann in vielen Fällen die E / A-Nachfrage der Festplatte im Vergleich zu Systemen, die Daten in Zeilen speichern, erheblich reduzieren und auch eine höhere Komprimierung erreichen, sagte Curt Monash von Monash Research.

InfiniDB Community Edition ist ebenfalls auf einen beschränkt Single Server, hat aber keine Obergrenze für CPU-Anzahl, Anzahl der Kerne, Arbeitsspeicher, Datenvolumen oder gleichzeitige Benutzer.

Calpont hat auch eine kommerzielle Version von InfiniDB, die jetzt in der Early-Adopter-Phase ist und Benutzern die Skalierung des Systems ermöglicht zu mehreren Servern.

Die InfiniDB Community Edition folgt der Veröffentlichung einer anderen quelloffenen Open-Source-Data-Warehousing-Plattform von Infobright im letzten Jahr. Letzteres mag im Hinblick auf die Unterstützung der Community vor InfiniDB im Moment einen Vorteil haben; Infobright sagte kürzlich, dass die Software mehr als 15.000 Mal heruntergeladen wurde.

Letztendlich haben diese kostenlosen Data-Warehousing-Optionen ihre Grenzen und wahrscheinlichen Anwendungsszenarien, so Monash.

"Wenn Sie einen einzelnen Analysten oder einen kleinen Analyst haben Ein Team von Analysten, die frühzeitige explorative Abfragen gegen einige Terabyte Daten oder weniger durchführen, dann werden diese Produkte wahrscheinlich die Aufgabe erfüllen ", sagte er.

Unternehmen haben möglicherweise auch nicht das Budget, um etwas anderes zu beschaffen oder können keine Finanzierung bekommen Ohne einen ersten Machbarkeitsnachweis zu führen, fügte Monash hinzu.

"Es gibt sicherlich Arbeitslasten, für die sie nicht ausreichen, und Sie müssen Geld für ein Produkt bezahlen, das die Arbeit für Sie erledigt", sagte er. "Wenn Sie jedoch mehr Wert auf Ihre Daten legen möchten, könnten diese kostenlosen Produkte ein guter Ausgangspunkt sein."