Car-tech

Cloudera Preps Hadoop für das Unternehmen

Making Self-Service BI a Reality with Cloudera's Analytic Database

Making Self-Service BI a Reality with Cloudera's Analytic Database
Anonim

Cloudera hat eine neue Reihe von Hadoop-Verwaltungstools mit dem Namen Cloudera Enterprise vorgestellt, die das Unternehmen gegen eine jährliche Abonnementgebühr anbieten wird, teilte es am Dienstag mit. Darüber hinaus hat das Unternehmen sein Open-Source-Distributionspaket von Hadoop aktualisiert.

Sowohl die neuen Versionen als auch einige neue Partnerschaften mit Anbietern von Datenmanagement-Softwareherstellern zeigen, dass sich das Unternehmen bereit erklärt, die aufkommende Datenbanktechnologie anzubieten von Webgiganten wie Google und Yahoo - zum Enterprise-Markt als Alternative zu relationalen Datenbanken.

"Wir setzen nicht nur auf die großen Web-Unternehmen, sondern auch auf Banken, Krankenhäuser und Versicherungen, die komplex und strukturiert analysieren müssen Daten zusammen, und Hadoop wurde dafür gemacht ", sagte Cloudera CEO Mike Olson. "Hadoop löst ein neues Problem auf neue Weise."

Hadoop gehört zu einer wachsenden Anzahl von Nicht-SQL- oder NoSQL-Datenbanken und basiert auf Google MapReduce, einem Framework zur parallelen Verarbeitung von Daten über eine große Anzahl von Computern Knoten. Hadoop, das jetzt von der Apache Software Foundation als Open-Source-Projekt entwickelt wird, bietet eine Alternative zu herkömmlichen relationalen Datenbanken, zumindest für die Fälle, in denen große, sich schnell ändernde Datensätze analysiert werden.

Es kann sowohl mit SQL als auch mit nicht arbeiten -SQL-Daten und ist widerstandsfähiger gegen Serverausfall als relationale Datenbanken, sagte Olson.

Cloudera verpackt Hadoop für mittelständische Unternehmen, sowohl mit seiner Hadoop-Distribution als auch mit seinen neu veröffentlichten Management-Tools. Beide Pakete sollten Organisationen ohne große technische Erfahrung in Hadoop ermöglichen, die Software zu betreiben, sagte Olson. "Es gibt diesen Mythos, dass Hadoop verwendbar ist, wenn Sie Google-skalierte Daten haben. Es gibt viele Benutzer, die nur ein paar Terabyte an Daten haben, die sie analysieren möchten", sagte Olson.

Clouderas Distribution for Hadoop (CDH) ist ein Open-Source-Paket mit vorintegrierten Softwareprogrammen, die auf dem Hadoop Common, früher Hadoop Core, basieren. Das Paket enthält: Hive, der eine Data-Warehouse-Infrastruktur bereitstellt; HBase, die Datenbank, die Hadoop zugrunde liegt; Pig, ein Compiler für Map-Reduction-Programme; Zookeper, eine Planung für die Ausführung von Anwendungen auf mehreren Servern und MapReduce.

In der neu veröffentlichten Version 3 enthält das Paket drei Programme, die das Unternehmen als Open-Source-Projekte unter der Open-Source-Lizenz Apache V2 freigegeben hat. Einer ist Flume, der beim Laden von Daten in Hadoop helfen kann. Ein weiterer Neuzugang ist Oozie, eine Workflow-Management-Software. Der letzte ist der Hadoop User Environment (HUE) -Code, der eine Benutzerschnittstelle für die Verwaltung von Hadoop bereitstellt.

"HUE ermöglicht es jedem, Anwendungen für Analysten zu erstellen. Er weiß, wie man mit den Hadoop-Clustern kommuniziert", sagte Olson.

Das Cloudera Enterprise-Paket erweitert die CDH-Version 3 um zusätzliche Verwaltungstools. Diese neue Software, die nicht Open Source ist, ermöglicht es Administratoren, die Zugriffsverwaltung durch Verwendung des Lightweight Directory Access Protocol zu steuern. Programme werden auch zur Bereitstellung von Ressourcen zur Verfügung gestellt, um Konfiguration und Leistungsüberwachung zu tun.

Olson würde nicht diskutieren, wie viel Cloudera bisher aus Abonnement- und Beratungsgebühren gemacht hat, stellt jedoch fest, dass das Unternehmen im ersten Quartal 2010 so viel wie was es durch Hälfte von 2009 verdient hat. Unter verschiedenen Industrien haben Finanzdienstleistungen, Telekommunikation, Einzelverkauf, Regierung und Web-Handelsfirmen ein Interesse an der Technologie gezeigt, Olson sagte.

"Die Sachen, die Firmen mit Hadoop tun, variieren Im Allgemeinen fangen diese Leute viele Daten von vielen Orten auf und müssen sie ausgefeilten Analysen unterziehen ", sagte Olson. "Finanzdienstleister sind daran interessiert, Hadoop für die Betrugserkennung zu nutzen. In der Telekommunikation besteht ein echter Bedarf, Netzwerke zu optimieren und die Abwanderung von Kunden zu reduzieren."

Zusätzlich zu diesen Paketen hat Cloudera Hadoop von Anbietern von Business Intelligence (BI) und Datenmanagement-Software unterstützt.

Olson plant, während seiner Keynote auf dem Hadoop Summit 2010 in Santa Clara bekannt zu geben, Am Dienstag wird der BI-Anbieter MicroStrategy den Einsatz von Hadoop unterstützen.

Ein weiterer neuer Partner ist Talend, ein Anbieter von Open-Source-Datenintegrationssoftware. Das Unternehmen hat seine Talend Integration Suite um eine Schnittstelle zu Hadoop-Datenbanken erweitert. Mit dieser Suite können Administratoren mehrere Datenquellen von einer einzigen Konsole aus verwalten und zusammenfassen. Mit Hadoop kann die Software "nativ Daten einfügen oder abrufen und die Daten innerhalb der Hadoop-Architektur verarbeiten", sagte Talves Vizepräsident für Marketing, Yves de Montcheuil.

Microstrategy und Talend schließen sich einer wachsenden Anzahl von Unternehmen an, die Open Source bereitstellen oder kommerzielle Verwaltungstools für Hadoop. Letzte Woche haben Cloudera und Quest ein Projekt gestartet, um Software zu entwickeln, die Hadoop mit Oracle-Datenbanken verbinden kann. Im Mai gab das Open-Source-Business-Intelligence-Unternehmen Pentaho bekannt, dass seine BI-Suite mit Hadoop-Datenbanken arbeiten werde.

In einem separaten Interview mit IDG News Service wies Yahoo CTO Raymie Stata darauf hin, dass Hadoop den Bedarf an Supercomputern reduzieren könnte um große Datenmengen zu analysieren. Traditionell wurden große Datensätze aus dem Speicher in den Supercomputer verschoben, der eine gepoolte Gruppe von Servern darstellt, die analysiert werden sollen. Im Gegensatz dazu verschiebt Hadoop die analytische Berechnung dahin, wo sich die Daten befinden, was die Notwendigkeit eines Cental-Giganten-Knirschens beseitigt. Yahoo war einer der führenden Beiträge zu Hadoop.

Zusätzlich zu Clouderas Angebot wird Hadoop auch von IBM kommerzialisiert, das seit kurzem eine Reihe von Analysediensten anbietet, die diese Technologie nutzen.

Joab Jackson deckt Software und allgemeine Software ab Technologie Aktuelle Nachrichten für Der IDG News Service. Folge Joab auf Twitter unter @Joab_Jackson. Joabs E-Mail-Adresse ist [email protected]