? Apache Spark-basierte ClearStory Rampen bis seine Analytik-Software

Mit einem neuen Analytics-Cloud-Dienst, der Anfang dieses Monats vorgestellt wurde, erklärt CEO Sharmila Mulligan, wie ClearStorys Engine Dateninspektionen an normale Benutzer verschiebt.

Silicon Valley-Startup ClearStory Data sagt, dass die neue Version ihrer Apache Spark-basierten Analysesoftware deutlich komplexe Analysen auf der Basis mehrerer Quellen beschleunigt.

Das Unternehmen mit Sitz in Menlo Park, Kalifornien, zitiert auch eine Verringerung der Zeit, die benötigt wird, um Daten für die Analyse vorzubereiten, und einen einfacheren Ansatz zum Mischen von Daten auf der Flucht. Das neue Release bietet die Integration von Spark 1.2 in-Memory-Technologie in seine Datenverarbeitungs-Engine.

ClearStory, das von Andreessen Horowitz, DAG Ventures, Google Ventures, Khosla Ventures und Kleiner Perkins Caufield & Byers finanziert wurde, hat die Benutzeroberfläche mit einem neuen geführten Modell verbessert.

Der Mitbegründer des Unternehmens und Chefarchitekt Vaibhav Nivargi sagte in einer Erklärung, dass seine Software jetzt die Benutzer die Kontrollen und die Sichtbarkeit, wie disparate Datasets sollte harmonisiert werden, wodurch die Zeit und die Komplexität bei der Vorbereitung von Daten für die Analyse.

“Diese Version schlägt eine neue Balance zwischen der Macht, die intelligente Datenharmonisierung bringt, um Geschäftsnutzer und die Präzision und Kontrolle, dass mehr Daten-versierte Anwender in der Regel bevorzugen”, sagte er.

“Diese neuen Fähigkeiten führen Benutzer zu den besten Daten, um zusammen zu mischen, um sicherzustellen, dass die resultierenden harmonisierten Daten schnelle, genaue und aussagekräftige Einblicke liefern können.”

Es besteht auch die Möglichkeit, zusätzliche Statistiken zu sammeln, sowie den Zusatz von intelligenter Semantik, um zu ermitteln, wie sich einzelne Attribute über mehrere Datensätze hinweg überlappen.

Databricks CEO: Warum so viele Firmen über Apache Spark gefeuert werden, MySQL: Percona steckt in der TokuDB-Speicher-Engine für große Datenbestände, Cloudera verbindet sich mit dem Hadoop-Entwickler Cask, Mesosphere und MapR verbinden Myriad mit einer großen Datenplattform Teradata erobert große Daten-Apps, Updates Loom, MapR CEO unterhält Hadoop, IPO-Möglichkeiten für 2015, Teradata erwirbt Archiv-App-Hersteller RainStor, Hortonworks erweitert Zertifizierungsprogramm, sieht beschleunigt Unternehmen Hadoop Adoption, Actian fügt SPARQL Stadt Graph Analytics-Engine hinzu Arsenal, Splice Machine SQL auf Hadoop-Datenbank geht auf allgemeine Freisetzung

Das Unternehmen sagte, seine Software bietet jetzt Nutzer Verbesserungen in der Art, wie es verfolgt und identifiziert die Ursprünge von Daten, einschließlich Eltern-Datasets, Quellen und Datenstrukturen und Formen.

Spark begann im Jahr 2009 als UC Berkeley AMPLab Forschungsprojekt zur Schaffung eines Clustering-Computing-Framework Adressierung Ziel Arbeitsbelastungen schlecht von Hadoop serviert. Es ging Open Source im Jahr 2010 und hat einen Anstieg von Interesse in den letzten 18 Monaten erlebt. Im vergangenen Jahr war Spark das aktivste Projekt der Apache Software Foundation mit über 450 Mitwirkenden.

ClearStory Data bietet ein Back-End-System auf der Basis von Spark und einer Front-End-Anwendung, die auf einer Reihe von internen und externen Datenquellen von Daten, einschließlich Cloud-Anwendungen, sitzt. Im vergangenen Oktober startete er seinen Collaborative StoryBoards Cloud Service.

Die Back-End-Engine führt Daten-Schlußfolgerungen und Profiling, um Beziehungen zwischen Datenquellen zu erkennen. Die gemischten und harmonisierten Daten werden dann dem Benutzer über die Front-End-Anwendung präsentiert, so dass eine Anzahl von Mitarbeitern die gleichen Daten gleichzeitig erforschen und Daten ohne zusätzliche Modellierung hinzufügen können.

Social Data LinkedIn stellt seine neue Blogging-Plattform, Big Data Analytics, ist das Alter von Big OLAP, Big Data Analytics, DataRobot zielt auf die Automatisierung von Low-hanging Obst der Datenwissenschaft, Big Data Analytics, MapR Gründer John Schroeder Schritte, COO zu ersetzen

LinkedIn stellt seine neue Blogging-Plattform vor

Ist dies das Alter von Big OLAP?

DataRobot zielt auf die Automatisierung von tiefgreifenden Datenwissenschaften ab

MapR-Gründer John Schroeder geht nach unten, COO zu ersetzen

Mehr zu den großen Daten