Automatisierung

Databricks bietet Automatisierung von Daten und maschinellen Lernprozessen

Databricks bietet Automatisierung von Daten und maschinellen Lernprozessen

Automatisierung während des gesamten Lebenszyklus

Databricks, Security-Anbieter von Unified Analytics und Entwickler von Apache Spark, bietet ab sofort Automatisierung und Erweiterung über den gesamten Lebenszyklus des Machine Learnings in seiner Unified Analytics-Plattform. Das ausgebaute Angebot von Augmented Analytics automatisiert nicht nur den maschinellen Modellbau, sondern erstreckt sich auch auf die automatisierte Datenaufbereitung und Bereitstellung. Die neuen Funktionen des Automated Machine Learning (AutoML) unterstützt Citizen Data Scientists und klassische Datenwissenschaftler gleichermaßen.

Neue AutoML-Fähigkeiten sind das Herzstück des erweiterten Analyseportfolios. Data Scientists & Engineers bieten sich neue Möglichkeiten, um Erkenntnisse zu gewinnen

Adam Conway, VP Product Management bei Databricks

"Gartner prognostiziert, dass bis 2020 mehr als 40 Prozent der datenwissenschaftlichen Aufgaben automatisiert werden. Dies führt zu einer höheren Produktivität und einem vermehrten Einsatz von Citizen Data Scientists", sagt Adam Conway, VP Product Management bei Databricks.

Um schneller an diesen Grad der Automatisierung zu kommen, den Data-Science-Teams zu helfen und ihren Erfolg zu sichern, nutzt die Unified Analytics Platform von Databricks maschinelles Lernen, um die Datenaufbereitung, Visualisierung, Feature-Engineering, Hyperparameter-Tuning, Modellsuche, automatische Tracking der Modelle, Reproduzierbarkeit und Bereitstellung zu optimieren. Dieses AutoML-Angebot hilft Citizen Data Scientists und klassischen Datenwissenschaftlern dabei, ihre datenwissenschaftlichen und maschinellen Lernabläufe zu erweitern. Dabei konzentriert es sich auf eine Integration mit dem Open-Source-Framework MLflow .

„Data Scientists & Engineers für maschinelles Lernen suchen ständig nach Möglichkeiten, ihre Initiativen für maschinelles Lernen zu beschleunigen und zu skalieren“, sagt Conway weiter. „Mit der Einführung des Konzepts von ‚Low-Code‘ und ‚No-Code‘ stellt AutoML einen grundlegenden Wandel in der Art und Weise dar, wie Unternehmen mit maschinellem Lernen und Datenwissenschaft umgehen. Mit der richtigen Automatisierung kann AutoML die Time-to-Value für Data-Science-Teams drastisch verkürzen.“

Dieses Angebot bietet AutoML-Funktionen auf verschiedenen Ebenen der Steuerung und Automatisierung.

  • AutoML Toolkit: Die automatisierte End-to-End-Pipeline für maschinelles Lernen, einschließlich Feature Engineering, Modellsuche und Bereitstellung, ist über die kundenspezifischen Lösungen von Databricks Labs verfügbar. AutoML Toolkit-Ausführungen werden in MLflow automatisch verfolgt.
  • Automatisierte Modellsuche: Optimierte und verteilte bedingte Hyperparametersuche mit erweiterter Hyperopt und automatisierter Verfolgung von MLflow.
  • Automatisiertes Hyperparameter-Tuning: Optimierte und verteilte Hyperparametersuche mit erweiterter Hyperopt und automatisierter Verfolgung zu MLflow. Tiefe Integration mit PySpark MLlib’s Cross Validation zur automatischen Verfolgung von MLlib-Experimenten in MLflow.
  • Integration mit AzureML: Aufbauend auf der im April angekündigten Open-Source-MLflow-Zusammenarbeit zwischen Databricks und Microsoft, ermöglicht diese Integration Kunden den Zugriff auf die AutoML-Funktionen von Azure Machine Learning.

Smarter mit Gartner, Top 10 Strategische Technologietrends für 2019, 15. Oktober 2018, https://www.gartner.com/smarterwithgartner/gartner-top-10-strategic-technology-trends-for-2019 /

Über Databricks

Die Mission von Databricks ist es, die Innovation für seine Kunden zu beschleunigen, indem Data Science, Engineering und Business vereint werden. Databricks wurde von den ursprünglichen Machern von Apache Spark gegründet und bietet eine Unified Analytics- Plattform für Data Science Teams, die mit Data Engineering und Branchen zusammenarbeiten, um Datenprodukte zu entwickeln. Benutzer erreichen mit Databricks eine schnellere Time-to-Value durch die Erstellung von analytischen Workflows, die von ETL über interaktive Exploration bis hin zur Produktion reichen. Das Unternehmen erleichtert seinen Nutzern zudem die Konzentration auf ihre Daten, indem es eine vollständig verwaltete, skalierbare und sichere Cloud-Infrastruktur bereitstellt, die die Betriebskomplexität und die Gesamtbetriebskosten reduziert. Databricks hat sich Investitionen von Andreessen Horowitz, Coatue Management, Microsoft, New Enterprise Associates (NEA), Battery Ventures, Green Bay Ventures und Geodesic, unter anderem, gesichert und verfügt über einen globalen Kundenstamm, zu dem Viacom, Shell und HP gehören.

Apache, Apache Spark und Spark sind Marken der Apache Software Foundation