Grundlagen Apache Spark

Veranstaltungsort

Wiesbaden

Kurslänge

1 Tag (09:30 - 16:00)

 
 

 

Für alle, die mit Apache Spark in die Data Science einsteigen wollen.

 

Lernziele

  • Aufbau und Grundlagen eines Apache Spark-Systems
  • Typische Arbeitsschritte in Apache Spark mittels Python in Jupyter umsetzen

Inhalt

In diesem 1-tägigen Crash-Kurs lernen Sie Apache Spark kennen. Apache Spark stellt eine Alternative zu Hadoop dar. Gegenüber Hadoop bietet Apache Spark – in Abhängigkeit von der vorhandenen Hardware – Performance-Vorteile. Ein weiterer Vorteil ist, dass Apache Spark auch direkt in bestehenden Hadoop-Systemen genutzt werden kann.

Ein zentraler Vorteil von Apache Spark ist, dass es sich direkt mittels Python programmieren lässt. Viele im Data Science Bereich tätige können Python, so dass direkt mit Apache Spark gearbeitet werden kann. Weiter kann durch den Einsatz von Jupyter auch eine gute Dokumentation der durchgeführten Arbeiten erreicht werden.

Der Schwerpunkt im Seminar liegt dabei auf den Grundlagen, die an einem praktischen System erlernt werden: Wir stellen Ihnen ein virtuelles Hadoop-System mit Apache Spark Installation (und Jupyter) während der Schulung zur Verfügung, dass aus einem Master sowie zwei Slave-Knoten besteht. Sie können also bereits während der Veranstaltung Jobs auf Datenbeständen laufen lassen, die über mehrere Rechner verteilt sind.

Agenda

  • Big Data, Data Science, Hadoop and Apache Spark
  • Grundlagen Apache Spark
  •  Data Management (Strukturierte, semi-strukturierte und unstrukturierte Daten)
  • RDDs
  • Exploratory Data Analysis and Data Quality
  • Machine Learning

Voraussetzung

  • Erfahrungen im Umgang mit Daten, Datenbanken oder statistischen Analysen
  • Erste Erfahrung im Umgang mit Python

Haben Sie noch Fragen?

Wir helfen Ihnen gerne weiter!

Telefon: +49(0)611 531 500 91

E-Mail: training@masem.de

 

 

R-User

R-Users Group Wiesbaden

Termin: 17. November  2017  -  18:30
Ort: wird noch bekannt gegeben

Themen:

18:30 Uhr: Neue Pakete - evtl. Rückblick auf die useR!2017

18:45 Uhr: R im Enterprise-Umfeld

Ggf. weitere Vorträge zum Thema

 

Anschließend Socialising

Das Treffen findet...