Kompaktkurs Data Science mit R®

Veranstaltungsort

Wiesbaden

Kurslänge

2 Tage (09:30 - 16:00)

 
 

 

Für alle Fachkräfte, die einen kompetenten Umgang mit Statistik mit Hilfe von R® anstreben.

 

Lernziele

  • Data Science Projekte mit R umsetzen – basierend auf dem CRISP-DM-Standard
  • Zentrale Data Science Pakete kennen und einsetzen können
  • Das Framework caret nutzen können (+ Übersicht mlr-Framework)
  • Größere Datenmengen mit data.table bearbeiten (+ weitere Alternativen)
  •  Zentrale Algorithmen im Data Science kennenlernen und einsetzen

Inhalt

Dieser Kurs richtet sich an alle Personen, die in die Umsetzung von Data Science Projekten mit R® einsteigen oder ihr Wissen auffrischen wollen. Dabei sollten die TeilnehmerInnen bereits mit R® gearbeitet und erste Erfahrungen gesammelt haben.

In R® stehen zahlreiche Pakete zur Verfügung, die den gesamten Data-Science-Prozess - vom Datenzugriff und der Datenaufbereitung über die Bildung verschiedener Modelle bis hin zur Modellevaluation - unterstützen.

Die einzelnen Schritte werden anhand des CRISP-DM-Standards praxisorientiert besprochen und auf Basis realer Fragestellung in R® und RStudio® eingeübt.

Um auch größere Datensätze verarbeiten zu können, wird das Paket data.table vertiefend trainiert. Weiter bietet das caret-Paket ein komplettes Framework zur Umsetzung an. Durch das caret-Paket kann auf über 230 Modellierungspakete zugegriffen werden. Um hier einen strukturierten Zugang zu finden, werden zentrale Modellierungstechniken vorgestellt und eingesetzt. Den Abschluss des Seminars bildet dann die Modellevaluation, für die in R® und in den Zusatzpaketen zentrale Funktionen zur Verfügung stehen (Konfusionsmatrizen, ROC-Kurven, zentrale Kennwerte etc.).

Eine autodidaktische Weiterbildung oder die Teilnahme an weiterführenden Seminaren ist nach diesem Grundkurs bestens möglich.

Agenda

  • Data Science Fundamentals
  • Ressourcen: R®, RStudio®, CRISP-DM
  • Data IO: Datenbanken: RODBC-Schnittstellen, praktische Umsetzung mit MySQL; Effizientes Arbeiten mit größeren Datensätzen: Das data.table Paket
  • Umsetzung von Data Science Projekten in R: Das caret Framework: Business Understanding (Hinweise); Data Understanding; Data Preparation; Modeling; Evaluation; Deployment
  • Modellevaluation: ROC-Pakete; Relevante Parameter zur Modellbeurteilung
  • Hadoop und R® - Grundlagen (bei Bedarf)
  • Spark and R® - Grundlagen (bei Bedarf)

Voraussetzung

Erste Erfahrungen mit R®.

Haben Sie noch Fragen?

Wir helfen Ihnen gerne weiter!

Telefon: +49(0)611 531 500 91

E-Mail: training@masem.de

 

R-User

R-Users Group Wiesbaden

Termin: 17. November  2017  -  18:30
Ort: wird noch bekannt gegeben

Themen:

18:30 Uhr: Neue Pakete - evtl. Rückblick auf die useR!2017

18:45 Uhr: R im Enterprise-Umfeld

Ggf. weitere Vorträge zum Thema

 

Anschließend Socialising

Das Treffen findet...