Das Wichtigste in Kürze

  • 3 Tage Schulung
  • Live-Unterricht via Zoom
  • Theorie und Praxis
  • Für Einsteiger geeignet
  • Feste Start- und Endzeiten

Vorteile

  • 3-tägiger Kurs mit Live-Online-Unterricht
  • Theoretische und praktische Unterrichtseinheiten
  • Kleine Gruppen bis maximal 10 Personen
  • Teilnehmer können Fragen stellen

Nachteile

  • Zeitliche Bindung durch feste Start- und Endzeiten

Der Kurs vermittelt die Verwendung der Programmiersprache R für Data Science beziehungsweise Data Mining und bietet eine Einführung die Grundlagen von Data Science sowie der Verwendung von R. Nach Absolvierung des Kurses sind die Teilnehmer in der Lage Datenanalysen in R mit tidyverse durchzuführen sowie Machine Learning Algorithmen für die Datenanalyse oder das Daten Mining mit R zu verwenden.

Die Schulung wird als Live-Online-Kurs mit Zoom Meeting durchgeführt und dauert 3 Tage. Der Kurs beginnt an den Schulungstagen um 9 Uhr und endet um 17 Uhr. Die Gruppengröße ist bei Enable AI auf 3 bis 10 Teilnehmer festgelegt, wobei die Kurse laut Angaben des Anbieters im Durchschnitt 6 Teilnehmer haben. Nach Abschluss des Kurses erhalten die Teilnehmer kein Zertifikat.

Zielgruppe

Konzipiert wurde der Kurs für Personen, die als Data Scientists, Data Analysts oder Machine Learning Engineers tätig sind und sich in diesem Bereich weiterbilden möchten. Ebenfalls geeignet ist der Kurs für Teilnehmer, die einen Beruf in diesem Bereich anstreben und sich das dafür erforderliche Wissen aneignen möchten.

Ziele

Der Kurs vermittelt einen Einblick in die Programmiersprache R, die in den Bereichen Statistik, Data Science und Machine Learning häufig zum Einsatz kommt. Die Teilnehmer können nach dem Kurs Daten aus verschiedenen Formaten einlesen und diese mit ggplot2 plotten sowie mit dpylr aus tidyverse bereinigen. Ebenso vermittelt der Kurs die benötigten Kenntnisse, um Funktionen zu schreiben und Control Flows anzuwenden. Die Teilnehmer haben das Grundkonzept tidyverse/dplyr kennengelernt und können dieses Wissen anwenden, um Data Cleaning durchzuführen. Zusätzlich bietet der Kurs eine Einführung in Machine Learning, was den Einstieg in weitere Kurse zu diesem Thema erleichtert.

Inhalte

Der Kurs behandelt an den 3 Schulungstagen unter anderem die folgenden Inhalte:

  • Einführung in die Programmiersprache R
    • Installation und Hinzufügen von Paketen
    • Unterschied zu anderen Programmiersprachen
    • Erstellung von Plots
  • Einführung in dplyr (tidyverse)
    • Überblick über tidyverse
    • Tibble – die Erweiterung von data.frames
    • Funktionen mit dpylr zur Spaltenauswahl
    • Logische Operatoren
  • Datenmanipulation mit dplyr
    • Sortierung von Zeilen
    • Berechnung neuer Spalten
    • Berechnung einer Statistik
    • Pipe Operator
    • Gruppierung von Analysen
    • Umgang mit fehlenden Werten
  • Berechnung von Statistiken mit dplyr
    • Wichtigste deskriptive Statistiken
    • Zufällige Stichprobe aus vorhandenen Daten
    • Korrelationen
    • Kontingenztabellen
  • Control Flows
    • Eigene Funktionen schreiben
    • Default Parameter in Funktionen setzen
    • For-Schleifen
    • If-Else-Bedingungen
  • Datenvisualisierung mit ggplot2
    • Konzept hinter Grammar of Graphics
    • Layer von ggplot2 zur Erstellung von Plots und zum Plotten von Statistiken
    • Darstellung mit Variablen variieren oder festsetzen
    • Erstellung mehrerer Subplots
    • Anpassung und Speicherung von Plots
  • Daten einlesen und schreiben
    • Arbeitsverzeichnis in R und RStudio setzen
    • CSV, Excel oder SPSS Datei einlesen oder schreiben
    • Überblick nützlicher Parameter
    • Fread() Funktion für große Datenmengen
  • Überblick Machine Learning
    • Einführung
    • Anwendungsbeispiele
    • Künstliche Intelligenz 
    • Deep Learning
    • Unterschied Supervised – Unsupervised Learning
    • Overfitting, Train-Test-Split und Cross-Validation
  • Lineare Regression
    • Aufteilung der Daten in Test-Train
    • Modell erstellen und validieren
    • Grundlagen des Algorithmus
    • Umsetzung in R
    • Validierung der Ergebnisse
  • Entscheidungsbaum in R
    • Aufteilung der Daten in Test-Train
    • Modell erstellen und validieren
    • Grundlagen des Algorithmus
    • Umsetzung in R
    • Validierung der Ergebnisse
    • Anpassung von Hyperparametern
  • Weitere Machine Learning Algorithmen
    • Überblick Support Vector Machine
    • Überblick Random Forest
    • Überblick K-means
    • Umsetzung in R
    • Validierung der Ergebnisse
  • Logistische Regression in R
    • Aufteilung der Daten in Test-Train
    • Modell erstellen und validieren
    • Grundlagen des Algorithmus
    • Umsetzung in R
    • Validierung der Ergebnisse
    • ROC Curve und AUC
    • Interpretation der Ergebnisse

Dozent/-en

Dozent des Kurses ist Jan Köhler. Als Statistiker und Wirtschaftsingenieur arbeitet er mit Technologien im Data Science, Machine Learning und Deep Learning. Jan Köhler hat bereits mehrere Machine Learning und Deep Learning Projekte in die Praxis umgesetzt und mehr als 25 Patentanmeldungen beigesteuert. Zudem ist er in der Forschung tätig und hat verschiedene wissenschaftliche Veröffentlichungen zum Thema Deep Learning.

Kosten und Bezahlung

Der Kurs kostet inklusive MwSt. 1.963,50€. Die Gebühren müssen spätestens 14 Tage vor Beginn des Kurses bezahlt werden.

Teilnahmevoraussetzungen

Für die Teilnahme an diesem Kurs gelten sowohl fachliche als auch technische Anforderungen, die von den Kursteilnehmern erfüllt werden müssen.

Fachliche Voraussetzungen

Die Teilnehmer benötigen keinerlei Kenntnisse in R, jedoch sollten sie Grundkenntnisse in einer anderen Programmiersprache mitbringen und mit dem Anlegen von Variablen, der Zuweisung von Werten sowie dem Schreiben von Funktionen und for-Schleifen vertraut sein. Ebenfalls sollten die Teilnehmer Grundkenntnisse im Bereich Statistik mitbringen und etwa die Begriffe Mittelwert, Standardabweichung, Median und Normalverteilung kennen. Bekannt sein sollte auch das Summenzeichen, das Integral sowie eine mathematische Funktion. Empfohlen werden außerdem Kenntnisse mit den logischen Operatoren UND, ODER und NICHT. Für die Datenanalyse in R sind außerdem Kenntnisse in Excel beziehungsweise einer BI-Software von Vorteil. Da die Dokumentationen und Einträge zu R auf Englisch sind, benötigen die Teilnehmer außerdem entsprechende Sprachkenntnisse.

Technische Voraussetzungen

Für die Kursteilnahme sowie die Erledigung der Übungsaufgaben wird ein PC oder Notebook mit Internetzugang benötigt. Vorab erhalten die Teilnehmer zudem eine Installationsanleitung für die benötigte Software, die vorab installiert werden muss. Die Schulung basiert auf dem Betriebssystem Windows. Die Teilnahme ist aber auch mit MacOS möglich. Des Weiteren wird ein Headset für die Kommunikation benötigt. Falls nicht vorhanden, können auch Lautsprecher und ein Mikrofon verwendet werden.

Medium – Wie wird das Wissen vermittelt?

Der Kurs beinhaltet Unterrichtsblöcke mit 90 Minuten, die sowohl aus Theorie- als auch aus Praxiseinheiten bestehen. Der Fokus des Kurses liegt jedoch auf den praktischen Einheiten mit Übungsaufgaben. Hier schreiben die Teilnehmer eigenen Code oder lösen Aufgaben zu den Kursinhalten. Der theoretische Wissensteil wird zudem als pdf-Version zur Verfügung gestellt. Die Code-Beispiele und Musterlösungen stehen in digitaler Form zur Verfügung.

Interaktion – Dozenten/Teilnehmer-Kommunikation

Der Kurs ermöglicht die Interaktion. Während der praktischen Übungseinheiten können die Teilnehmer individuelle Fragen stellen, die vom Dozenten direkt beantwortet werden. Sollte eine Frage von allgemeinem Interesse sein, werden diese für alle Teilnehmer beantwortet.

Bildungsurlaub & Bildungsgutschein

Bei Enable AI können die Bildungsschecks von Nordrhein-Westfalen sowie die Bildungsprämie für die Weiterbildung verwendet werden. Andere Bildungsgutscheine akzeptiert der Kursanbieter jedoch nicht.

Kundenservice

Der Kundenservice von Enable AI kann per E-Mail oder Telefon kontaktiert werden. Alternativ steht auf der Webseite auch ein Kontaktformular zur Verfügung, das zur Kontaktaufnahme verwendet werden kann.

Fazit

Der Kurs »Data Science in R / Data Mining in R« beinhaltet eine Einführung in die Programmiersprache R und zeigt die Verwendung für Data Science und Data Mining. Vorkenntnisse mit R werden nicht benötigt, doch erweist es sich von Vorteil, wenn Erfahrungen mit einer anderen Programmiersprache vorhanden sind. Der Kurs dauert 3 Tage und beinhaltet Live-Unterricht via Zoom. Der Unterricht ist in Blöcke zu jeweils 90 Minuten eingeteilt und besteht aus theoretischem Wissen und praktischen Übungsaufgaben.

Anbieter

Enable AI Logo

Enable AI

Letzte Aktualisierung am 01. August 2022

Eckdaten

Inhaltstyp: Eigene Inhalte
Bezahlmethode: Überweisung
Medien: Multimedia
Kundensupport: E-Mail, Telefon, Web-Formular
Mobile App: Nein
Offlinenutzung: Nein
Zertifikate: Kursabhängig

Vorteile

  • alle Inhalte auch individuell für Unternehmen buchbar
  • praxisorientierte Inhalte mit mindestens 50 Prozent Übungsaufgaben
  • Geld-zurück-Garantie bei mehrtägigen Webinaren
  • kleine Schulungsgruppen

Nachteile

  • nur eine Bezahlmethode verfügbar

Kurs bewerten

Es muss eine Bewertung ausgewählt werden.

(optional)

Weitere IT & Software Onlinekurse: