Spark und Python für Big Data und Data Science mit PySpark

Logo für den Datamicskurs auf Udemy Spark und Python für Big Data und Data Science mit PySpark

Spark und Python für Big Data und Data Science mit PySpark

 


Anforderungen

  • Allgemeine Programmierkenntnisse in jeder Sprache (vorzugsweise Python)
  • 20 GB freier Speicherplatz auf deinem lokalen Computer (oder alternativ eine starke Internetverbindung für AWS)

Für wen eignet sich dieser Kurs?

  • Python Programmierer, die dessen Verwendung für Big Data lernen möchten
  • Programmierer, die eine andere Sprache können und mit Python und Spark arbeiten möchten
  • Data Scientists die eine andere Programmiersprache kennen und Spark lernen möchten

Das wirst du in unserem Kurs Spark und Python für Big Data und Data Science mit PySpark lernen

  • Verwende Python mit Spark um Big Data zu analysieren
  • Lerne, wie Du die neue Spark 2.0 DataFrame-Syntax verwenden
  • Arbeite zudem an Consulting-Projekten, die reale Situationen nachahmen
  • Wir schauen uns an wie man Kundenabwanderung mit Logistischer Regression klassifizieren kann
  • Weiter verwenden wir Spark mit Entscheidungsbäumen für die Klassifizierung
  • Zudem wirst du lernen, wie Sparks Gradient Boosted Trees verwendet wird
  • Verwende außerdem MLlib von Spark, um leistungsstarke Machine Learning-Modelle zu erstellen
  • Wir richten dann Amazon Web Services EC2 für Big Data-Analyse ein
  • Erfahren, wie du AWS Elastic MapReduce Service verwenden kannst
  • Erstelle außerdem einen Spam-Filter mit Spark und Natural Language Processing
  • Verwende anschließend Spark Streaming, um Tweets in Echtzeit zu analysieren

Kursbeschreibung

Lerne die neueste Big Data Technologie – Spark! Und lerne es mit einer der beliebtesten Programmiersprachen, Python!

In diesem Kurs lernst du alles, was du wissen musst, um mit Python mit Spark im Bereich Data Science zu verwenden.

Datenmengen werden immer größer. Diese wollen auch analysiert werden. Dieser Kurs wurde daher speziell dafür entwickelt, dir eine der besten Technologien für diese Aufgabe, Apache Spark zu erklären! Die Top-Technologie-Unternehmen wie zum Beispiel Google, Facebook, Netflix, Airbnb, Amazon, NASA und mehr verwenden alle Spark, um ihre Big-Data-Probleme zu lösen! Spark kann bis zu 100x schneller als Hadoop MapReduce ausgeführt werden, was infolgedessen zu einer Explosion der Nachfrage nach dieser Fähigkeit geführt hat!

Dieser Kurs vermittelt die Grundlagen mit einem Crash-Kurs in Python und lehrt weiterhin, wie man Spark DataFrames mit der  Spark 2.0-Syntax verwendet! Sobald wir das besprochen haben, werden wir sehen, wie man die MLlib Machine Library mit der DataFrame-Syntax und Spark verwendet.

Wir befassen uns auch mit den neuesten Spark-Technologien, wie Spark SQL, Spark Streaming und erweiterten Modellen wie Gradient Boosted Trees!

Dieser Kurs wird dir Spark in einer praktischen Art und Weise beibringen, in dem jede Lektion sowohl eine Coding Bildschirmaufzeichnung und ein zusätzliches Code Notebook zum Download bietet! Während jedes Abschnittes bekommst du außerdem Übungen und simulierte Beratungs-Projekte, die dich direkt in eine reale Situation bringen, in der Du deine neuen Fähigkeiten einsetzen kannst, um ein echtes Problem zu lösen!

Dieser Python für Data Science Kurs besteht aus

  • kanpp 90 Lektionen
  • über 12 Stunden HD-Videos
  • Außerdem Code Notebooks zu jeder Lektion
  • Übungen, Quizfragen
  • Zusatzmaterial zum Download
  • genauso wie unzählige Projekte, die du in dein Python Portfolio mit aufnhemen kannst.
  • Fragen und Antworten Forum
  • Sowie ein kostenloser Teilnehmerchat

Vorteile

Du erhältst außerdem lebenslangen Zugang zu allen Übungen, Materialien und den über 89 Lektionen!

Nach Abschluss des Spark Kurses bekommst du ein Zertifikat, das du auch in deinem LinkedIn oder Xing Profil veröffentlichen kannst, sowie ein Portfolio an Python-Projekten, die du natürlich ebenfalls freigeben kannst.

💰 Dabei bietet dir dieser Kurs eine 30-tägige Geld-zurück-Garantie. Wenn du also in irgendeiner Weise nicht zufrieden sein solltest, erhältst du dein Geld zurück.

Also, worauf wartest du noch? Interesse? Dann lerne noch jetzt Daten zu visualisieren und bringe deine Karriere voran!


Inhalt des Kurses Spark und Python für Big Data und Data Science mit PySpark

  • Einführung in den Kurs
  • Lokale Spark und Python Installation
  • Oder AWS PySpark Installation
  • Python Crashkurs
  • Spark Dataframe Grundlagen
  • Spark Dataframe Projekt Übung
  • Einführung in Machine Learning mit MLlib
  • Lineare Regression
  • Logistische Regression
  • Entscheidungsbäume und Random Forests
  • K-Means Clusterung
  • Empfehlungssysteme
  • NLP – Natural Language Processing
  • Spark Streaming mit Python
  • Bonus: RDD Einführung (Resilient Distributed Datasets)
  • und vieles mehr!

Erfahrungsberichte

★★★★★

   „Der Kurs hat ein sehr gutes Level und als Anfänger in Big Data komme ich sehr gut mit. Der Kursleiter erklärt alles sehr genau und man kann ihm sehr gut folgen.“ (W. Surala)

★★★★★

„Der Kurs ist super geeignet für die Projekt-Ideen, die mir vorschweben.“ (R. Mülder)

 



<– zurück zur Kursübersicht

<<– direkt zum Kurs Spark und Python für Big Data und Data Science mit PySpark auf Udemy

English (UK)
Deutsch English (UK)