Spark und Python für Big Data und Data Science mit PySpark

Bereits 1.282+ Teilnehmer.
Bewertung: 4.3
Zum Kurs auf Udemy

Anforderungen für diesen Kurs:

  • Allgemeine Programmierkenntnisse in jeder Sprache (vorzugsweise Python)
  • 20 GB freier Speicherplatz auf deinem lokalen Computer (oder alternativ eine starke Internetverbindung für AWS)

Das wirst du in diesem Kurs lernen:

  • Verwende Python mit Spark um Big Data zu analysieren
  • Lerne, wie Du die neue Spark 2.0 DataFrame-Syntax verwenden
  • Arbeite zudem an Consulting-Projekten, die reale Situationen nachahmen
  • Wir schauen uns an wie man Kundenabwanderung mit Logistischer Regression klassifizieren kann
  • Weiter verwenden wir Spark mit Entscheidungsbäumen für die Klassifizierung
  • Zudem wirst du lernen, wie Sparks Gradient Boosted Trees verwendet wird
  • Verwende außerdem MLlib von Spark, um leistungsstarke Machine Learning-Modelle zu erstellen
  • Wir richten dann Amazon Web Services EC2 für Big Data-Analyse ein
  • Erfahren, wie du AWS Elastic MapReduce Service verwenden kannst
  • Erstelle außerdem einen Spam-Filter mit Spark und Natural Language Processing
  • Verwende anschließend Spark Streaming, um Tweets in Echtzeit zu analysieren

Erfahrungsbericht:

“Der Kurs hat ein sehr gutes Level und als Anfänger in Big Data komme ich sehr gut mit. Der Kursleiter erklärt alles sehr genau und man kann ihm sehr gut folgen.”
W. Surala

Kursbeschreibung:

Lerne die neueste Big Data Technologie – Spark! Und lerne es mit einer der beliebtesten Programmiersprachen, Python!

In diesem Kurs lernst du alles, was du wissen musst, um mit Python mit Spark im Bereich Data Science zu verwenden.

Datenmengen werden immer größer. Diese wollen auch analysiert werden. Dieser Kurs wurde daher speziell dafür entwickelt, dir eine der besten Technologien für diese Aufgabe, Apache Spark zu erklären! Die Top-Technologie-Unternehmen wie zum Beispiel Google, Facebook, Netflix, Airbnb, Amazon, NASA und mehr verwenden alle Spark, um ihre Big-Data-Probleme zu lösen! Spark kann bis zu 100x schneller als Hadoop MapReduce ausgeführt werden, was infolgedessen zu einer Explosion der Nachfrage nach dieser Fähigkeit geführt hat!

Dieser Kurs vermittelt die Grundlagen mit einem Crash-Kurs in Python und lehrt weiterhin, wie man Spark DataFrames mit der  Spark 2.0-Syntax verwendet! Sobald wir das besprochen haben, werden wir sehen, wie man die MLlib Machine Library mit der DataFrame-Syntax und Spark verwendet.

Wir befassen uns auch mit den neuesten Spark-Technologien, wie Spark SQLSpark Streaming und erweiterten Modellen wie Gradient Boosted Trees!

Dieser Kurs wird dir Spark in einer praktischen Art und Weise beibringen, in dem jede Lektion sowohl eine Coding Bildschirmaufzeichnung und ein zusätzliches Code Notebook zum Download bietet! Während jedes Abschnittes bekommst du außerdem Übungen und simulierte Beratungs-Projekte, die dich direkt in eine reale Situation bringen, in der Du deine neuen Fähigkeiten einsetzen kannst, um ein echtes Problem zu lösen!

Dieser Python für Data Science Kurs besteht aus

  • knapp 90 Lektionen
  • über 12 Stunden HD-Videos
  • Außerdem Code Notebooks zu jeder Lektion
  • Übungen, Quizfragen
  • Zusatzmaterial zum Download
  • genauso wie unzählige Projekte, die du in dein Python Portfolio mit aufnhemen kannst.
  • Fragen und Antworten Forum
  • Sowie ein kostenloser Teilnehmerchat

Vorteile

Du erhältst außerdem lebenslangen Zugang zu allen Übungen, Materialien und den über 89 Lektionen!

Nach Abschluss des Spark Kurses bekommst du ein Zertifikat, das du auch in deinem LinkedIn oder Xing Profil veröffentlichen kannst, sowie ein Portfolio an Python-Projekten, die du natürlich ebenfalls freigeben kannst.

Dabei bietet dir dieser Kurs eine 30-tägige Geld-zurück-Garantie. Wenn du also in irgendeiner Weise nicht zufrieden sein solltest, erhältst du dein Geld zurück.

Also, worauf wartest du noch? Interesse? Dann lerne noch jetzt BigData zu analysieren und Modelle zu erstellen und bringe deine Karriere voran!

Kursinhalt:

  • Einführung in den Kurs
  • Lokale Spark und Python Installation
  • Oder AWS PySpark Installation
  • Python Crashkurs
  • Spark Dataframe Grundlagen
  • Spark Dataframe Projekt Übung

 

  • Einführung in Machine Learning mit MLlib
  • Lineare Regression
  • Logistische Regression
  • Entscheidungsbäume und Random Forests
  • K-Means Clusterung

 

  • Empfehlungssysteme
  • NLP – Natural Language Processing
  • Spark Streaming mit Python
  • Bonus: RDD Einführung (Resilient Distributed Datasets)
  • und vieles mehr!

Neuste Blogeinträge

Bleibe auf dem laufendem

Was wir bieten

Wir bieten umfassende Beratungsdienste für Maschinenintelligenz in den Bereichen Big Data, Data Science und Data Engineering. Unsere Mission ist es, komplexe Geschäftsprobleme durch Planung, Entwicklung, Analyse und die Vorhersage von Geschäftsverbesserungen zu lösen.

Follow Us

© Datamics      

Developed By Sleek Line Designs

chevron-down