Power BI Übungsaufgabe - Kartenvisualisierung und Datenmodell

Donnerstag, 21.3.2024

Mittelschwere Übungsaufgabe zu Power BI mit dem Datensatz New York Flights 2013

Dieser Artikel ist Teil einer Blogreihe mit Übungsaufgaben in verschiedenen Schwierigkeitsstufen, um Power BI Schritt für Schritt zu erlernen. Heute gibt es eine mittelschwere Aufgabe für fortgeschrittene Power BI-Nutzer:innen. Unsere Power BI Übungsaufgaben sind eine gute Ergänzung zu dem Seminar Grundlagen von Power BI. Die Dauer jeder einzelnen Übung ist in etwa eine gute Stunde.

In dieser Übung wendest du Folgendes an:

  • Hindernisse bei Spracheeinstellungen von Power BI überwinden

  • Zusammenführen von Abfragen (Joins) mit Power BI

  • Nutzen der Funktion “Automatisches Erkennen von Beziehungen” in der Modellansicht und Hinzufügen von fehlenden Beziehungen per Drag and Drop

  • Anwendung der Visualisierung “Karte”

  • Nutzen der DAX-Funktion DATE

  • Bedingte Formatierung in Tabellen-Visual

  • Einbindung von sinnvollen Datenschnitten in einem Bericht

Hilfreiche Vorkenntnisse:

  • Du hast bereits erste einfache Berichte mit Power BI erstellt und unter anderem das Visual “Tabelle” verwendet.

Schwierigkeitsstufe:

grafik-20240130-095459

 

 

Aufgabe

Der Datensatz New York Flights 2013 enthält Daten zu Flügen, die in New York von den drei Flughäfen EWR (Newark), JFK (John F. Kennedy und LGA (LaGuardia) im Jahr 2013 zu Zielen in den USA, Puerto Rico und den Amerikanischen Jungferninsel gestartet sind. Unter folgendem Link findet man auch eine Erklärung zur inhaltlichen Bedeutung der Spalten.

Hier findest du die Testdaten als ZIP-Datei zum Download.

Folgende Fragen sollte der Bericht beantworten:

  • Wo liegen die angeflogenen Zielflüghäfen?

  • Welche Flughäfen werden am häufigsten angeflogen?

  • Welche Flüge waren in welchem Zeitraum verspätet? Dabei sollte es möglich sein, Fluggesellschaften und Datumsbereiche zu filtern.

  • Mit welcher Geschwindigkeit sind die Flugzeuge geflogen?

Am Ende sollte der Bericht zum Beispiel so aussehen:

Beispielbericht, der die oben genannten Fragen beantwortet

Bild 1: Beispielbericht, der die oben genannten Fragen beantwortet

Schau am Besten als Erstes, wie weit du kommst. Weiter unten findest du eine detaillierte Schritt-für-Schritt-Anleitung, wie der Bericht erstellt werden kann.

Tipp: Wenn dein Power BI auf die deutsche Sprache eingestellt ist, wird dir ein Formatierungsproblem beim Einlesen der Daten auffallen. Eine Möglichkeit ist, die Quelldaten mit einem Editor (z.B. Notepad++) zu öffnen, und die Formatierung vorher entsprechend anzupassen. Orientiere dich außerdem für die Lösungsschritte gerne an der Übersicht am Anfang des Artikels (“In dieser Übung wendest du Folgendes an”).

 

Lösung

Um den Bericht in Bild 1 zu erzeugen, müssen folgende Schritte durchgeführt werden:

Schritt 1: Daten sichten und vorverarbeiten

  • In den angehängten CSV-Dateien ist das Komma als Trennzeichen eingefügt. Dieses wird auch von Power BI als Trennzeichen erkannt und so spaltenweise eingelesen.

  • Achtung: Bei der Datei nyc_airports.csv sind Breiten- und Längengrade enthalten, die als Dezimaltrennzeichen einen Punkt enthalten. Dieser wird von Power BI nicht als Dezimaltrennzeichen erkannt, wenn dein Power BI auf die deutsche Sprache eingestellt ist, weil in der deutschen Sprache der Punkt in der Regel ein Tausendertrennzeichen und kein Dezimaltrennzeichen darstellt.

    • Lösung: CSV-Datei mit einem Editor (z.B. Notepad++) öffnen und im ersten Schritt durch die Suchen-und-Ersetzen-Funktion alle Kommata durch ein Semikolon (';') ersetzen. Danach alle Punkte durch ein Komma ersetzen. So kann die Datei von Power BI richtig eingelesen werden. Alternativ kann dieser Tipp verwendet werden.

Bild 2: Ohne Vorverarbeitung werden Längen- und Breitengrate nicht richtig eingelesen.

Bild 2: Ohne Vorverarbeitung werden Längen- und Breitengrate nicht richtig eingelesen.

 

Schritt 2: Daten in Power BI laden

  • Öffne Power BI Desktop und wähle über "Daten abrufen" die Option "Daten aus einer anderen Quelle abrufen" und dann “Text/CSV” aus. Lade hier die CSV Dateien einzeln hoch.

  • Klick in den Reiter "Datenansicht", um dir die Daten anzuschauen.

  • Achtung: Die Spaltennamen bei der nyc_airlines Tabellen werden nicht richtig übernommen.

    • Lösung: Unter “Daten transformieren” die Tabelle auswählen und die Option “Erste Zeile als Überschrift verwenden” wählen. Schließen und übernehmen klicken (siehe Bild 4).

Daten tranformieren

Bild 3: Daten tranformieren

Erste Zeile als Überschriften verwenden

Bild 4: Erste Zeile als Überschriften verwenden

 

Schritt 3: Hinzufügen von Relationen

  • Power BI erkennt in der Regel automatisch Beziehungen zwischen Tabellen, wenn der Name der Spalten gleich ist. Erkennt Power BI Beziehungen zwischen Tabellen, verbindet er die Tabellen durch einen Pfeil (siehe grüner Kasten in Bild 5).

  • Wir können also die Spalten der verschiedenen Tabellen mit gleichem Inhalt gleich benennen, damit Power BI die Beziehung erkennen kann. Danach klickt man in der Modellansicht auf “Beziehungen verwalten” und führt dann die “AutoErmittlung” durch, um die neuen Beziehungen erkennen zu lassen.

  • Alternativ können neue Beziehungen zwischen Spalten, die nicht gleich heißen, per Drag and Drop erzeugt werden ohne das Menü “Beziehungen verwalten” zu öffnen. Eine andere Methode eine Beziehung anzulegen ist der Punkt “Neu…” im Menü “Beziehungen verwalten”. Hier können auch Beziehungen bearbeitet und gelöscht werden.

Beziehungen verwalten (in der Grafik ist auch schon die Tabelle nyc_flights_with_lat_lon vorhanden, die in Schritt 5 erstellt wird)

Bild 5: Beziehungen verwalten (in der Grafik ist auch schon die Tabelle nyc_flights_with_lat_lon vorhanden, die in Schritt 5 erstellt wird)

 

Schritt 4: Hinzufügen der Spalte “Geschwindigkeit” zur Tabelle nyc_flights

  • Im Reiter “Tabellenansicht” können wir eine neue Spalte “Geschwindigkeit” hinzufügen.

  • Die Geschwindigkeit kann nur berechnet werden, wenn das Flugzeug tatsächlich abgehoben ist. Dies erkennt man an der Spalte “air_time”.

  • Die Distanz ist in dem englischen Datensatz in Meilen angegeben, die Flugdauer (air_time) in minuten. Teilt man die Distanz durch die Flugdauer, erhält man die Geschwindigkeit in der Einheit [Meilen/Minute]. Durch Multiplikation mit 60, erhält man die Geschwindigkeit in der Einheit [Meilen/Stunde]. Diese runden wir auf zwei Nachkommastellen.

  • Die Geschwindigkeit berechnet sich also durch folgenden DAX-Ausdruck:

    speed = round(IF(nyc_flights[air_time]= 0, 0, nyc_flights[distance]/nyc_flights[air_time]*60),2)

 

Schritt 5: Kombinieren der Tabellen nyc_flights mit nyc_airports, um Breiten und Längengrade zu erhalten

  • In der Berichtsansicht auf “Daten transformieren” klicken.

  • Mit Rechtsklick auf die freie Fläche unter der Tabellennamen klicken und Neue Abfrage > Kombinieren > Abfragen als neue Abfragen zusammenführen auswählen.

Bild 6: Abfragen als neue Abfrage zusammenführen

Bild 6: Abfragen als neue Abfrage zusammenführen

  • Bei der nyc_flights Tabelle die Spalte ‘dest’ wählen und mit der nyc_airports Tabelle Spalte ‘faa’ verbinden.

  • Die Join-Art als “Linker äußerer Join” einstellen.

Bild 7: Konfiguration der Zusammenführung als “Linker äußerer Join” und Festlegen der Spalten, anhand deren zusammengeführt werden soll

Bild 7: Konfiguration der Zusammenführung als “Linker äußerer Join” und Festlegen der Spalten, anhand deren zusammengeführt werden soll

  • Bei der neuen Abfrage nach rechts scrollen und auswählen, welche Spalten von der nyc_airports Tabelle hinzugefügt werden sollen (lat, log und name).

Konfiguration der neuen Abfrage

Bild 8: Konfiguration der neuen Abfrage

  • Neue Abfrage umbenennen (z.B. in nyc_flights_long_lat) und mit “Schließen und Übernehmen” bestätigen.

 

Schritt 6: Nutzen des Kartenvisuals

  • Unter der Berichtsansicht das Kartenvisual auswählen und mit passenden Feldern aus der neuen Abfrage füllen.

Bild 9: Konfiguration des Kartenvisuals

Bild 9: Konfiguration des Kartenvisuals

 

Schritt 7: Verspätete Flüge in einer Tabelle anzeigen (Bedingte Formatierung)

  • Um später den Datums-Slider im Bericht einfügen zu können, muss in der nyc_flights Tabelle eine neue Spalte mit berechnetem Datum aus den Spalten ‘year’, ‘month’ und ‘day’ angefügt werden.

  • Das Datum kann durch die DAX-Formel Datum = DATE('nyc_flights'[year],'nyc_flights'[month], 'nyc_flights'[day]) erstellt werden. Danach muss die neue Spalte unter Formatierung als Datum formatiert werden.

Bild 10: Datum für den Datumsslider zur Tabelle hinzufügen

Bild 10: Datum für den Datumsslider zur Tabelle hinzufügen

  • Unter Berichtsansicht eine Tabelle mit den gewünschten Spalten einfügen.

  • Bei der Spalte mit Hilfe des Drop-Down-Menus unter Bedingter Formatierung die Option ‘Symbole’ auswählen.

Bild 11: Bedingte Formatierung 1

Bild 11: Bedingte Formatierung 1

Bild 12: Bedingte Formatierung II

Bild 12: Bedingte Formatierung II

 

Schritt 8: Silder für die Berichtsseite einfügen (Datenschnitt)

  • Für die Auswahl des Datums und auch der gewünschten Fluggesellschaft können für den Bericht Datenschnitte hinzugefügt werden.

  • Hierzu bei Visualisierungen den Datenschnitt auswählen und das gewünscht Feld für die Filterung einfügen (zwei seperate Datenschnitte mit den Feldern name für die Fluggesellschaft und Datum für den Datumsfilter).

  • Danach unter Visualisierungen → Visual formatieren → Optionen → Stil die Auswahl Zwischen treffen, um einen Datumsslider zu erstellen. Für die Fluggesellschaften ist es Dropdown.

Bild 13: Hinzufügen des Datenschnitts

Bild 13: Hinzufügen des Datenschnitts

 

Fazit

Damit ist der Bericht fertig und die anfänglichen Fragen beantwortet. Wenn dir diese Übungsaufgabe gefallen hat, lass uns gerne dein Feedback da und teste unsere anderen Power BI Übungsaufgaben

oder schau auf unseren anderen Blogartikeln zum Thema Power BI vorbei:

Willst du mehr über Power BI lernen, melde dich gerne bei unserem Seminar Grundlagen von Power BI oder bei unserem Advanced Power BI Seminar an.

Unser Seminarangebot im Bereich Business Intelligence

 


 

Die Autorinnen

Nicola Meuser, IT-BeraterinNicola Meuser

Nicola Meuser arbeitet als IT-Beraterin für die viadee Unternehmensberatung. Ihr Schwerpunkt liegt auf den Themen Data Warehousing und BI.

 

Dr. Ina Humpert, IT-BeraterinDr. Ina Humpert

Dr. Ina Humpert ist als Beraterin bei der viadee IT-Unternehmensberatung tätig. Ihren Fokus setzt sie besonders im Bereich Data Science.


zurück zur Blogübersicht

Diese Beiträge könnten Sie ebenfalls interessieren

Keinen Beitrag verpassen – viadee Blog abonnieren

Jetzt Blog abonnieren!

Kommentare

Nicola Meuser

Nicola Meuser

Nicola Meuser arbeitet als IT-Beraterin für die viadee Unternehmensberatung. Ihr Schwerpunkt liegt auf den Themen Data Warehousing und BI.