Aus dem Kurs: Power BI Desktop lernen

Plankosten-Tabelle in Form bringen – Tutorial zu Power BI

Aus dem Kurs: Power BI Desktop lernen

Plankosten-Tabelle in Form bringen

Die Plankostentabelle habe ich zusammen mit den Projektdaten in einem Schritt eingelesen. Nun geht es aber darum, noch die Plankostentabelle in Form zu bringen. Als Erstes ändere ich natürlich wieder den Namen der Abfrage und entferne das "tbl", bestätige mit Enter. Diese Abfrage weist drei Probleme auf, die ich nacheinander abarbeite. Das erste Problem: Wenn wir uns am Ende der Liste die Spalte Gesamt ansehen, diese kann immer wieder berechnet werden und wird für meine Analyse nicht benötigt, deshalb lösche ich diese Spalte. Per Rechtsklick im Spaltenkopf kann ich hier sagen Entfernen. Das zweite Problem: Die Planzahlen liegen, wie hier zu sehen, auf verschiedene Spalten verteilt vor. Das kann ich so nicht auswerten, weil Daten, die ich zusammenfassen möchte, also Planzahlen, Monatsangaben, immer jeweils in einer Spalte vorliegen müssen. Was ich benötige, sind also zwei Spalten, eine für die Planzahlen und eine für die Monatsangaben. Diesen Vorgang nennt man Entpivotieren und ist eine der besonderen Stärken von Power Query. Was Entpivotieren überhaupt macht, möchte ich kurz an einem fremden Beispiel erläutern. In dieser Tabelle geht es um den Verkauf von Produkten, verzeichnet mit Datum, Produkt und Name. Name steht hier für den Verkäufer oder die Verkäuferin. Die Umsatzzahlen sind auf verschiedene Spalten aufgesplittet, für jede Region eine Spalte. Um eine Analyse bspw. mit einer Pivot-Tabelle in Excel ausführen zu können, benötige ich eine Spalte mit den Regionsnamen, die dürfen nicht nur als Überschriften und Spalten vorhanden sein, und eine Umsatzspalte, wie es jetzt hier rechts zu sehen ist. Eine solche Darstellung von Daten ist oft zu sehen, denn sie ist praktisch für die Erfassung, aber leider nicht für Analysen. Schauen wir uns als Beispiel die erste Zeile mit dem Namen Kuhn an. Hier liegen zwei Umsätze für Süd und Ost vor. Wenn wir dann das Ergebnis nach dem Entpivotieren sehen, sehen wir, dass aus diesen zwei Umsätzen zwei neue Zeilen geworden sind. Jeder befüllte Umsatz wird also in einer neuen Zeile dargestellt. Diese Technik nennt man Entpivotieren. Schematisch sieht das Ganze so aus. Für jeden zu verzeichnenden Umsatz wird eine eigene Umsatzzeile erstellt mit der passenden Region in einer anderen Spalte. Und wie funktioniert das nun mit dem Entpivotieren in meiner Projektkostenabfrage? Ich kann die 12 Monate, die ich hier sehe, zusammen markieren, mit gedrückter Umschalt-Taste führe ich die Markierung durch und per Rechtsklick in einem der markierten Spaltenköpfe, wähle ich "Nur ausgewählte Spalten entpivotieren". Dies hat schon super geklappt. Ich habe eine Spalte mit den Monatsangaben und eine Spalte mit den Plankosten. Ich schaue mir den generierten M-Code in der Bearbeitungsleiste an. Falls diese nicht zu sehen ist, können wir das unter Ansicht > Bearbeitungsleiste einschalten. Ich gehe hier zurück auf Start. Im M-Code sehe ich, dass jede Spalte explizit genannt wird, d.h. kommen neue Monatsspalten hinzu, werden diese nicht berücksichtigt. Fallen dagegen Monatsspalten weg, wird Power Query hier stolpern über nicht vorhandene Spaltennamen. Daher wähle ich eine andere Technik, die deutlich flexibler ist. In Power Query gibt es kein Rückgängig, aber ich kann ausgeführte Schritte ändern, bspw. hier über das Zahnrädchen, oder auch einfach über das rote X löschen. Ich lösche also diesen Befehl, weil er mir zur Zeit hier nicht so gut gefällt. Außer den Monatsspalten gibt es nur noch die Spalte Projekt. Diese markiere ich und wähle jetzt eine andere Methode beim Entpivotieren, Rechtsklick im Spaltenkopf von Projekt und wähle dort "Andere Spalten entpivotieren". Was ich jetzt in der Bearbeitungsleiste sehe, ist, dass nur noch die Spalte Projekt angesprochen wird, d.h., zukünftig bin ich unabhängig von der Benennung der Spalten für die Plankosten. Die neu erstellte Spalte Attribut benenne ich per Doppelklick um in Datum und die Spalte Wert in Kosten. Damit habe ich eine flexible Lösung im Hinblick auf die Anzahl der Monatsspalten und auch deren Namen gefunden. Das dritte Problem: Die Datumsspalte weist noch kein Tagesdatum auf, sondern wir sehen nur die Angabe von Jahr und Monat. Dies kann ich leicht ändern, indem ich den Datentyp ABC nun ändere zu Datum. Power Query ist mit einer sehr guten Datumserkennung ausgestattet. Sind nur Jahr und Monat vorhanden und gut erkennbar, so nimmt Power Query immer den ersten als Tag an und vervollständigt ohne unser Dazutun das Datum zu einer korrekten Datumszahl – das ist perfekt. Ich schließe auch gleich die anderen Datentypänderungen ab, ändere hier bei Projekt auf Text und die Kosten zu einer festen Dezimalzahl. Die Datentypänderung ist etwas, was typischerweise am Ende einer Aufbereitung gemacht werden sollte, denn dann sind die Spalten festgelegt, die tatsächlich gebraucht werden. Damit dieser Schritt nicht zu früh ausgeführt wird, haben wir in den Optionen die automatische Typerkennung ausgeschaltet. Nun sind alle drei Datenquellen eingelesen und für die Analyse in Form gebracht. Somit lade ich sie ins Datenmodell, wo die Tabellen zueinander in Beziehung gesetzt werden können. Ich wähle unter Start "Schließen und übernehmen" und die Tabellen werden ins Datenmodell geladen. In der Ansicht Daten kann ich nun diese Tabellen kontrollieren. Im Bereich Felder sehe ich die verschiedenen Tabellen und kann zwischen diesen Tabellen wechseln. Klicke ich hier auf den Pfeil, so sehe ich auch die verschiedenen Spalten, hier bspw. von der Tabelle Projektdaten, die ich dann zur Visualisierung nutzen kann.

Inhalt