Aus dem Kurs: Data Science – Grundlagen

So erhalten Sie Zugriff auf diesen Kurs

Werden Sie noch heute Mitglied und erhalten Sie Zugriff auf mehr als 23.200 Kurse von Branchenfachleuten.

Datenaufbereitung

Datenaufbereitung

Jeder, der schon mal gekocht hat, weiß, wie zeitraubend es sein kann, ein Essen vorzubereiten, ganz zu schweigen vom Einkaufen, Zusammensuchen der Zutaten, Zusammenstellen und Sortieren der Sachen in Schüsseln und dem eigentlichen Vorgang, das Essen zu kochen. In Data Science ist es ganz ähnlich, nämlich bei dem Teil der Arbeit, der sich um die Aufbereitung der Daten dreht. Eine Faustregel besagt, dass 80 Prozent der Zeit jedes Data-Science-Projekts für die Aufbereitung der Daten aufgewendet wird. Die Aufbereitung braucht 80 und alles andere rund 20 Prozent der Zeit. Das scheint ungemein ineffizient und Sie fragen sich vielleicht, woher Sie die Motivation nehmen sollen, diese so zeitraubende Schinderei auf sich zu nehmen. Ich sage nur GIGO, »Garbage In, Garbage Out« – wo Müll reinkommt, kommt Müll raus. Das ist eine Binsenweisheit der Computerwissenschaft. Die Informationen, die Ihre Analyse ausgibt, sind nur so gut wie die Informationen, die Sie eingeben. Um es mit stärkeren Worten…

Inhalt