Wenn es darum geht, jemanden über bestimmte Fakten in Kenntnis zu setzen, spielt eine durchdachte Datenvisualisierung die wichtigste Rolle. Ein äußerst effektives Werkzeug, um beim Betrachter schnell einen starken Eindruck zu hinterlassen, ist eine Heatmap. In diesem Artikel schauen wir uns daher unter anderem an, was eine Heatmap Matrix ist, wie man daraus eine Cluster Heatmap macht und warum sich Heatmaps gerade für geografische besonders hilfreich sind. Als Anwendungsbeispiel besprechen wir anschließend, warum sich Heatmaps in der Immobilienbranche so großer Beliebtheit erfreuen.
Um eine Beratung zu dieser und vielen anderen Visualisierungsmöglichkeiten zu bekommen, kontaktieren sie uns einfach!
Dieser Artikel erläutert die folgenden Kernfragen
- Was ist eigentlich eine Heatmap?
- Wo lassen sich Heatmaps überall finden und was sind Cluster Heatmaps?
- Wo helfen Heatmaps der Immobilienbranche?
Was ist eine Heatmap?
Das Wort Heatmap – Hitzekarte – ist ein wenig irreführend. Zwar ist die Deutschlandkarte mit den Temperaturverläufen (typisch von blau zu rot) im Wetterbericht eine Heatmap, aber auch eine bspw. mit INKAR online erstellte klassische Landkarte, die über verschiedene Farben Erhebungen im Gelände kennzeichnet (typisch von grün zu braun) gilt beispielsweise schon als Heatmap. Ein Bild, gemacht mit einer Wärmebildkamera, fällt ebenfalls unter diesen Begriff.
Es sind im Grunde unendlich viele verschiedene Beispiele denkbar. Zu ein paar sehr interessanten kommen wir später noch einmal. Eine lockere Definition einer Heatmap kann lauten, dass sie die folgenden zwei Eigenschaften mitbringt:
- Es gibt einen zweidimensionalen Datensatz als Grundmenge. Im Falle einer Landkarte sind dies zum Beispiel Längen- und Breitengrade. Diese Daten spannen dann die Heatmap Matrix auf.
- Es gibt eine Wertemenge, die mit der zweidimensionalen Grundmenge verknüpft ist. Zum Beispiel die Temperatur oder die Erhebung an einem Längen- und Breitengrad-Paar. Diese wird dann farbcodiert auf die Grundmenge aufgetragen.
Abstraktere Formen der Heatmap nutzen anstatt von Farben zum Beispiel verschieden große Kreise oder Säulen, um die Ausprägung der Wertemenge darzustellen. Um diese Diagramme soll es hier aber nicht im Detail gehen.
Wenn Sie sich jedoch für weitere Informationen zu Visualisierungen interessieren, fragen Sie doch einfach mal bei Novustat eine Data Mining Beratung zu diesem Thema an!
Was kann die Heatmap?
Die große Stärke der Heatmap ist die intuitive Art, wie sie gelesen wird. In Bruchteilen von Sekunden werden durch eine Heatmap die wesentlichen Informationen der Daten (wie beispielsweise Cluster) aufgenommen und verstanden. Dies liegt am natürlichen Verständnis des Menschen für Farbverläufe. Und die Grundmenge ist dabei keineswegs beschränkt auf geografische Daten. Im Folgenden wird eine fiktive Umfrage vorgestellt, in der zehn Personen zehn verschiedene Gerichte auf einer Skala von 1 bis 10 bewerten sollten. Diese Daten sind in einer Heatmap Matrix eingetragen.
Spaghetti | Fleisch | Reis | Wurstwaren | Tofu | Käse | Brot | Eier | Kartoffeln | Suppe | Salat | |
Hugo | 1 | 10 | 6 | 10 | 7 | 7 | 8 | 6 | 3 | 1 | 1 |
Roberta | 1 | 2 | 9 | 6 | 1 | 3 | 7 | 4 | 7 | 3 | 5 |
Maike | 9 | 7 | 10 | 3 | 6 | 1 | 7 | 8 | 1 | 8 | 2 |
Sven | 9 | 2 | 9 | 4 | 1 | 7 | 2 | 7 | 1 | 5 | 1 |
Steffanie | 4 | 8 | 4 | 7 | 2 | 5 | 6 | 8 | 4 | 6 | 2 |
Joseph | 9 | 6 | 7 | 2 | 9 | 2 | 1 | 10 | 2 | 9 | 6 |
Heidi | 3 | 4 | 8 | 5 | 5 | 2 | 2 | 5 | 4 | 8 | 8 |
Chris | 4 | 1 | 10 | 9 | 10 | 4 | 5 | 2 | 2 | 9 | 3 |
Clara | 6 | 8 | 5 | 8 | 5 | 2 | 7 | 10 | 10 | 6 | 4 |
Justin | 9 | 4 | 9 | 2 | 2 | 1 | 8 | 8 | 5 | 5 | 4 |
Heatmap Matrix
Diese Daten werden nun, wie eben beschrieben, farbcodiert aufgetragen. Daraus folgt eine Heatmap, wie sie unten zu sehen ist. Die Informationen sind zwar leicht abzulesen, aber doch noch ein wenig durcheinander.
Cluster Heatmap
Ordnet man diese eigentlich ungeordnete Heatmap Matrix aus Personen und Nahrungsmitteln noch nach Ausprägung der Vorlieben, dann entsteht eine Cluster Heatmap. Für das Ordnen der Variablen gibt es verschiedene Algorithmen, deren Erläuterung den Rahmen dieses Artikels sprengen würden (hier lässt sich etwas im Detail dazu lesen). Solche Cluster Heatmaps werden besonders häufig in der Biologie verwendet, um Genexpressionsraten darzustellen und dabei leicht erkennen zu lassen, welche Gene unter welchen Umständen ähnlich oder unterschiedlich exprimiert werden.
Neben abstrakten Darstellungen verschiedener Zusammenhänge, eignet sich eine Heatmap aber vor allem herausragend dafür, geografische Eigenschaften zu visualisieren.
Die Heatmap im Immobilienhandel
Die Immobilienbranche hat schon vor langer Zeit entdeckt, dass bestimmte Daten sich am besten grafisch direkt auf einer Landkarte darstellen lassen können. Insbesondere seit im Bereich Immobilien Big Data Analysen eingesetzt werden, erfreuen sich Heatmaps größter Beliebheit. Im Folgenden sind zwei Beispiele dargestellt, die auf fiktiven Daten für den Raum Frankfurt basieren. Die erste Heatmap ist eine klassische Variante, die von niedrigen Werten in Weiß bis zu hohen Werten in Rot geht. Beim Erstellen einer solchen Karte werden dabei die einzelnen Datenpunkte durch Polygone verbunden und die Information so geglättet. Man könnte zum Beispiel die gefühlte Wohnqualität oder, bei Rot vielleicht passender, die Luftverschmutzung auftragen. Somit lassen sich bestimmte Stadtteile besonders stark bewerben.
Die zweite Art von Heatmaps, die hier vorgestellt wird, ist besonders gut für absolute Werte geeignet, die begrenzt sind auf bestimmte geografische Orte. Hier werden verschieden große Punkte verwendet, um die Ausprägung darzustellen. Jeder Punkt gehört dann zu einem bestimmten geographischen Rahmen. Zum Beispiel könnte man hier die Bevölkerungsdichte pro Stadtteil auftragen, oder die Anzahl der Kindergärten pro Gemeinde.
Zu einer richtigen Heatmap gehört natürlich auch noch eine Legende, die die Farbverläufe und Größen in den Kontext mit der darzustellenden Variable bringt. Aufgrund der fiktiven Daten ist diese hier absichtlich nicht geschehen. Es gibt außerdem noch unzählige weitere Arten von Heatmaps, von denen jede besonders gut für bestimmte Anwendungen geeignet ist. Die Gestaltungsmöglichkeiten sind dabei endlos.
Wie geht es jetzt weiter?
Welche Heatmap man für seine Darstellung benutzen sollte, hängt von vielen Faktoren ab. Die richtige Einschätzung ist daher nicht immer ganz einfach. Wenn Sie sich dafür interessieren, wie man Heatmaps in Ihrem professionellen Data Mining Projekt gewinnbringend anwenden kann, dann kontaktieren Sie uns doch einfach ganz unverbindlich!