Gerne beraten wir Sie auch telefonisch & geben Ihnen eine kostenfreie persönliche Auskunft zu Ihrem Projekt.

X

Die Heatmap: Der Held für geografische Daten!

Wenn es darum geht, jemanden über bestimmte Fakten in Kenntnis zu setzen, spielt eine durchdachte Datenvisualisierung die wichtigste Rolle. Ein äußerst effektives Werkzeug, um beim Betrachter schnell einen starken Eindruck zu hinterlassen, ist eine Heatmap. In diesem Artikel schauen wir uns daher unter anderem an, was eine Heatmap Matrix ist, wie man daraus eine Cluster Heatmap macht und warum sich Heatmaps gerade für geografische besonders hilfreich sind. Als Anwendungsbeispiel besprechen wir anschließend, warum sich Heatmaps in der Immobilienbranche so großer Beliebtheit erfreuen.

Um eine Beratung zu dieser und vielen anderen Visualisierungsmöglichkeiten zu bekommen, kontaktieren sie uns einfach!

Lassen Sie uns Ihre Anforderungen wissen & wir erstellen Ihnen innerhalb weniger Stunden ein kostenfreies Angebot.


Jetzt unverbindlich anfragen

Dieser Artikel erläutert die folgenden Kernfragen

  • Was ist eigentlich eine Heatmap?
  • Wo lassen sich Heatmaps überall finden und was sind Cluster Heatmaps?
  • Wo helfen Heatmaps der Immobilienbranche?

Was ist eine Heatmap?

Das Wort Heatmap – Hitzekarte – ist ein wenig irreführend. Zwar ist die Deutschlandkarte mit den Temperaturverläufen (typisch von blau zu rot) im Wetterbericht eine Heatmap, aber auch eine klassische Landkarte, die über verschiedene Farben Erhebungen im Gelände kennzeichnet (typisch von grün zu braun) gilt beispielsweise schon als Heatmap.  Ein Bild, gemacht mit einer Wärmebildkamera, fällt ebenfalls unter diesen Begriff.

Es sind im Grunde unendlich viele verschiedene Beispiele denkbar. Zu ein paar sehr interessanten kommen wir später noch einmal. Eine lockere Definition einer Heatmap kann lauten, dass sie die folgenden zwei Eigenschaften mitbringt:

  1. Es gibt einen zweidimensionalen Datensatz als Grundmenge. Im Falle einer Landkarte sind dies zum Beispiel Längen- und Breitengrade. Diese Daten spannen dann die Heatmap Matrix auf.
  2. Es gibt eine Wertemenge, die mit der zweidimensionalen Grundmenge verknüpft ist. Zum Beispiel die Temperatur oder die Erhebung an einem Längen- und Breitengrad-Paar. Diese wird dann farbcodiert auf die Grundmenge aufgetragen.

Abstraktere Formen der Heatmap nutzen anstatt von Farben zum Beispiel verschieden große Kreise oder Säulen, um die Ausprägung der Wertemenge darzustellen. Um diese Diagramme soll es hier aber nicht im Detail gehen.

Wenn Sie sich jedoch für weitere Informationen zu Visualisierungen interessieren, fragen Sie doch einfach mal bei Novustat eine Data Mining Beratung zu diesem Thema an!

Was kann die Heatmap?

Die große Stärke der Heatmap ist die intuitive Art, wie sie gelesen wird. In Bruchteilen von Sekunden werden durch eine Heatmap die wesentlichen Informationen der Daten (wie beispielsweise Cluster) aufgenommen und verstanden. Dies liegt am natürlichen Verständnis des Menschen für Farbverläufe. Und die Grundmenge ist dabei keineswegs beschränkt auf geografische Daten. Im Folgenden wird eine fiktive Umfrage vorgestellt, in der zehn Personen zehn verschiedene Gerichte auf einer Skala von 1 bis 10 bewerten sollten. Diese Daten sind in einer Heatmap Matrix eingetragen.

 SpaghettiFleischReisWurstwarenTofuKäseBrotEierKartoffelnSuppeSalat
Hugo1106107786311
Roberta12961374735
Maike971036178182
Sven92941727151
Steffanie48472568462
Joseph967292110296
Heidi34855225488
Chris4110910452293
Clara6858527101064
Justin94922188554

Heatmap Matrix

Diese Daten werden nun, wie eben beschrieben, farbcodiert aufgetragen. Daraus folgt eine Heatmap, wie sie unten zu sehen ist. Die Informationen sind zwar leicht abzulesen, aber doch noch ein wenig durcheinander.

Heatmap Matrix mit zufälligen Daten
Eine Beispiel Heatmap Matrix, die die Vorliebe der jeweiligen Personen für bestimmte Nahrungsmittel zeigt. Die zugrundeliegenden Daten wurden hierzu zufällig erzeugt.

Cluster Heatmap

Ordnet man diese eigentlich ungeordnete Heatmap Matrix aus Personen und Nahrungsmitteln noch nach Ausprägung der Vorlieben, dann entsteht eine Cluster Heatmap. Für das Ordnen der Variablen gibt es verschiedene Algorithmen, deren Erläuterung den Rahmen dieses Artikels sprengen würden (hier lässt sich etwas im Detail dazu lesen). Solche Cluster Heatmaps werden besonders häufig in der Biologie verwendet, um Genexpressionsraten darzustellen und dabei leicht erkennen zu lassen, welche Gene unter welchen Umständen ähnlich oder unterschiedlich exprimiert werden.

Cluster Matrix mit Clustern nach euklidischen Maß
Gleiche Daten wie oben, aber hier wurden die Personen und die Nahrungsmittel nach ähnlichen Ausprägungen gruppiert, das Ergebnis ist eine Cluster Heatmap. Man erkennt somit auf einen Blick etwas besser, wo Gemeinsamkeiten in den Ausprägungen liegen. An den Rändern wird die Gruppierung der Daten dargestellt. Die Cluster wurden hierzu mit einem euklidischen Maß nach Entfernung gebildet.

Neben abstrakten Darstellungen verschiedener Zusammenhänge, eignet sich eine Heatmap aber vor allem herausragend dafür, geografische Eigenschaften zu visualisieren.

Die Heatmap im Immobilienhandel

Die Immobilienbranche hat schon vor langer Zeit entdeckt, dass bestimmte Daten sich am besten grafisch direkt auf einer Landkarte darstellen lassen können. Im Folgenden sind zwei Beispiele dargestellt, die auf fiktiven Daten für den Raum Frankfurt basieren. Die erste Heatmap ist eine klassische Variante, die von niedrigen Werten in Weiß bis zu hohen Werten in Rot geht. Beim Erstellen einer solchen Karte werden dabei die einzelnen Datenpunkte durch Polygone verbunden und die Information so geglättet. Man könnte zum Beispiel die gefühlte Wohnqualität oder, bei Rot vielleicht passender, die Luftverschmutzung auftragen. Somit lassen sich bestimmte Stadtteile besonders stark bewerben.

Heatmap Immobilien Big Data
Klassische Heatmap für den Raum Frankfurt mit fiktiven Daten. Gut zum Darstellen von Daten, die keine festen Grenzen aufweisen, da die Datenpunkte interpoliert dargestellt werden.

Die zweite Art von Heatmaps, die hier vorgestellt wird, ist besonders gut für absolute Werte geeignet, die begrenzt sind auf bestimmte geografische Orte. Hier werden verschieden große Punkte verwendet, um die Ausprägung darzustellen. Jeder Punkt gehört dann zu einem bestimmten geographischen Rahmen. Zum Beispiel könnte man hier die Bevölkerungsdichte pro Stadtteil auftragen, oder die Anzahl der Kindergärten pro Gemeinde.

Eine Heatmap, deren Ausprägung durch die Größe und Farbe der Kreise dargestellt wird. Besonders gut geeignet für Werte, die örtlich klar begrenzt sind.

Zu einer richtigen Heatmap gehört natürlich auch noch eine Legende, die die Farbverläufe und Größen in den Kontext mit der darzustellenden Variable bringt. Aufgrund der fiktiven Daten ist diese hier absichtlich nicht geschehen. Es gibt außerdem noch unzählige weitere Arten von Heatmaps, von denen jede besonders gut für bestimmte Anwendungen geeignet ist. Die Gestaltungsmöglichkeiten sind dabei endlos.

Wie geht es jetzt weiter?

Welche Heatmap man für seine Darstellung benutzen sollte, hängt von vielen Faktoren ab. Die richtige Einschätzung ist daher nicht immer ganz einfach. Wenn Sie sich dafür interessieren, wie man Heatmaps in Ihrem professionellen Data Mining Projekt gewinnbringend anwenden kann, dann kontaktieren Sie uns doch einfach ganz unverbindlich!