Digitalisierung & Technologie, 20. Oktober 2025

Spatial Intelligence: Wenn KI die Welt begreift

Wie räumliche Intelligenz die Interaktion mit der physischen Welt revolutioniert.

Wie KI das Internet reformiert

Seit dem Start von ChatGPT Ende 2022 kennt die Entwicklung der Künstlichen Intelligenz kein Tempolimit oder gar Stau. Wir haben uns längst daran gewöhnt, dass KI Texte schreibt, Bilder und Videos generiert und mit menschlichen Stimmen umgehen kann. Doch trotz all dieser Fähigkeiten gibt es noch eine entscheidende Einschränkung: KI-Tools agieren in einer flachen, zweidimensionalen Welt. Mit Spatial Intelligence sollen sie nun aber lernen, die Welt in allen drei Dimensionen zu begreifen.

KI-Tools wie ChatGPT, Claude, Gemini oder Mistral verstehen beispielsweise nicht, was Schwerkraft bedeutet, in welcher räumlichen Beziehung Objekte zueinander stehen oder wie man sich in einem Raum bewegen kann. Sie kennen nur zwei Dimensionen und müssen die 3D-Welt, in der wir Menschen leben, erst noch begreifen lernen.

Was ist Spatial Intelligence?

Dieser wichtige Evolutionsschritt, den die KI noch gehen muss, nennt sich „Spatial Intelligence“ oder „Räumliche Intelligenz“. Damit ist die Fähigkeit von KI-Systemen gemeint, dreidimensionale Räume mit all ihren physikalischen Gesetzen zu verstehen, in ihnen zu navigieren und mit ihnen zu interagieren.

Um diesen Entwicklungsschritt zu ermöglichen, muss zunächst die Datenbasis erweitert werden. Während bekannte Large Language Models (LLM) wie ChatGPT mit Texten trainiert wurden, benötigt Spatial Intelligence auch Informationen, die ein umfassendes Verständnis der physikalischen Welt ermöglichen. KI-Entwickler sprechen daher auch von „Large World Models“ (LWM).

Bildlich gesprochen sollen sie nicht nur Objekte wie einen Ball und eine Feder erkennen und voneinander unterscheiden können, sondern auch verstehen, wie sie sich aufgrund ihrer physikalischen Merkmale in einem Raum verhalten. Während es für einen erwachsenen Menschen vollkommen logisch ist, dass ein Ball schneller zu Boden fällt als eine Feder, wenn man sie fallenlässt, muss sich die KI diese Logik über das neue LWM erst antrainieren.

Technisch betrachtet basiert Spatial Intelligence auf der Fusion verschiedener Datenquellen, darunter Kamerasysteme, Lidar-Sensoren, Radar und andere räumliche Sensoren. Wem das jetzt bekannt vorkommt: Diese Sensor-Systeme spielen bereits eine wichtige Rolle. Und zwar bei der Entwicklung von autonomen Fahrzeugen. Auch hier geht es darum, den Fahrsystemen einen möglichst umfassenden Blick auf die Umwelt zu ermöglichen. Man könnte auch sagen: Autos sollen lernen, ähnlich wie Menschen zu sehen.


Die „Visionärin“ Fei-Fei Li

„Die Welt ist 3D, nicht flach“, lautet die zentrale These der Stanford-Professorin Fei-Fei Li. Sie gilt als Vorreiterin der Spatial Intelligence und hat mit ihrem Startup „World Labs“ wichtige Pionierarbeit geleistet. Dabei geht es ihr nicht einfach um eine technologische Entwicklung, sondern vielmehr um die grundsätzliche Notwendigkeit, dass Maschinen die physikalische Welt in ihrer gesamten Komplexität begreifen müssen, um für die Menschen, die in dieser Welt leben, wirklich nützlich sein zu können. Es geht also nicht nur um GenAI, sondern unter anderem auch um Robotik, das Gesundheitswesen und Bereiche wie die Stadtplanung.


Wo Spatial Intelligence zum Gamechanger wird

Die praktischen Einsatzmöglichkeiten von Spatial Intelligence sind schon jetzt vielversprechend. Besonders in Verbindung mit anderen technologischen Entwicklungen ergeben sich Szenarien, die wir bisher allenfalls aus Science-Fiction-Filmen kennen.

Nehmen wir nur mal die Robotik. Bei der Entwicklung von humanoiden Robotern haben Wissenschaftler in den letzten Jahren mit KI-Hilfe bereits bedeutende Fortschritte gemacht. Eine der größten Herausforderungen bleibt jedoch die Imitation des aufrechten Gangs der Menschen. Mit optimierter Sensorik und erhöhter Rechenkapazität wurde die Entwicklung zwar vorangetrieben, aber bis zu einem geschmeidigen Gang der Humanoiden, der dem der Menschen gleicht, ist es noch ein weiter Weg.

Unterstützt durch „räumliche Intelligenz“ könnte es hier weitere Fortschritte geben. Humanoide Roboter könnten sich dann wie Menschen bewegen und mit ihrer räumlichen Umwelt sowie den Objekten darin interagieren. Zusammen mit der Weiterentwicklung der kommunikativen Fähigkeiten durch Generative KI ergeben sich vielfältige Einsatzszenarien, die kaum Grenzen kennen.

Humanoide Roboter, deren Motorik den menschlichen Fähigkeiten deutlich näherkommt, könnten unter anderem im Gesundheitswesen nützlich sein. Sie könnten Assistenzaufgaben in Krankenhäusern übernehmen und das Personal entlasten, indem sie zeitaufwändige Tätigkeiten außerhalb der Patientenversorgung ausführen. Im Pflegebereich könnten Roboter irgendwann auch körperlich schwere Aufgaben wie das Umlagern bettlägeriger Personen übernehmen. Am nächsten Schritt, dem vollwertigen Pflegeroboter, arbeiten bereits verschiedene Firmen und Forschungsinstitute. Sie wären eine Antwort auf den demografischen Wandel und den Pflegenotstand.

Doch auch ohne eigenen Körper kann eine um die räumliche Dimension erweiterte KI wichtige Aufgaben übernehmen. So könnte beispielsweise die Stadtplanung von Spatial Intelligence enorm profitieren. Ein solches KI-System könnte riesige Datenmengen aus verschiedenen Quellen wie Satellitenbildern, Verkehrsdaten, Bevölkerungsstatistiken und Umweltmessungen analysieren und daraus komplexe Zusammenhänge ableiten, die für menschliche Planer kaum erkennbar wären. Spannend wird es, wenn daraus konkrete Maßnahmen abgeleitet werden.

Dazu drei Beispiele:

  1. Mithilfe einer Analyse von Oberflächentemperaturen und Versiegelungsgraden lässt sich die Entstehung von Hitzeinseln in Städten prognostizieren. Durch entsprechende bauliche Gegenmaßnahmen können diese präventiv verhindert werden.
  2. Die Simulation von Extremwetterereignissen deckt Schwächen in der Infrastruktur auf und sorgt für ein verbessertes Risikomanagement.
  3. Die Verkehrssteuerung kann durch adaptive Ampelschaltungen, die auf aktuellem und prognostiziertem Verkehrsaufkommen basieren, vollständig digitalisiert werden.

Spatial Intelligence für die Versicherungswirtschaft

Im Tech Trend Radar 2025 von ERGO und Munich Re gehört Spatial Intelligence zu den großen Trends, die die Versicherungsbranche beeinflussen. Versicherer können beispielsweise Risiken präziser einschätzen, wenn Geodaten, Satellitenbilder und Drohnenaufnahmen in die KI-Analyse integriert werden. Auch bei Naturkatastrophen wie Überschwemmungen oder Stürmen ermöglicht räumliches Verständnis eine genauere Schadensvorhersage. Immobilien lassen sich virtuell begehen und bewerten, ohne dass ein Gutachter vor Ort sein muss.


Was für den nächsten Entwicklungssprung noch fehlt

Die Fortschritte sind bereits jetzt mehr als beeindruckend. Die Umsetzung von „Spatial Intelligence“ wäre jedoch mehr als nur ein technisches Upgrade: Sie wäre der logische nächste Schritt in der Evolution künstlicher Intelligenz. Doch noch ist es nicht soweit. Gerade das Verständnis physikalischer Gesetze wie Schwerkraft, Reibung, Elastizität, Beschleunigung oder Dynamik stellt noch eine große Hürde dar. Aber es gibt auch ganz pragmatische Hürden. So ist die Qualität und Verfügbarkeit von 3D-Daten noch nicht annähernd ausreichend – gerade im Vergleich mit den 2D-Daten, die die Large Language Models so leistungsfähig gemacht haben. Und letztlich fehlen noch geeignete Algorithmen, die aus einem 3D-Verständnis einer KI und den hochwertigen 3D-Daten ein verlässliches und effizientes Large World Model entstehen lassen. Erst dann wäre Spatial Intelligenz eine digitale Bereicherung für unsere reale Welt.

Text: Falk Hedemann


Ihre Meinung
Wenn Sie uns Ihre Meinung zu diesem Beitrag mitteilen möchten, senden Sie uns bitte eine E-Mail an: radar@ergo.de


Weitere Magazin-Beiträge