So lernen Roboter – Technologische Grundlagen

Sense – Understand – Plan – Act: So handeln Robotersysteme

Handlungen von Robotiksystemen lassen sich durch das Schema Sense – Understand – Plan – Act spezifizieren, das im Systembetrieb zyklisch abläuft:

Robotiksysteme agieren in der physischen Welt. In ihrem Handeln sind sie daher stets den Bedingungen und Gesetzmäßigkeiten von Zeit und Raum unterworfen. Ist der Mensch Teil ihrer Umgebung, müssen sie zudem den Anforderungen menschlicher Verhaltensweisen, Werte und dem menschlichen Wohlergehen Rechnung tragen. Um die Welt bzw. die Umgebung, in der sie agieren, interpretieren, verstehen sowie ggf. Handlungen planen und vollziehen zu können, müssen Robotiksysteme mit einer entsprechenden KI ausgestattet sein – einem so genannten Weltmodell.

Zunehmende Fähigkeiten: Typologie der Robotiksysteme  

Nach einer gängigen Definition ist Robotik die intelligente Verbindung von Wahrnehmung und Handlung. Mit fortschreitender technologischer Entwicklung und der Integration von Künstlicher Intelligenz nimmt das Fähigkeitsspektrum von Robotiksystemen zu.

Basale Robotiksysteme:

Hierbei handelt es sich um mechanische, akturierte, durch Computer oder den Menschen gesteuerte Systeme, die gegebenenfalls auch mit Manipulatoren ausgestattet sind (z.B. Greifer). Sie sind grundsätzlich programmierbar und im Gegensatz zu Automaten (vgl. Getränkeautomat) durch Reprogrammierung für unterschiedliche Zwecke einsetzbar (Multifunktionalität).

Reaktive Robotiksysteme:

In Erweiterung zu basalen Systemen sind reaktive Robotiksysteme mit Sensorik ausgestattet und in der Lage, in bestimmten Situationen reflexartig zu reagieren. Denkbar wären hierbei regelbasierte festgelegte Reflexe.

Intelligente Robotiksysteme

Wird die Fähigkeit zur Umgebungs- und Selbstwahrnehmung, zur Planung und Handlungsausführung sowie zur Modellierung der Umwelt hinzugezogen, kann von einem intelligenten Robotiksystem gesprochen werden. Hierbei wird beispielweise die Erkennung von Objekten (in sensorischen Signalen) eingesetzt sowie komplexere Algorithmen zur Planung und Ausführung von Handlungen.

Interaktion mit Elementen einer realen Umgebung:

Ist ein Robotiksystem in der Lage, sich – beispielsweise im laufenden Betrieb – an Veränderungen in seiner Umwelt anzupassen, indem es seine vorhandenen Fähigkeiten durch Lernen um neue erweitert, um so die Aufgabenumsetzung zu ermöglichen oder zu optimieren, kann von lernfähiger Robotik gesprochen werden.

Interaktive Robotiksysteme:

Hierbei handelt es sich um Systeme, die neben den vorhergehenden Fähigkeiten zudem in der Lage sind, (im laufenden Betrieb) in Interaktion mit einem Gegenüber oder mit Dingen aus der Umwelt treten zu können. Interaktion meint hierbei eine Wechselwirkung zwischen zwei Entitäten im Sinne von Aktion und Reaktion. Beispiel: Ein Roboter, dem eine bestimmte Handlung vorgeführt wird und der diese dann nachahmt.

Die verschiedenen Typen von Robotersystemen können nicht immer trennscharf voneinander abgegrenzt werden, kategoriale Überschneidungen sind möglich. So können Robotiksysteme beispielsweise intelligent und interaktiv, aber dennoch nicht lernfähig sein.

Kennzeichen lernfähiger Robotiksysteme

  • Lernfähige Robotiksysteme stellen – wie auch andere Robotiksysteme, die KI nutzen (z.B. für Umgebungs- und Selbstwahrnehmung) – Formen verkörperter KI Dies aufgrund ihrer physischen Präsenz und ihrer Fähigkeit, die Umgebung über Sensoren direkt wahrzunehmen, sich in ihrer Umgebung zu bewegen, dort zu agieren und diese zu beeinflussen sowie Feedback aus ihrer Umgebung aufzunehmen und auf dieser Basis Informationen über die Welt zu sammeln und auszuwerten.
  • Lernfähige Robotiksysteme sind nicht von ihrer Umgebung abgeschnitten, wie dies beim maschinellen Lernen häufig der Fall ist, wenn Modelle auf Basis großer, durch den Menschen generierter Datensätze über die Welt trainiert werden, etwa bei großen Text- und Bildmengen aus dem Internet.
  • Lernfähige Robotiksysteme sind in der Lage, auf der Basis von Sensorik, Verfahren der Situationsanalyse und Planerstellung sowie Aktuatorik (oder anderen Mitteln) in der physischen Welt zielgerichtet zu agieren sowie durch Analyse ihres oder fremden Agierens die Erfüllung von Aufgaben zu verbessern.
  • Der Zyklus „Sense, Understand, Plan und Act“ wird bei lernfähigen Robotiksystemen noch um die übergreifende Meta-Fähigkeit des Lernens erweitert:
    • Je nach Systemtyp können Daten, die im Zyklus und bei der Umsetzung der Aufgabe anfallen, analysiert und evaluiert werden. Diese Daten lassen sich für einen datengetriebenen Lernprozess nutzen, der zum Beispiel die Grundlage darstellen kann, sowohl die Aufgabenausführung zu verbessern als auch neue Fähigkeiten zu erlernen. Einbezogen werden können mittels entsprechender Sensorik oder Kommunikationskanäle auch Daten, die nicht unmittelbar bei Umsetzung der Aufgabe entstanden sind (z.B. wenn von Handlungen anderer Systeme gelernt wird).
    • Das Weltmodell des Systems kann so im besten Fall ebenfalls erlernt werden, das heißt, aus der Lernfähigkeit des Robotiksystems hervorgehen und zudem mit zunehmender Erfahrung verbessert werden.
  • Lernfähige Robotiksysteme nutzen mit Methoden des maschinellen Lernens trainierte Modelle, die im Betrieb weiter verbessert werden. So erweitern sie kontinuierlich ihre Wissensbasis und Fähigkeiten.
  • Lernen kann durch Erfahrung (Reinforcement Learning), aus festen Datensätzen (Offline Supervised Learning) oder durch Interaktion mit Nutzenden, anderen Robotiksystemen, allgemein durch menschliche Vorgaben oder über Fernsteuerung (Teleoperation) oder Teach-in erfolgen
  • Fortgeschrittene Systeme sollen ihr Verhalten selbstständig erlernen und anpassen, Strategien entwickeln sowie ein Weltmodell zu erlernen und aktualisieren.

Vielfältige Arten des Lernens durch Interaktion

Roboter lernen zunehmend durch direkte Interaktion – eine wichtige Voraussetzung für vielseitigere und anpassungsfähigere Robotiksysteme. Abhängig davon, mit wem ein Robotiksystem interagiert, kommen verschiedene Formen des Lernens zum Einsatz (siehe durch Interaktion aus Whitepaper KI in der Robotik):

Interaktion mit Lebewesen in realen Umgebungen:
  • Die Interaktion – häufig mit dem Menschen – kann auf Beobachtung und Imitation, Kollaboration oder Kommunikation beruhen.
    • Lernen von Demonstrationen: Roboter beobachten Menschen bei der Ausführung von Aufgaben oder werden direkt vom Menschen geführt. So können sie Abläufe nachahmen oder generalisieren, um diese flexibel auf neue Situationen anzuwenden.
    • Interaktives Reinforcement Learning: Roboter verbessern ihr Verhalten durch Feedback – explizit (z.B. über Spracheingabe) oder implizit, also dadurch, wie ihr Verhalten menschliches Verhalten, physiologische Reaktionen oder den Erfolg der Aufgabendurchführung beeinflusst.
Interaktion mit Menschen in virtueller Umgebung:

Roboter nutzen digitale Zwillinge oder simulierte Szenarien, um gefahrlos mit Menschen oder Objekten zu interagieren und daraus zu lernen.

Interaktion mit weiteren technischen Systemen in realen Umgebungen:

Roboter beobachten andere Maschinen, imitieren ihr Verhalten oder tauschen direkt Daten und Modelle aus.

Interaktion zwischen Robotiksystemen in virtuellen Umgebungen:

Roboter lernen aus der Interaktion zwischen virtuellen Repräsentationen in einer virtuellen Welt.

Interaktion mit Elementen einer realen Umgebung:

Roboter gewinnen Lernimpulse durch physische Interaktion mit realen Gegenständen, etwa zur Einschätzung von Gewicht oder Materialeigenschaften.

Interaktion mit Elementen einer virtuellen Umgebung:

Ähnlich wie im realen Raum können Roboter durch virtuelle Interaktion mit Objekten datenbasiert ihre Fähigkeiten verbessern.

Gestaltungsoptionen: Technologieentwicklung und Transfer beschleunigen

Lernfähige Robotik nutzt KI, Interaktionen und Simulation, um Roboter anpassungsfähiger und autonomer zu machen. Durch Lernen aus Interaktion können sie sich flexibel neuen Aufgaben und Umgebungen anpassen. Dies eröffnet den Weg zu einer schrittweisen (Teil-)Automatisierung in Bereichen, in denen dies bisher nicht möglich war, sowie zu einer intuitiven Anpassung von Robotiksystemen im laufenden Betrieb an neue Aufgaben und individuelle Anforderungen. Das Bundesforschungsministerium fördert diese Entwicklung unter anderem mit den und dem Aktionsplan Robotikforschung.

Um die Entwicklung interaktiver, lernfähiger Robotiksysteme weiter voranzutreiben, lauten aktuelle Anforderungen an Forschung und Entwicklung:

  • Synergien realisieren
  • technische Integration vorantreiben und Talente fördern
  • Sicherheitskonzepte (weiter-)entwickeln
  • Datenmangel adressieren
  • variable Autonomie, Anpassbarkeit und niedrigschwellige Bedienbarkeit vorantreiben
  • mit interaktivem Lernen in Simulationen und virtuellen Welten Offline-Fähigkeiten von Robotern optimieren
  • mit Edge AI das Lernen auf Robotiksysteme vorantreiben

 

Für einen raschen Transfer lernfähiger Robotiksysteme in Wirtschaft und Gesellschaft braucht es:

  • Transparenz über die Wirtschaftlichkeit lernfähiger Robotiksysteme
  • Gewinn von Vertrauen durch partizipative Projekte
  • eine Erleichterung des Transfers sowie der Forschung und Entwicklung mit Open Source
  • ein Vorantreiben von Reallaboren und Testumgebungen

 

Der Einsatz lernfähiger Robotersysteme erfordert zudem eine gesellschaftliche Diskussion, insbesondere zum Einsatz in sensiblen Bereichen wie Pflege und Medizin. Dabei sollten verschiedene Interessengruppen – einschließlich Betroffener – gemeinsam ethische Standards und den Grad individueller Entscheidungsautonomie erarbeiten. In besonders kontroversen Feldern könnten auch Bürgerräte einbezogen werden. Zudem sind Fragen der Finanzierung, Normung und Zertifizierung lernender Systeme zu klären, um ihren praktischen und wirtschaftlichen Einsatz zu ermöglichen.

 

Für eine ausführliche Darstellung von Gestaltungsoptionen siehe Whitepaper KI in der Robotik, S.37