Use Case
Effektive Kreislaufwirtschaft: Roboter für eine bessere Trennung von Wertstoffen

Use Case im Überblick
Branche: Abfall-/Recyclingwirtschaft
Aufgabe: Einsatz von Pick-and-Place-Robotern, um Wertstoffe präzise zu trennen und spezifische oder problematische Objekte auszusortieren
Methode: verstärkendes Lernen, Ensemble Learning, Transfer Learning und weitere
Allgemeines
Eine effiziente Kreislaufwirtschaft ist ausschlaggebend, um die EU-weiten Umwelt- und Klimaziele bzw. die Nachhaltigkeitsziele der Vereinten Nationen (Agenda 2023) zu erreichen (vgl. Circular Economy Initiative Deutschland 2020). Wichtig ist dabei auch eine stärkere Automatisierung beim Recycling, um sowohl Präzision wie auch Kosten- und Ressourceneffizienz zu erhöhen. Aber auch, um dem Fachkräftemangel zu begegnen und unangenehme oder gar gefährdende Tätigkeiten an Maschinen auszulagern. Lernfähige Robotik, insbesondere das Lernen aus der Mensch-Maschine- oder auch Roboter-Roboter-Interaktion kann dazu beitragen, diese Ziele zu erreichen. Klassische Pick-and-Place-Roboter kommen hierbei zum Einsatz, um an Förderbändern Wertstoffe präzise zu trennen und spezifische oder problematische Objekte auszusortieren wie beispielsweise Elektronik, Batterien oder Schadstoffe.
Status quo
Für die Mülltrennung existieren bereits gut funktionierende technische Lösungen. Menschen müssen dabei aber oft immer noch mithelfen, was meist zumindest belastend, manchmal auch gesundheitsschädlich oder gar gefährlich ist. Die Mülltrennung erreicht jedoch oft nicht die gewünschte Qualität und stößt dabei auch oft an Kapazitätsgrenzen, was die Qualität einer sauberen Mülltrennung zusätzlich senken kann. Pick-and-Place-Roboter werden heute schon breit eingesetzt und sind vergleichsweise günstig. Im Zusammenspiel mit geeigneter Sensorik könnten sie das manuelle Herausgreifen von Objekten in den Sortieranlagen automatisieren.
Zukunftsperspektiven
Lernen durch Interaktion kann dazu beitragen, dass über Zwischenschritte der Teilautomatisierung (Stichwort: variable Autonomie) höhere Autonomiegrade im Recycling erreicht werden und sukzessive mit jeder Interaktion auch die Robustheit der nötigen KI-Modelle gestärkt wird. Ein auf diese Weise verbessertes Recycling kann zu einem zentralen Bestandteil einer Kreislaufwirtschaft werden, insbesondere aufgrund multimodaler Sensorik wie beispielsweise der Detektion verborgener oder zu demontierender Objekte. Zudem stellt es eine Vorstufe zu weiteren Betriebsstationen dar, wie der Demontage, in der aussortierte Wertstoffe zerlegt und auch Rohstoffe wiedergewonnen werden. Innerhalb von bereits bestehenden Anlagen, in denen klassische Methoden der Müllsortierung angewandt werden, können lernfähige Robotiksysteme komplementär eingesetzt werden (z. B. zur Qualitätssteigerung und -sicherung).
So werden in mehrfacher Hinsicht Potenziale frei:
- Freisetzung von Arbeitskraft für Aufgaben mit höherer Wertschöpfung durch Rationalisierung von unattraktiven, unangenehmen oder potenziell gefährlichen Arbeitsprozessen
- Erhöhte Sicherheit für Menschen vor Gefahrstoffen und gefährlichen Objekten
- Betriebswirtschaftliche Vorteile bei perspektivischer Vollautomatisierung: Günstigere Betriebsbedingungen sowie ggf. Wegfall von an Menschen angepassten (Sicherheits-)Bedingungen (Lüftung, Arbeitsraum, Unfallschutz etc.)
Quellen des Lernens
- Beobachten menschlicher Aktivitäten, z. B. Lernen durch Demonstration (Was greift der Mensch wie?)
- Hinweise des Menschen auf entferntere, zu sortierende Objekte, z. B. Zeigen mit einem Laserpointer oder auf übertragenen Kamerabildern des Förderbandes
- Kommentierung durch den Menschen in der Lernphase, z. B. Benennung von Objekten, Materialien.
- Menschliche (verbale) Kommentierung oder Instruktion, um Affordanzen (Objekt ist greifbar, anhebbar etc.) oder Greif-Fähigkeiten zu lernen
- Simultanes Lernen von allen menschlichen Instruktorinnen und Instruktoren an mehreren Förderbändern; so kann jede Roboterinstanz von den gelernten Fähigkeiten anderer Instanzen profitieren, z. B. Erkennen eines Objekts oder Ausführen eines Griffs
Benötigte Daten
In realen Umgebungen können Daten von eingebauten Sensoren und beteiligten Robotern (z. B. Daten zu erlernten Bewegungen) gesammelt werden. Zudem liegen ggf. Daten aus (früheren) Recyclingarbeiten vor oder aus der Vorbereitung und Übung dafür. Die Sensorik wird auch für die Objekt- bzw. Materialbeobachtung eingesetzt. Diese geht weit über die menschliche Wahrnehmung hinaus und stellt einen großen Vorteil beim Einsatz von Robotern dar, wie beispielsweise 3D-Kameras, Radar-, THz-, IR-Sensoren, Multi- und Hyperspektralkameras, magnetische Sensoren, Bar-Code und Matrix-Code-Leser zur Objektidentifikation oder zum Zeichenlesen. Die entsprechend erfassten Sensordaten werden systematisch gesammelt und verbunden (Data Fusion), um beispielsweise Objekte idealerweise auch bei Materialüberlagerungen akkurat erkennen zu können und wertvolle Lerndatensammlungen inklusive Metadaten zu erstellen. Eine vollständige Dokumentation wird auch zur Qualitätssicherung angelegt.
Methoden des Lernens
- Reinforcement Learning (bestärkendes Lernen)
- Ensemble Learning (gemeinsames Lernen, z. B. Boosting, föderiertes Lernen)
- Few-shot Learning (KI-Modelle entwickeln mit geringen Datenmengen)
- Lernen im Team (bei mehreren Robotern)
- Transfer Learning (verschiedene Domänen, z. B. zwischen örtlich getrennten Recyclinganlagen)
- Selbstlernen/Weiterlernen ab einer gewissen Ergebnisqualität des Robotereinsatzes
Qualitätssicherung
- (Statistische) Analyse durch qualifizierte Lehrkräfte, andere Teammitglieder und/oder externe technische Mittel (nachgelagerte Laboruntersuchungen): Vergleich von Ergebnissen der Roboteraktion(en) und Handlungsabläufe (insbesondere Interaktion) mit Zielen und Aufwänden, aber auch Verlusten
- Bestehende Technologien zur Qualitätskontrolle im Recycling
- Gelernte Handlungsabläufe könnten unter gleichen oder anderen (realen oder virtuellen) Bedingungen zur Qualitätsbeurteilung ausgeführt und bewertet werden
- Überprüfung von Sortierergebnissen in einer Lernphase, um Feedback (z. B. Falsch- oder Richtigklassifikation) für bestärkendes Lernen zu sammeln (chargenweise Eingabe von
Feedback, in sogenannten Batches) - Auswertung der Dokumentation der Datensammlung
Systemvoraussetzungen
- Es können handelsübliche schnelle Pick-and-Place-Roboter genutzt werden, wobei Sensoren und maschinelle Intelligenz von diesen abgesetzt und verteilt sein können.
- Die Roboter und Sensoren können über die Bandbewegung synchronisiert werden. Durch die Trennung können menschliche Instruktorinnen und Instruktoren von Robotern separat arbeiten, sodass die funktionale Sicherheit (Safety) gewährleistet ist.
- Die Roboter bzw. das Gesamtsystem müssen in der Lage sein, unterschiedliche Lernmethoden anzuwenden, um intelligent agieren zu können, sodass eine reibungslose Kommunikation wie Interaktion unter den Robotern und mit dem Menschen sowohl in realen als auch simulierten Umgebungen möglich ist.
- Das System muss über entsprechende Sensorik, Aktuatorik und KI-Modelle verfügen und (ähnlich wie der Mensch) fähig sein, aus nur wenigen Wiederholungen zielgerichtet zu lernen (vgl. Few-shot Learning). Dafür könnten virtuelle Umgebungen (inkl. benötigter Interfaces) notwendig werden, um interaktives Lernen umzusetzen.
- Gelernte Aktionen müssen in der nötigen Geschwindigkeit ausgeführt werden, wobei ausreichend akkurate Lokalisierung und Greifabschätzung gewährleistet werden müssen.
- Neben dem maschinellen Lernen werden auch andere KI-Methoden eingesetzt wie regelbasierte Systeme zur Absicherung der Robotiksysteme. KI-Modelle sollten zudem überwacht werden (Model Monitoring), um diese ggf. an Veränderungen der realen Umgebung anzupassen und so die Robustheit der KI-Modelle zu erhalten.
- Schließlich werden Auswertungsalgorithmen und -systeme benötigt sowie eine Wartungsinfrastruktur (z. B. Reparaturen und Reinigung von Robotern und Sensoren, Software-Updates).
Weitere Voraussetzungen
Um das gesellschaftliche Verständnis für die Chancen, Herausforderungen sowie Hintergründe der KI unterstützten Müllsortierung zu fördern, sollten insbesondere die direkt beteiligten Personen bzw. deren Interessenvertretende sowie weitere Stakeholder (z. B. Abfallverwertungsunternehmen, Arbeitnehmervertretungen, Gewerkschaften, Berufsgenossenschaften) schon in der Entwicklungsphase eingebunden werden. Instruktorinnen bzw. Instruktoren benötigen zudem die entsprechenden Fähigkeiten, um Roboter anzulernen. Bei der Umsetzung muss der gesetzliche Rahmen, insbesondere die Datenschutzgrundverordnung (DSGVO), beachtet und eingehalten werden. Darüber hinaus werden Szenarien (z. B. Use Cases in konkreten Unternehmen) benötigt. Insgesamt muss der Umsetzungsaufwand vertretbar bleiben, damit der Transfer in die Praxis eine realistische Unternehmung darstellt.
Realisierung und mögliche Hürden
Demonstratoren mit einem Technologiereifegrad (TLR) 5 existieren bereits, beispielsweise für das Aussortieren von Batterien (siehe: Kompetenzzentrum ROBDEKON). Ein Systemprototyp mit TRL 6 oder TRL 7, und somit ein bereits funktionierendes System in der realen Einsatzumgebung, sollte aufgrund der verfügbaren Komponenten bei einem entsprechenden Entwicklungspilotprojekt in ein bis zwei Jahren technisch umsetzbar sein. Es bedarf der Demonstration der Machbarkeit des Use Cases sowie einer besseren Kommunikation über die Vorteile für die Beteiligten (Win-win-Situation). Zudem stellt die systematische, menschenzentrierte Integration (teil-)autonomer Robotiksysteme in die betriebliche Praxis eine Herausforderung dar (siehe Whitepaper „Einführung von KI-Systemen in Unternehmen“, Plattform Lernende Systeme).
(Einschätzung I Stand 06/2024)
Entwickelt wurde dieser Use Case mit Expertise aus der Arbeitsgruppe „Lernfähige Robotiksysteme“ der Plattform Lernende Systeme, insbesondere von Prof. Dr. Jürgen Beyerer (KIT Karlsruhe, Fraunhofer IOSB)