Bin-Picking mit 3D-Vision und KI: Der technische Leitfaden für Experten
Künstliche Intelligenz – Das Gehirn hinter dem Sehen
Eine 3D-Kamera liefert lediglich Rohdaten (Punktwolken). Damit der Roboter „versteht“, was er sieht, benötigt er ein Gehirn. Hier kommt Machine Learning (ML), insbesondere Deep Learning, ins Spiel. Es ersetzt starre, regelbasierte Algorithmen durch lernfähige Systeme.
Wie Machine Learning die Bildverarbeitung revolutioniert
Klassische Bildverarbeitung erforderte mühsame Programmierung fester Regeln („Wenn Pixel A hell und Pixel B dunkel ist…“). Machine Learning dreht diesen Prozess um: Es lernt aus Beispielen.
Der Prozess im Überblick:
- Training: Wir füttern das System mit tausenden Bildern (z.B. eines Bolzens M6) aus unterschiedlichen Perspektiven.
- Learning: Das neuronale Netz erkennt selbstständig die relevanten Merkmale (Kanten, Oberflächenstrukturen, Geometrie).
- Inference: Im laufenden Betrieb wendet das System dieses Wissen an, um den Bolzen auch in völlig neuen, unbekannten Lagen sicher zu identifizieren.
Die drei entscheidenden Vorteile von ML:
- Robustheit: Das System lässt sich nicht durch leichte Abweichungen (Kratzer, leichte Verschmutzung) irritieren.
- Flexibilität: Ein neues Bauteil erfordert keine neue Programmierung, sondern lediglich ein Nachtraining mit neuen Fotos.
- Speed: Die eigentliche Erkennung (Inference) erfolgt in Echtzeit, oft in unter 100 Millisekunden.
Deep-Dive: Training vs. Inference
Um die Technologie zu beherrschen, ist die Unterscheidung zwischen der „Lernphase“ (Training) und der „Arbeitsphase“ (Inference) essenziell.
1. Das Training (Die Vorbereitungsphase)
Die Qualität der KI steht und fällt mit den Trainingsdaten. DEDOS übernimmt hier die Erstellung eines robusten Datasets für Ihre Bauteile:
- Positive Samples: 3D-Punktwolken des Teils aus jedem denkbaren Winkel.
- Negative Samples: Objekte, die nicht gegriffen werden sollen (z.B. Kistenränder, falsche Teile).
- Edge Cases: Schwierige Szenarien wie übereinanderliegende Teile oder Halbschatten.
Wir nutzen dafür etablierte Frameworks wie TensorFlow oder PyTorch sowie die spezialisierten Teach-Umgebungen der Vision-Hersteller (z.B. Photoneo PhoXi Interface oder Pickit 3D Teach).
2. Die Inference (Die Laufzeitumgebung)
In der produktiven Anlage läuft das fertig trainierte Modell auf leistungsstarker Hardware. Ein Industrial PC (z.B. Beckhoff CX2040 oder Siemens SIMATIC IPC) fungiert als Rechenzentrum der Zelle:
- Empfang: Die 3D-Punktwolke der Kamera trifft ein.
- Verarbeitung: Das ML-Modell analysiert die Datenwolke.
- Output: Die exakte Pose (Position X,Y,Z + Orientierung A,B,C) des am besten greifbaren Teils wird an die SPS und den Roboter gesendet.

Praxis-Lösungen für typische Herausforderungen
In der Theorie klingt KI perfekt, doch die Realität in der Fertigungshalle hält Tücken bereit. So löst DEDOS die häufigsten Probleme:
Challenge 1: Transparente und reflektierende Teile
Das Problem: Glas, Folienverpackungen oder hochglanzpoliertes Metall verfälschen das Lichtsignal der Kamera.
Die DEDOS-Lösung: Wir kombinieren Hardware-Tricks mit Software-Intelligenz. Einsatz von polarisationsfilternden Optiken und Mehrfach-Beleuchtung aus unterschiedlichen Winkeln. Das KI-Modell wird spezifisch darauf trainiert, die typischen Verzerrungen und Reflexionen als Teil des Objekts zu interpretieren, statt sie als Fehler zu werten.
Challenge 2: „Verhakte“ und verschachtelte Teile (Bin-Emptying)
Das Problem: Teile liegen so eng oder ineinander verkeilt, dass die Konturen für den Computer verschwimmen.
Die DEDOS-Lösung: Nutzung von Edge-Enhancement-Algorithmen zur Kantenschärfung. Zudem trainieren wir das Modell explizit mit Bildern von „verworrenen“ Haufen. Die Strategie: Der Roboter greift priorisiert die „blockierenden“ Teile, um den Haufen aufzulösen, bevor er die eigentlichen Zielobjekte greift.
Challenge 3: Wechselnde Lichtverhältnisse
Das Problem: Oberlichter, wandernde Sonnenstände oder Hallenbeleuchtung stören die Kamera.
Die DEDOS-Lösung: Primär setzen wir auf Structured Light-Systeme, die aufgrund ihrer hohen Lichtintensität sehr robust gegen Fremdlicht sind. Zusätzlich verbauen wir optische IR-Filter (Infrarot), die nur das Licht des Projektors durchlassen, und kalibrieren die Anlage auf konstante Bedingungen.

KI macht den Unterschied zwischen „Sehen“ und „Verstehen“
Die Integration von Künstlicher Intelligenz und Machine Learning ist der entscheidende Faktor, der modernes Bin-Picking von den starren, fehleranfälligen Systemen der Vergangenheit unterscheidet. Während die 3D-Vision-Hardware (die Kamera) die notwendigen Rohdaten liefert, ist es erst die KI-Software (das Gehirn), die diese Daten nutzbar macht.
Für Sie als Anwender bedeutet dieser Technologie-Sprung drei wesentliche Vorteile:
- Prozesssicherheit: Die Fähigkeit der KI, auch unter schwierigen Bedingungen (Reflexionen, Verschmutzung, chaotische Lage) zuverlässig zu erkennen, reduziert Stillstandszeiten drastisch.
- Zukunftssicherheit: Das System ist nicht „festverdrahtet“. Neue Produktvarianten oder geänderte Teilegeometrien erfordern kein teures Umprogrammieren, sondern lediglich ein schnelles Nachtraining.
- Geschwindigkeit: Durch die Trennung von aufwendigem Training (offline) und blitzschneller Inference (online) wird Bin-Picking erstmals schnell genug für hochproduktive Taktzeiten.
Doch das beste „Auge“ und das schlauste „Gehirn“ nützen nichts, wenn die Hand nicht weiß, wie sie zugreifen soll. Im nächsten Blogbeitrag betrachten wir daher das Path Planning – die Kunst, den Roboterarm kollisionsfrei und auf dem schnellsten Weg zum erkannten Ziel zu führen.
Inhaltsverzeichnis
Kontaktieren Sie uns!
Weiterführende Einblicke und Innovationen
Entdecken Sie weitere spannende Artikel, die tiefere Einblicke in die Welt des Maschinenbaus und verwandte Technologien bieten.