3 Minuten Lesezeit

Bin-Picking mit 3D-Vision und KI: Der technische Leitfaden für Experten

3D-Rendering einer Bin-Picking-Roboterzelle mit 3D-Kamera, Punktwolken-Overlay und KI-Netzwerkvisualisierung, Roboter greift Metallteil aus Teilebehälter
Autor
Dominik Grub
Veröffentlicht
11.02.2026

Künstliche Intelligenz – Das Gehirn hinter dem Sehen

Eine 3D-Kamera liefert lediglich Rohdaten (Punktwolken). Damit der Roboter „versteht“, was er sieht, benötigt er ein Gehirn. Hier kommt Machine Learning (ML), insbesondere Deep Learning, ins Spiel. Es ersetzt starre, regelbasierte Algorithmen durch lernfähige Systeme.

Wie Machine Learning die Bildverarbeitung revolutioniert

Klassische Bildverarbeitung erforderte mühsame Programmierung fester Regeln („Wenn Pixel A hell und Pixel B dunkel ist…“). Machine Learning dreht diesen Prozess um: Es lernt aus Beispielen.

Der Prozess im Überblick:

  1. Training: Wir füttern das System mit tausenden Bildern (z.B. eines Bolzens M6) aus unterschiedlichen Perspektiven.
  2. Learning: Das neuronale Netz erkennt selbstständig die relevanten Merkmale (Kanten, Oberflächenstrukturen, Geometrie).
  3. Inference: Im laufenden Betrieb wendet das System dieses Wissen an, um den Bolzen auch in völlig neuen, unbekannten Lagen sicher zu identifizieren.

Die drei entscheidenden Vorteile von ML:

  • Robustheit: Das System lässt sich nicht durch leichte Abweichungen (Kratzer, leichte Verschmutzung) irritieren.
  • Flexibilität: Ein neues Bauteil erfordert keine neue Programmierung, sondern lediglich ein Nachtraining mit neuen Fotos.
  • Speed: Die eigentliche Erkennung (Inference) erfolgt in Echtzeit, oft in unter 100 Millisekunden.

Deep-Dive: Training vs. Inference

Um die Technologie zu beherrschen, ist die Unterscheidung zwischen der „Lernphase“ (Training) und der „Arbeitsphase“ (Inference) essenziell.

1. Das Training (Die Vorbereitungsphase)

Die Qualität der KI steht und fällt mit den Trainingsdaten. DEDOS übernimmt hier die Erstellung eines robusten Datasets für Ihre Bauteile:

  • Positive Samples: 3D-Punktwolken des Teils aus jedem denkbaren Winkel.
  • Negative Samples: Objekte, die nicht gegriffen werden sollen (z.B. Kistenränder, falsche Teile).
  • Edge Cases: Schwierige Szenarien wie übereinanderliegende Teile oder Halbschatten.

Wir nutzen dafür etablierte Frameworks wie TensorFlow oder PyTorch sowie die spezialisierten Teach-Umgebungen der Vision-Hersteller (z.B. Photoneo PhoXi Interface oder Pickit 3D Teach).

2. Die Inference (Die Laufzeitumgebung)

In der produktiven Anlage läuft das fertig trainierte Modell auf leistungsstarker Hardware. Ein Industrial PC (z.B. Beckhoff CX2040 oder Siemens SIMATIC IPC) fungiert als Rechenzentrum der Zelle:

  1. Empfang: Die 3D-Punktwolke der Kamera trifft ein.
  2. Verarbeitung: Das ML-Modell analysiert die Datenwolke.
  3. Output: Die exakte Pose (Position X,Y,Z + Orientierung A,B,C) des am besten greifbaren Teils wird an die SPS und den Roboter gesendet.
3D-Rendering mit Gegenüberstellung von KI-Training und Inference für 3D-Vision, Punktwolken-Scans, Industrial PC und Roboterzelle mit Bin-Picking
Visualisierung von Trainingsdaten, Punktwolken und Inference-Ausgabe in einer industriellen 3D-Vision-Roboterzelle

Praxis-Lösungen für typische Herausforderungen

In der Theorie klingt KI perfekt, doch die Realität in der Fertigungshalle hält Tücken bereit. So löst DEDOS die häufigsten Probleme:

Challenge 1: Transparente und reflektierende Teile

Das Problem: Glas, Folienverpackungen oder hochglanzpoliertes Metall verfälschen das Lichtsignal der Kamera.
Die DEDOS-Lösung: Wir kombinieren Hardware-Tricks mit Software-Intelligenz. Einsatz von polarisationsfilternden Optiken und Mehrfach-Beleuchtung aus unterschiedlichen Winkeln. Das KI-Modell wird spezifisch darauf trainiert, die typischen Verzerrungen und Reflexionen als Teil des Objekts zu interpretieren, statt sie als Fehler zu werten.

Challenge 2: „Verhakte“ und verschachtelte Teile (Bin-Emptying)

Das Problem: Teile liegen so eng oder ineinander verkeilt, dass die Konturen für den Computer verschwimmen.
Die DEDOS-Lösung: Nutzung von Edge-Enhancement-Algorithmen zur Kantenschärfung. Zudem trainieren wir das Modell explizit mit Bildern von „verworrenen“ Haufen. Die Strategie: Der Roboter greift priorisiert die „blockierenden“ Teile, um den Haufen aufzulösen, bevor er die eigentlichen Zielobjekte greift.

Challenge 3: Wechselnde Lichtverhältnisse

Das Problem: Oberlichter, wandernde Sonnenstände oder Hallenbeleuchtung stören die Kamera.
Die DEDOS-Lösung: Primär setzen wir auf Structured Light-Systeme, die aufgrund ihrer hohen Lichtintensität sehr robust gegen Fremdlicht sind. Zusätzlich verbauen wir optische IR-Filter (Infrarot), die nur das Licht des Projektors durchlassen, und kalibrieren die Anlage auf konstante Bedingungen.

3D Rendering einer industriellen Bin Picking Anlage mit Roboterarm, 3D Kamera, Punktwolken Analyse und KI Vision zur Erkennung komplexer Bauteile
Industrieroboter mit 3D Vision System analysiert Bauteile in einem Teilebehälter und greift ein Werkstück

KI macht den Unterschied zwischen „Sehen“ und „Verstehen“

Die Integration von Künstlicher Intelligenz und Machine Learning ist der entscheidende Faktor, der modernes Bin-Picking von den starren, fehleranfälligen Systemen der Vergangenheit unterscheidet. Während die 3D-Vision-Hardware (die Kamera) die notwendigen Rohdaten liefert, ist es erst die KI-Software (das Gehirn), die diese Daten nutzbar macht.

Für Sie als Anwender bedeutet dieser Technologie-Sprung drei wesentliche Vorteile:

  1. Prozesssicherheit: Die Fähigkeit der KI, auch unter schwierigen Bedingungen (Reflexionen, Verschmutzung, chaotische Lage) zuverlässig zu erkennen, reduziert Stillstandszeiten drastisch.
  2. Zukunftssicherheit: Das System ist nicht „festverdrahtet“. Neue Produktvarianten oder geänderte Teilegeometrien erfordern kein teures Umprogrammieren, sondern lediglich ein schnelles Nachtraining.
  3. Geschwindigkeit: Durch die Trennung von aufwendigem Training (offline) und blitzschneller Inference (online) wird Bin-Picking erstmals schnell genug für hochproduktive Taktzeiten.

Doch das beste „Auge“ und das schlauste „Gehirn“ nützen nichts, wenn die Hand nicht weiß, wie sie zugreifen soll. Im nächsten Blogbeitrag betrachten wir daher das Path Planning – die Kunst, den Roboterarm kollisionsfrei und auf dem schnellsten Weg zum erkannten Ziel zu führen.

Inhaltsverzeichnis

Kontaktieren Sie uns!

Entdecken Sie, wie unsere Dienstleistungen im Maschinen- und Anlagenbau Ihr nächstes Projekt voranbringen können. Nehmen Sie noch heute Kontakt auf, um eine persönliche Beratung zu erhalten und gemeinsam neue Möglichkeiten zu erschließen.