Bilderkennung - Was ist das eigentlich?
KI ist nicht gleich KI
Pixelgenaue Segmentierung - Die Wunderwaffe


Das Original


Bildverarbeitung mit Bounding Boxen


Segmentierung des visioncheckouts
In der pink hinterlegten Maske liegen die Bereiche, die für die Erkennung berücksichtigt werden. Alles was sich auf dem 2. Bild innerhalb der Box befindet, fließt in die Erkennung ein. Oft funktioniert das, da der zu erkennende Gegenstand den größten Teil der Box ausmacht. Es gibt aber auch eine Vielzahl an Fällen, in denen die Boxen keine zufriedenstellende Erkennung liefern.
Anders funktioniert es auf dem dritten Bild, bei der pixelgenauen Segmentierung. Bei dieser Art der Bildverarbeitung wird keine starre Box um die Objekte gezogen. Anstatt dessen berechnet die KI passgenaue Masken, die die zu erkennenden Artikel umrahmen. So entstehen keine Überlappungen und jeder Artikel kann sicher und zuverlässig erkannt werden. Anhand einiger Beispiele werden die Unterschiede der beiden Arten der Bildverarbeitung sowie deren Konsequenzen deutlich.
Sich überlagernde Boxen






Unterschiedliche Hintergründe






Unterschiedliche Portionsgrößen





