fbpx

KI-gestützte Image Recognition bzw. Bilderkennung – Potenzial und Einsatz – Teil 1

KI-gestützte Bildanalyse-Tools sind echte Optimierungs- und Automatisierungstalente. Doch wo setze ich sie ein im Unternehmen? Wir geben euch Inspiration und Praxisbeispiele aus verschiedensten Bereichen.

Diesen Artikel teilen

Share on facebook
Share on twitter
Share on linkedin
Share on xing
Share on email

Beim Thema KI ist das Interesse vieler Unternehmer schnell geweckt. Sie schafft neue Möglichkeiten an Stellen, an denen Mensch und System bisher an ihre Grenzen stoßen. Besonders Bildanalyse-Systeme sind auf dem Vormarsch. Oft fehlt es jedoch an Inspiration. Wo könnte eine KI in meiner Firma eingesetzt werden zur Prozessoptimierung oder Automatisierung? Wo wird vielleicht mit Bildern gearbeitet, ohne dass es mir bewusst ist?

Dieser zweigeteilte Artikel liefert einige Beispiele aus dem Bereich KI via Bildanalyse bzw. Image Recognition aus verschiedensten Branchen und Firmenbereichen. Nicht alle genannten Systeme sind reine Bilderkennungs-Technologien, beinhalten diese aber mindestens.


TEIL 1


Tools, die den Alltag bereichern

Momentan noch nicht allzu bekannt, aber interessant ist Google Clips – Eine kleine Kamera mit Bildanalyse-KI. Sie wird aufgestellt und bei Aktivität im Sichtbereich werden automatisch Bilder aufgenommen. Der integrierte Service entscheidet dann, welche Aufnahmen es wert sind, behalten zu werden. Sowohl im Privat- als auch im Sicherheitsbereich könnte das Tool praktisch sein und das Filtern manueller Aufnahmen ablösen. 
Eine weitere Innovation aus dem Hause Google ist die Objekterkennung mit Google Lens, bei der die Bildanalyse ebenfalls ihren Anteil hat. So können z. B. Texte übersetzt oder Vorgelesen werden – insbesondere für Fremdsprachler oder sehbehinderte Menschen eine große Bereicherung! Sollten ARCore-kompatible Android-Smartphones bald Standard sein, dürfte diese Funktion für jeden nutzbar sein. 
EyeEm bietet eine KI für die automatische, Algorithmen-gesteuerte Bild-Verschlagwortung. Direkt beim Upload jedes einzelnen Bildes wird dieses indexiert und eingeordnet. Das Tool könnte für Firmen interessant sein, die über große Datenbanken mit Bildmaterial verfügen, aber auch für Privatpersonen, die viel fotografieren. 
Die bisherigen Bilderkennungssysteme können zwar Objekte identifizieren, haben in der Regel aber Probleme mit der menschlichen Anatomie. Die Firma Twenty Billion Neurons versucht daher, ihrer KI ein kognitives Verständnis zu geben. Dafür wurde eine Datenbasis an Bild- und Videomaterial angelegt, bei dem Menschen verschiedene Gesten nachstellen. Mit dem visuellen Lehrmaterial wurde die KI fortlaufend trainiert. Daraus entstand mittlerweile ein digitaler Avatar namens Millie, mit dem in Echtzeit kommuniziert werden kann. Die große Vision bestand unter anderem darin, die KI später in der Automobilbranche oder im Einzelhandel einzusetzen. So könnten z. B. Kunden im Supermarkt durch Roboter betreut werden.
Für Kreative dürfte eine Anwendung zum Nachkolorieren interessant sein, die vor allem im Illustrations- und Manga-Bereich für Begeisterung sorgt. Mit Style2paints V4 erhält man ein KI-gesteuertes Lineart-Kolorierungswerkzeug. Es ist das erste System, das im Unterschied zu früheren End-to-End-Bild-zu-Bild-Übersetzungsmethoden, eine Linie im realen Arbeitsablauf einfärbt. Das Besondere hierbei: Anders als bei allen früheren AI-gesteuerten Kolorierungswerkzeugen, handelt es sich bei den Ergebnissen nicht um einzelne JPG oder PNG-Bilder, sondern um PSD-Ebenen. Möglich sind unter anderem vollautomatische Färbungen. Die Benutzer müssen nur ihre Skizze hochladen, einen Stil auswählen und eine Lichtquelle platzieren.
Einen Schritt weiter geht noch die Firma nvidia. Durch eine KI können Fotos mit realistischem Ergebnis gezeichnet werden. So entsteht aus ein paar Strichen und einem blauen Klecks wie von Zauberhand ein See mit Schilf.


Auto und öffentliche Verkehrsmittel

Droht nach dem Hitzesommer eventuell der Extremwinter? Falls ja, dann gibt es ja bald Wetterkameras, die so manche Stadtverwaltung entlasten könnten. Sie erkennen Schnee und beauftragen automatisch den Räumdienst. Dadurch kommt es weniger zu verstopften Straßen, Unfällen und Stress im Alltag. In dem Zusammenhang lässt sich auch noch eine weitere Innovation nennen, die auf Stadtebene interessant sein könnte: Bild- und Videoanalyse-KI’s, die automatisch Fahrgäste zählen. So lässt sich der Bedarf an öffentlichen Verkehrsmitteln besser einschätzen.
Der in Deutschland nicht erlaubte Mitnahmedienst Uber hat eine KI entwickelt, die Betrunkene erkennen soll. Das System soll verändertes Nutzerverhalten erkennen wie z. B. Gehgeschwindigkeit, ungewöhnliche Tippfehler, Torkeln oder der Winkel des vom Nutzer gehaltenen Smartphones. Laut Patentantrag sollen die identifizierten Fahrgäste nicht abgelehnt, sondern mit entsprechend angepasstem Service bedient werden. Außerdem sollen andere Passagiere vor unschönen Fahrgemeinschaften beschützt werden. Uber steht in den Medien zwar unter viel Kritik, doch inspirierend ist die Idee allemal. 
Ein Traum jedes Pendlers könnte zudem bald wahr werden durch die autonome Autofahrt. Die Idee ist einfach: Man steigt ins Auto, kommuniziert diesem das Ziel und wird selbstständig hingefahren. Mittlerweile ist die Technik in diesem Bereich sehr weit, nicht zuletzt auch durch Bilderkennung und Sensornutzung. Zu klären ist hier allerdings noch die Frage nach Ethik und Verantwortung, besonders im Falle der Schuld bei Unfällen.


Gesundheitswirtschaft

Vor allem in der Gesundheitswirtschaft entfaltet sich das Potenzial der Bildanalyse mittels KI. Beispielsweise entwickelte das Fraunhofer-Institut für Integrierte Schaltungen mit “MCube” ein computergestütztes Mikroskopiesystem zur automatischen Aufnahme von Blutausstrichen und zur Detektion von Malariaerregern.
Mit Spannung blickt man aber vor allem auf die Innovationen im Krebs-Bereich, auch wenn diese in den Kinderschuhen steckt. In Zukunft sollen Ärzte bei der Bekämpfung von Tumoren auf verschiedenste KIs zurückgreifen können – von der Vorsorge über die Diagnose und Therapie bis hin zur Nachsorge. Für die Patienten eröffnen sich dadurch hochwirksame Behandlungsoptionen, die ihre Prognosen entscheidend verbessern. Bisher scheitert der Fortschritt allerdings nicht an den KI-Methoden, sondern an der elektronischen Patientenakte, die sich noch nicht durchgesetzt hat. Ohne genügend Patientendaten kann die KI nicht lernen.
In dieser Hinsicht haben zumindest die Radiologen Glück, denn Bilddaten aus MRT oder CT stehen meist genügend zur Verfügung. So existieren bereits Systeme, die das Brustkrebsrisiko bis zu fünf Jahre im Voraus erkennen können. Auch bösartige Veränderungen in der Leber können erkannt werden. An der Universität Harvard brachten Forscher einem KI-System bei, Blutzellen unter dem Mikroskop zu analysieren – das ist zum Beispiel wichtig, wenn der Arzt den Verdacht auf eine Leukämie hat. Der Radiologe M. Forsting (Direktor des Instituts für Diagnostische und Interventionelle Radiologie und Neuroradiologie am Universitätsklinikum Essen) hat mit seinem Team einem KI-System beigebracht, Aufnahmen von Gebärmutterhalskrebs zu analysieren. Mit einer Wahrscheinlichkeit von mehr als 95 Prozent sagt der Computer, ob die Patientin Metastasen in anderen Organen hat. Interessant ist auch eine Forschergruppe um den Dermatologen Holger Hänßle aus Heidelberg. Sie brachte einem KI-System bei, dermatologische Bilder zu analysieren, wodurch es nun besser Hautkrebs erkennt als ein Arzt. Auch Google entwickelte eine KI; sie erkennt Krebs in Lymphknoten. Als letztes Beispiel sei ein System genannt, das bösartige Nerventumore bei Kindern bestimmen kann, anhand des Musters von 28 Genen aus dem Tumor.
Neben der Krebsbehandlung könnten KI’s auch für die Diagnose und Therapie von Bewegungsstörungen von Bedeutung werden. Bisher sind Patienten stark von der Expertise des behandelnden Arztes abhängig. So konnten Bewegungsmuster nur erfasst werden, wenn die Patienten Markierungen auf dem Körper trugen. Bei Patienten mit einer Schüttellähmung  beispielsweise, war es jedoch sehr mühsam, die Marker anzubringen. Sie beeinträchtigten die Bewegungen des Patienten, wodurch die Analysen oft ungenau ausfielen. Das KI-Projekt „Deep Movement Diagnostics“ hingegen möchte eine rein videobasierte Bewegungsanalyse entwickeln, die anhand von Bewegungsmustern verschiedene Krankheiten erkennt. Mit dem Forschungsprojekt ist die Hoffnung verbunden, dass betroffene Patienten nicht mehr so weite Wege in Spezialkliniken auf sich nehmen müssen und die Analyse genauer ausfällt. Die Konzeption des Projektes startet Anfang 2020 und soll über einen Zeitraum von drei Jahren gehen.


Marketing

Im Bereich Marketing boomen vor allem Tools zur Verbesserung des Brandings und der Social Media Strategie. Da in sozialen Netzwerken die Bildsprache enorm hoch ist, sind KI’s im Bereich Bilderkennung hier nicht mehr weg zu denken. Mit Talkwalker zum Beispiel werden tagtäglich 150 Millionen Bilder und Videos analysiert um bestimmte Markenpräsenzen zu analysieren. So lässt sich herausfinden, auf welchen Kanälen die Zielgruppe wirklich aktiv ist, zudem behält man seine Reputation im Auge, identifiziert Influencer und erkennt frühzeitig Trends. Außerdem lassen sich rufschädigende Inhalte entdecken, bevor sie verbreitet werden, Konsumenten-Insights aufdecken und der wahre ROI messen.
Weitere Tools für die Wettbewerbsanalyse, Brand Management und Social Media Monitoring kommen von den Firmen Brandwatch, LogoGrab und Meltwater. Vom Brand Management, über Markt- und Mitbewerberanalysen bis hin zur Lead Generierung, finden Marketer hier eine umfassende Softwarelösung.

In diese Kategorie lässt sich auch unser Tool brainSocial einordnen. Es ist kein System mit starrer Performance, sondern ein beliebig kombinierbares Baukastensystem, das zahlreiche Aufgaben im Bereich der Bildanalyse lösen und erweitert werden kann. Bestimmte Personen oder Objekte finden z.B. in sozialen Netzwerken, Bilder nach definierten Merkmalen sortieren und übersichtlich auflisten – all das schafft er sekundenschnell, vollautomatisch und fortlaufend. Derzeit spezialisiert ist er auf die Instagram-Analyse zur Zielgruppendefinition und Verbesserung der Social Media Marketing Strategie bzw. des CRM. Weitere Informationen dazu finden Sie auf unserer Produktseite.

Für eine persönliche Beratung zum Thema Bilderkennung via KI können Sie uns gern kontaktieren. Wir beraten Sie individuell und finden eine effektive Lösung für Ihre Firma.

Teil 2 des Artikels erscheint in der kommenden Woche und befasst sich mit Image Recognition in den Bereichen des E-Commerce, „Schutz und Sicherheit“ sowie „Qualitätsmanagement in Produktion und Fertigung“.

Weitere Artikel