Was tun, wenn die KI mit der Zeit an Performance verliert? Das Problem von Data Drift und wie man damit umgeht.

  Die Ausgangslage Wenn ein KI-System implementiert und live in Verwendung ist, erstellt es Vorhersagen, welche zum Beispiel einen Workflow in einer Firma optimieren, unterstützten, verbessern oder verschlanken. Das kann ein Kamerasystem sein, welches defekte Bauteile in einer Produktionslinie erkennt oder ein Modell, das Absatzprognosen für kommende Monate abgibt. Zu einem laufenden KI-System gibt es in der Regel auch ein Dashboard, welches Kennzahlen zu Eingangsparametern und Prognosen darstellt, aber auch Performances zur KI, wie Fehlerraten oder Berechnungszeiten angibt. Um also eine Verschlechterung der Performance der KI zu vermeiden, muss man die Änderungen in den Daten überwachen. Eine solche Änderung liegt vor, wenn sich die Beziehung zwischen Input- und Output-Daten ändert. Wenn beispielsweise die Regierung einen Lockdown verhängt, ändert sich abrupt das Kaufverhalten von Konsumenten, sodass die Absatzprognosen des Modells nicht mehr stimmen können. Ändert sich der Standort einer Maschine in der Fabrik,  würde das Kameramodell nicht mehr ganz so gut funktionieren, weil sich die Lichtverhältnisse geändert haben. Wir reden hier von abrupten Drifts, die nicht vorhersehbar und damit nicht modellierbar sind. Graduelle Drifts im Gegensatz dazu liegen vor, wenn sich die Verteilung der Daten über einen längeren Zeitraum hinweg verändert. Das kann zum Beispiel sein, wenn die Linse an der Kamera mit der Zeit verstaubt oder sich das Konsumverhalten der Konsumenten zu mehr Nachhaltigkeit umstellt. Diese graduellen Drifts bewirken einen graduellen Performanceverlust, der durch das Dashboard sichtbar gemacht wird. Lösung Beim Aufsetzen einer KI in der Produktionsumgebung ist es also wichtig, das Problem von Concept Drift von Anfang an mitzudenken und das Nachtrainieren der KI mit einem Re-Training in einem Continous Integration (CI) System zu ermöglichen. Bei CI handelt es sich um eine DevOps-Softwareentwicklungspraxis, bei der die Entwickler ihre Codeänderungen regelmäßig in einer Cloud ablegen, von wo aus nach Ablaufen von Tests die Software automatisch geupdatet wird. In diesem Blogartikel haben wir kurz umrissen, was Concept Drift ist, welche Probleme daraus entstehen, welche Driftarten es gibt und wie man ihnen begegnen kann. Der Beitrag Was tun, wenn die KI mit der Zeit an Performance verliert? Das Problem von Data Drift und wie man damit umgeht. erschien zuerst auf ATR Software GmbH.

zum Artikel gehen

Schulung: OneLake in Microsoft Fabric

- bersicht: Eine Datenbasis fr Alles, Security, Governance, Lizenzierung - Synapse: Data Engineering, Data Science, Data Warehouse, Real-time Analytics - Data Factory. Datenintegration, Pipelines, Power Query - Power BI: Data Hub, Berichte und Dashboar

zum Artikel gehen

5 gute Gründe für Google Data Studio

Google Data Studio spart Zeit und bietet eine viel verständlichere Art der Datenauswertung. Lernen Sie 5 Gründe kennen, warum man Google Data Studio nutzen sollte!

zum Artikel gehen

6005 schaltproblem

Hallo Deutzgemeinde, Nach längerer Zeit möchte ich mich mit einem Problem bei euch melden. Es geht um einen 6005 mit dem TW 55 Getriebe. Der 3. Gang lässt sich in der S Gruppe nur sehr schwer einlegen, egal welche Technik man anwendet. Der Schlepper muss

zum Artikel gehen

Zweimal Gelb-Rot: Eintracht Frankfurt verliert in Unterzahl in Köln – Leihspieler trifft

Eintracht Frankfurt verliert mit 0:2 beim 1. FC Köln. Bei der Niederlage spielen die Hessen in Unterzahl und kassieren zwei Platzverweise.

zum Artikel gehen

Schulung: Microsoft SQL Server-Datawarehousing / Business Intelligence

Grundlagen des Data Warehousing - Konzepte - Architektur Modellierung eines Data Warehouse - Analyse - Entwurf - Datenmodellierung Data Warehousing-Techniken im Microsoft SQL Server - Extract - Transform - Load (ETL) mit SQL Server Integration

zum Artikel gehen