Man hört es immer wieder (auch hier im Impulse Blog): Daten sind der Treibstoff der Wissensgesellschaft und das Öl des 21. Jahrhunderts. Man sollte daher annehmen, dass Firmen und Organisationen entsprechend aktiv und strategisch mit diesem wertvollen Gut umgehen. Doch weit gefehlt: Viele Unternehmen sammeln, verarbeiten und speichern tagtäglich zwar eine unüberschaubare Vielzahl an Informationen, analysieren und nutzen diese dann aber nicht oder nicht richtig. Das bestätigen auch die Analysten von Forrester - ihnen zufolge werden zwischen 60 und 73 Prozent der Daten eines Unternehmens überhaupt nicht analysiert, sondern lediglich gespeichert. Ein teures Versäumnis, denn die Verarbeitung mangelhafter Datenbestände verursacht in deutschen Unternehmen jährliche Kosten von durchschnittlich 594.000 Euro pro 1.000 Terabyte. Es wird also höchste Zeit, den dunklen Daten den Kampf anzusagen!
Ungenutztes Datenpotenzial
Um dieser Herausforderung zu begegnen, müssen Unternehmen eine holistische Datenmanagement-Strategie entwickeln, die Daten so aufbereitet und zur Verfügung stellt, dass sie unmittelbar und einfach unternehmensweit genutzt werden können. Doch wie gehen sie hier am besten vor? Die Analysten von Gartner vergleichen Dark Data berechtigterweise mit der dunklen Materie in der Physik, beide sind nicht einfach zu greifen. Die Herausforderung besteht folglich darin, die bislang als Dark Data abgeschriebenen Informationen so umzumünzen, dass mit Ihnen bessere Erkenntnisse gewonnen, Prozesse nachhaltig optimiert und Innovationen vorangetrieben werden können.
Ohne saubere Daten keine KI
Besonders im Fokus stehen hierbei Projekte, die Künstliche Intelligenz (KI) und Machine Learning (ML) zum Inhalt haben. Sie können ihr volles Potenzial aber nur mit einer umfangreichen Sammlung „gesunder“, d.h. normalisierte, aktueller und direkt verwertbarer Daten entfalten. Der Branchenverband Bitkom bezeichnet Daten in diesem Zusammenhang naheliegender Weise als – es kommt einem bekannt vor - „Treibstoff“ der KI. Nahezu alle Unternehmen (94 %), die sich aktiv mit KI-Nutzung auseinandersetzen, gehen laut einer aktuellen Bitkom-Umfrage davon aus, dass im Zuge der weiteren Entwicklung der Bedarf an Trainingsdaten signifikant steigen wird.
Healthy Data schaffen Basis für effiziente Analysen
Für die Optimierung der KI-Algorithmen ist die Qualität dieser Trainingsdaten der entscheidende Faktor. Sie sollten möglichst hochwertig sein, d.h. normalisiert und frei von Fehlern. Nur mit derartigen „Healthy Data“, also einer sauberen, klar kategorisierten und gesunden Datengrundlage, gelingt es, das Meiste und Beste aus den Datenauswertungen und -analysen herauszuholen. Flankiert von leistungsstarken Datenmanagement- und Datenanalyse-Werkzeugen gelingt so die Entwicklung effektiver, gewinn- und nutzbringender ML-Architekturen und –Modelle, die weniger Fehler aufweisen und mit größerer Genauigkeit arbeiten. Damit ebnen sie den Weg für wirklich innovative Anwendungen und Services, die als Grundlage zukunftsorientierter Unternehmensentscheidungen dienen.
InterSystems IRIS sorgt für gesunde Daten
Wie aber werden aus unsauberen, dunklen Daten saubere und gesunde Daten? Das A und O im Kampf gegen die Dark Data-Flut ist die richtige Technologie: Eine interoperable und flexibel skalierbare Datenplattform wie InterSystems IRIS hilft Unternehmen mit leistungsstarken Datenbankmanagement- und Analysetools, um dunkle Daten in gesunde Daten zu verwandeln. Damit liefert sie den Treibstoff für erfolgreiche KI- und ML-Projekte, die mit Healthy Data ihr großes Potenzial voll ausspielen können.