< zurück

​Eine Anleitung zur Datenanalyse in der Fertigung - Dark Data

May 18, 2020

​Eine Anleitung zur Datenanalyse in der Fertigung - Dark Data

Dies ist der zweite Blog-Beitrag der Artikelreihe zum Thema Datenplattformen für die Fertigung. In dieser Reihe zeige ich meine eigenen Erkenntnisse sowie die Anwendung von Technologien als integrierte Produktanwendungen von Critical Manufacturing.

Im ersten Beitrag dieser Artikelreihe haben wir festgestellt, dass viele Unternehmen den Überblick über die verschiedenen Digitalisierungsstrategien aufgrund unterschiedlicher Ursachen verloren haben. Daraus folgt, dass die bisherigen Investitionen insbesondere im Bereich der Datenanalyse und des IoT (Internet of Things) noch nicht die gewünschten Erfolge vorweisen können.

Anders als in den bisherigen industriellen Revolutionen kann die Fertigungsindustrie bei der Umsetzung dieser Basistechnologien, die dieser Datentransformation zugrunde liegen, kaum Schritt halten. Vor dem Einstieg in das Thema Datenplattform gibt es einen weiteren Aspekt, der näher untersucht werden sollte: Dark Data (dunkle Daten).

Etwas Licht auf dunkle Daten werfen

Das IoT (im weiteren Sinne) erzeugt riesige Datenmengen und diese werden extrem schnell weiter anwachsen. Es existieren zahlreiche Prognosen und deren Ergebnisse deuten auf ein noch gewaltigeres Wachstum in der Zukunft hin. Zu den Bereichen, in denen der stärkste Datenanstieg zu erwarten ist, zählen die produzierende Unternehmen und insbesondere Automobilbranche.

Jede technologische Revolution oder positive Entwicklung verursacht auch leider unerwünschte Nebenwirkungen. In den letzten Jahren wurde eine erhebliche Anzahl von Lösungen, Tools und Plattformen entwickelt, mit denen Unternehmen eine Flut von generierten Daten speichern und verarbeiten können, sodass immer mehr Daten gesammelt werden können, die für Analysen, Vorhersagen und ähnliche wertvolle Zwecke verwendet wird.

Problematisch ist allerdings, dass der Großteil der Unternehmensdaten (inklusive produzierender Unternehmen) nicht unbedingt unternehmerisch nützlich ist. Die meisten Daten, die in einer Produktionsumgebung von Maschinen, Materialien, Transportsystemen, Lagern und Mitarbeitern als Protokolle oder Datenbankeinträge erzeugt wurden, werden möglicherweise nach ihrer Speicherung niemals wiederverwendet oder verarbeitet.

Diese Daten, die keinen Sofortwert aufweisen und sich nicht in nützliche Informationen umwandeln lassen, selbst wenn sie orchestriert und organisiert sind, bezeichnet man dunkle Daten oder Dark Data. Gartner definiert sie als "die Informationsbestände, die von Unternehmen im Rahmen ihrer Geschäftstätigkeit gesammelt, verarbeitet und gespeichert werden, die aber normalerweise nicht zu anderen Zwecken dienen (z.B. Analyse, Geschäftsbeziehungen und direkte Wertschöpfung). Ähnlich wie dunkle Materie in der Physik gehören dunkle Daten fest zum Informationsuniversum eines Unternehmens."

Bemerkenswert ist zudem, dass viele Daten erst ohne eine schnelle Datenverarbeitung wertlos werden. Man spricht dabei von "kurzlebigen Informationen", die zeitnahe Maßnahmen erfordern. Man kann dieser Entwicklung mit Hilfe der so genannten Streaming Analytics-Technologie aber entgegenwirken. Halten wir diesen Gedanken erst einmal fest, in einem späteren Beitrag dieser Reihe gehen wir hierauf nochmals ein. Zunächst einmal, bedenken Sie einfach, dass laut IBM 60% der Daten innerhalb von Millisekunden ihren eigentlichen Wert verlieren.

Ein wesentlicher Teil dieser Daten verbleibt jedoch über seine gesamte Lebensdauer im Dunkeln. Die meisten Unternehmen verfügen über riesige Mengen an Dark Data, die weder gespeichert oder analysiert werden, wobei bis zu 65% von Dark Data unerkannt in Maschinen, Netzwerken und bei Personen verbleiben. Einer der Gründe ist, dass solche Daten meistens unstrukturiert sind - "der Inhalt entspricht nicht einem festgelegten, vordefinierten Datenmodell. Es handelt sich tendenziell um benutzergenerierte und personenbezogene Inhalte, welche nicht ohne größere Aufwände in Datenbanktabellen eingefügt werden können."

Speicherung von Dark Data

Des Weiteren wird in Unternehmen eine signifikante Menge an Daten nach wie vor gespeichert, obwohl sie nicht sofort genutzt werden. Laut Rahul Telang, Professor an der Heinz Faculty für Informationssysteme und Öffentliche Politik an der Carnegie Mellon University (USA), entfallen auf Dark Data etwa 90 Prozent aller gespeicherten Daten im Unternehmen, wobei keine produzierten, sondern nur faktisch gespeicherte Daten gemeint sind. Eine solche Datenmenge ist schwer zu übersehen. Trotz der rückläufigen Preisentwicklung bei Hardware und Datenspeichersystemen ist diese Form der Datenspeicherung letztendlich gemessen am Nutzen teuer. Der Grund dafür ist, dass diese Daten nicht bloß im Rohzustand gespeichert werden. Sie werden oft aggregiert, bereinigt, transformiert und organisiert. Warum werden sie also in Unternehmen aufbewahrt? Selbst wenn Dark Data möglicherweise niemals verwendet wird, behalten Unternehmen dennoch aus zwei Gründen einen erheblichen Teil davon:

  • Zur Minimierung von Risiken und Verbindlichkeiten, die in erster Linie mit der Einhaltung von Vorschriften sowie mit rechtlichen Klagen zusammenhängen. Insbesondere in Branchen mit strengen regulatorischen Anforderungen (wie Lebensmittel- und Getränkeindustrie, Gesundheitswesen oder Halbleiterindustrie) kann betriebliche Kontinuität durch die Verletzung dieser Anforderungen gefährdet werden. Ein wichtiger Schritt in Richtung Optimierung und Effizienzsteigerung stellt dabei die Digitalisierung von Papierdokumentation dar, die in physischen Ablageorten aufbewahrt wird, selbst wenn der Anteil an Dark Data beträchtlich ist.
  • Dies geschieht zur Sicherung der Möglichkeit, diese Daten später nutzen zu können, wenn man praktische Informationen aus ihnen gewinnen kann, auch wenn diese heute noch nicht erkennbar sind. Tatsächlich erkennen immer mehr Hersteller, dass die von ihnen erzeugten Daten heute nicht nur für unmittelbare Entscheidungen von Bedeutung sind, sondern künftig auch für Algorithmen des maschinellen Lernens verwendet werden können, wodurch prädiktive Muster- und Performance-Modelle erstellt werden können, um so weitere Wettbewerbsvorteile zu generieren.

Der erste Grund ist hauptsächlich pragmatisch, der zweite ist hingegen äußerst zukunftsorientiert. Allerdings müssen die Kosten der Datenspeicherung verringert werden, denn die Menge der Dark Data nimmt kontinuierlich zu. Eine dieser Möglichkeiten liegt auf der Hand, auch wenn sie häufig nicht beachtet wird: Beim Speichern von Dark Data ist keine Transformation, Orchestrierung oder Datenpflege notwendig. Dabei handelt es sich um eine Daten-Reserve für spätere Nutzung. Sie können in einfachen und kostengünstigen Formaten ohne direkte Anforderungen an Speicherleistung oder Analyse gespeichert werden, sofern die Speicherkapazität gewährleistet ist, und bei Bedarf eingesetzt werden.

Deshalb sind Lösungen zur Speicherung von Ereignissen im Rohdatenformat (Raw Data) besonders interessant. Der entscheidende Unterschied ist die Fähigkeit, Daten zuverlässig und kosteneffizient ggf. unbegrenzt lange zu speichern und sie später jederzeit abzurufen.

Eine dieser Lösungen ist Apache Kafka, worauf wir später noch zurückkommen werden. Zunächst gilt jedoch, dass Daten nicht im Dunkeln bleiben müssen.

Ab dem Moment, wenn dunkle Daten zur Sammlung von Informationen eingesetzt werden, sind diese Daten handlungsrelevant und gelten per Definition nicht mehr als Dark Data.

Oftmals wissen Hersteller aber nicht mal genug über die Existenz der dunklen Daten in ihrem Unternehmen. Deshalb ist es wichtig, das Bewusstsein hinsichtlich ihrer Verfügbarkeit zu entwickeln und auf die Möglichkeiten aufmerksam zu machen, die durch die geplante Erfassung von Dark Data möglich werden. Anschießend bedarf es einer Plattform, die Dark-Data-Analyse unterstützt.

In weiteren Beiträgen dieser Artikelreihe werden wir die Hauptkomponenten einer Produktionsdatenplattform näher ausführen. Im nächsten Beitrag dieser Reihe werden Edge-Lösungen behandelt. Wenn Sie diesen und weitere Industrie 4.0-Beiträge künftig lesen möchten, registrieren Sie sich hier und erhalten Sie Benachrichtigungen über neue Beiträge per E-Mail.

Die englische Originalversion dieses Artikels von Francisco Almada Lobo (veröffentlicht am 20. April 2020) finden Sie hier.


< zurück
Freigeben:

Like us on Facebook!

Updates abonnieren

Abonnieren

Download White paper:

Five Ways Medical Device Industry Leaders Maintain their Manufacturing Edge
by Julie Fraser, Iyno Advisors
Download