Bleiben Sie mit uns auf dem Laufenden.

 

Testdatengenerierung mit RapidRep®

Generieren Sie Ihre Testdaten für das Back-End mit RapidRep – unkompliziert, nachhaltig, hoch-flexibel.

Ein zentraler Schritt im Testprozess ist das Testen mit möglichst vielen Datensätzen. Bereits aus Datenschutzgründen sollten die Testdaten jedoch nicht den Produktivdaten entsprechen. Dies ist vor allem in Hinblick auf die im Mai 2018 in Kraft tretende EU-weite Datenschutz-Grundverordnung sowie das ergänzende „neue Bundesdatenschutzgesetz“ höchst relevant.1 Zufallsbedingte, fiktive Daten sind gefragt. Jedoch reichen Daten, die mit Online-Generatoren oder gering anpassbarer Software erstellt werden, in der Regel nicht aus, um die eigenen Anwendungsfälle komplett abzudecken. Die Generierung der nötigen Testdaten wird daher oft zum zeit- und kostenintensiven Vorgang, unter Umständen erschwert durch komplexe Relationen.

Hier bieten wir Ihnen mit RapidRep eine unkomplizierte Lösung. Dank der RapidRep Regelwerke erzeugen Sie mit RapidRep realistische, zufällige Daten für das Back-End, die Ihren Anforderungen sowie den neuen Sicherheitsbestimmungen entsprechen, flexibel anpassbar sind und somit eine hohe Anzahl an Anwendungsfällen abdecken können. Weder sind Sie auf einen geringen Umfang von Datensätzen oder ein einziges Zielsystem, noch auf ein einziges Ausgabeformat beschränkt. Da RapidRep zudem über eine innovative Lösung zur Datenqualitätssicherung verfügt, können Sie optional immer auch die Qualität Ihrer Testdaten überprüfen.

Das Vorgehen zur Testdatenerstellung mit RapidRep umfasst im Wesentlichen zwei Schritte: die Beschreibung eines Datenmodells für Ihre Testdaten sowie die Erstellung eines RapidRep Regelwerkes zur Testdatengenerierung. Das Regelwerk muss anschließend in eine RapidRep Reportdefinition eingebunden werden, um die Ausgabe der Daten zu steuern.2

Schritt 1: Datenmodell und Zieltabellen identifizieren

Zunächst stellt sich die Frage, welche Daten Sie für den Test benötigen. Dies sollte sich im Normalfall aus dem Anwendungsfall ergeben und im besten Fall haben Sie bereits ein entsprechendes Datenmodell vorliegen. Sollte dies nicht so sein, identifizieren Sie im ersten Schritt ein Datenmodell für Ihre Testdaten. Aus diesem lassen sich sowohl die Zieltabellen und –spalten ableiten, welche wir mit Testdaten befüllen möchten, als auch deren relationale Abhängigkeiten. (Wir gehen im folgenden Beispiel von der Ausgabe in Tabellen aus, mit RapidRep können Sie jedoch auch andere Ausgabeformate, bspw. CSV, wählen.)

Datenmodell für das Beispiel zur Testdatengenerierung

(Grafik 1: Datenmodell für das Beispiel zur Testdatengenerierung)

In diesem Beispiel ist der Datensatz „Customer“ der Ausgangspunkt, von welchem die weiteren Datensätze abhängen und welcher, ebenso wie z.B. die Bestellung einmalig identifizierbar sein sollte, d.h. es sollte in der Tabelle „Customer“ kein Kunde doppelt vorkommen und jeder Bestellung, Rechnung und Adresse genau ein Kunde zugeordnet sein. Hingegen könnten mit einem Kunden verschiedene, also mehrere, Adressen verbunden sein, z.B. eine abweichende Lieferadresse für eine bestimmte Bestellung. Aus dem Modell ergibt sich, dass wir für unsere Daten die Tabellen „Address“, „Customer“, „Order“, „Order_Position“, „Invoice“ und „Payment“ anlegen (wollen).

Wie werden nun jedoch die Werte bestimmt, welche diese Zieltabellen füllen sollen, und wie können die so entstehenden Testdaten realistisch gestaltet werden (z.B. statistischen Häufigkeiten entsprechen)? Dazu überführen Sie im nächsten Schritt das Datenmodell in ein RapidRep Regelwerk, welches alle Regeln umfasst, die zur Generierung der entsprechenden Testdaten benötigt werden.

Schritt 2: RapidRep Regelwerk zur Testdatengenerierung erstellen

RapidRep Regelwerke sind der Übersichtlichkeit und Zugänglichkeit halber in Excel angelegt und in ihrer Struktur flexibel. Sie sollten für alle beteiligten Personen verständlich sein, um Transparenz und Glaubwürdigkeit der Ergebnisse zu gewährleisten. Mehr Informationen zu den Eigenschaften der Regelwerke und dem modellbasierten Testen mit RapidRep finden Sie hier: Modellbasiertes Testen mit der RapidRep Test Suite.

Das Regelwerk zur Testdatengenerierung umfasst neben einem Arbeitsblatt, welches das Datenmodell abbildet, ein Arbeitsblatt mit Rohdaten sowie verschiedene Arbeitsblätter mit Regeln und Spezifikationen, wie diese verwendet werden. Die Rohdaten stellen die Wertelisten dar, welche als Datenquelle für die Zieltabellen und -spalten genutzt werden. Mittels der schrittweisen Auswertung der enthaltenen Regeln, werden die Ausgangs-  bzw. Rohdaten in das erwartete Ergebnis, in diesem Fall die Testdaten, transformiert. In der folgenden Grafik sehen Sie einen Ausschnitt der Regeln, die bei unserem Beispiel zur Testdatengenerierung Anwendung finden.

Ausschnitt Regelwerk Beispiel Testdatengenerierung

(Grafik 2: Ausschnitt Regelwerk; Regeln für das Beispiel zur Testdatengenerierung)

RapidRep-Regeln haben die folgenden allgemeinen Eigenschaften:

  • Regeln haben die Form: Wenn (Bedingung) > Dann (Aktion).
  • Jede Regel ist eindeutig über das Attribut RULE_ID identifizierbar (Grafik 2, Spalte 3).
  • Mit dem Attribut ORDER_ID kann, wenn nötig, die Auswertungsreihenfolge von Regeln geändert werden (Grafik 2, Spalte 2; in diesem Beispiel nicht relevant).
  • Jede Regel erfüllt in einem Regelwerk eine ganz bestimmte Aufgabe (funktionaler Aspekt).
  • Jede Regel muss mindestens ein Attribut besitzen, das die RapidRep Rule-Engine für die Auswertung der Wenn-Bedingung verwenden kann.
  • Regeln dürfen beliebig viele andere Attribute besitzen.

Bei der schrittweisen Auswertung der Regeln würde im dargestellten Beispiel zuerst die Regel mit der RULE_ID 1 Anwendung finden. Diese bezieht sich auf die Tabelle „Customer“ (siehe Grafik 2, Spalte „Aspect“) und befüllt in dieser die Spalte „Country“ (siehe Grafik 2, Spalte „Target“). Welchen Wert RapidRep in die Spalte einfügen wird, bestimmt die in der Spalte „Source“ angegebene Funktion. Diese wählt einen Wert aus der Werteliste „Country“ entsprechend vorgegebener Gewichtungen zur Wahrscheinlichkeit (siehe Grafik 3 unten). Wo die Werte zu finden sind und mit welcher Gewichtung sie gewählt werden ist auf anderen Arbeitsblättern („Importspezifikationen“, „Enumerations“) zu finden.

Werteliste Country Beispiel Testdatengenerierung

(Grafik 3: Werteliste "Country" für das Beispiel zur Testdatengenerierung)

Die nachfolgenden Regeln im Beispiel Grafik 2 beziehen sich auf die Auswahl und bestimmen aufgrund dieser Auswahl den Wert der Spalte „Language“ der Tabelle „Customer“. Wird zum Beispiel für „Country“ der Wert „IT“ gewählt, so werden die Regeln 2-5 als „failed“ gewertet, da die Vorbedingung (siehe Grafik Spalte 5, „Pre-Condition“) nicht erfüllt ist. Abhängig von der zufälligen prozentualen Wahrscheinlichkeit die in der Bedingung festgelegt wird (siehe Grafik Spalte 6, „Condition“), wird der Wert „it“, „de“ oder „fr“ in die Zielspalte Language eingetragen. Entspricht der Wert für „Country“ keinem der vorgegebenen Länder, werden Regeln 2-12 als „failed“ gewertet und die Regel mit der Rule_ID 13 findet Anwendung, d.h. in diesem Fall wird „en“ als Wert für die Sprache in die Spalte „Language“ eingtragen.

In dieser Form werden alle Spalten der in unserem Datenmodell vorgegebenen Zieltabellen gefüllt. Dies geschieht mit fiktiven und zufälligen Werten, welche auf dem Arbeitsblatt Rohdaten in Listen hinterlegt sind. Verwendete Funktionen, bspw. zur Selektion des Landes, sind in der Reportdefinition in RapidRep angelegt, welche die im Regelwerk angelegten und nachvollziehbaren Regeln interpretiert. Einmal erstellt, lassen sich so mittels Regelwerk und Reportdefinition in RapidRep die Testdaten gemäß  der völlig benutzerdefinierten und damit an jeglichen Sonderfall angepassten Vorgaben immer wieder in zufälliger Zusammenstellung generieren.

Fazit: Testdatengenerierung mit RapidRep

Um sicherzugehen, dass Ihre Prozesse und Datenverarbeitungen funktionieren und auch den neuen Sicherheitsbestimmungen entsprechen, sollten Sie in Ihren Tests möglichst viele Datensätze verproben. Auch diese Testdaten müssen natürlich den Bestimmungen der EU-Datenschutzgrundverordnung und dem „neuen Bundesdatenschutzgesetz“ entsprechen. Testdaten, die nicht nur fiktiv sind, sondern darüber hinaus auch Ihren Anwendungsfällen entsprechen und die relationalen Abhängigkeiten korrekt abbilden, sind das A und O.

Mit RapidRep Regelwerken erstellen Sie Testdaten, die genau zu Ihren Bedürfnissen passen:

  • sie sind fiktiv;
  • sie sind zufällig;
  • sie sind nachvollziehbar;
  • sie können den Häufigkeitsverteilungen allgemeiner sowie kundenstammspezifischer Statistiken entsprechen;
  • sie können an individuelle Gegebenheiten angepasst werden (Umsetzung des eigenen Datenmodells).

Weitere Vorteile:

  • die Anzahl der Testdatensätze ist nicht auf wenige Hundert beschränkt;
  • das Ausgabeformat und Zielsystem kann angepasst werden;
  • Regelwerke lassen sich einfach duplizieren und für andere Szenarien abändern;
  • die Qualität der Testdaten kann mit RapidRep’s integrierten Lösungen direkt überprüft werden.

Sie benötigen keine weitere Software zur Testdatengenerierung, sondern erledigen dies gleich mit RapidRep, während Sie alle weiteren Vorteile nutzen, die die Arbeit mit den RapidRep Suiten mit sich bringt.

Falls Sie Unterstützung für das Erstellen Ihrer Testdaten mit RapidRep benötigen, kontaktieren Sie uns und wir beraten Sie gern!

 

Fußnoten:

1: Vgl. zum Beispiel:  https://www.datenschutz-wiki.de/BDSG_2018

2: Dabei handelt es sich um typische Arbeitsschritte mit RapidRep, die über das hier behandelte Thema hinausgehen. Informationen stellen Ihnen weitere Artikel aus dieser Website, unser Forum sowie die RapidRep Dokumentation zur Verfügung.

Zurück