Lua-Skript entdeckt sensible Daten in JSON-Dateien
Bei der Arbeit mit der Data Discovery-Funktion ermöglicht DataSunrise die Verwendung einer Vielzahl vorgefertigter Suchfilter für verschiedene Arten von sensiblen Daten. Aber gibt es eine Möglichkeit, nach einzigartigen Daten zu suchen? Ja, um diese Aufgabe zu erfüllen, können Sie Lua verwenden. Die Verwendung von Lua-Skripten für Data Discovery ermöglicht die Suche nach buchstäblich allen Textwerten, die von den vorhandenen Vorlagen nicht abgedeckt werden.
Dieser Artikel beschreibt, wie Sie mit Lua die interessierenden Datenbankspalten in JSON-Dateien lokalisieren können. Ein dediziertes Skript wird verwendet, um dies zu tun, sodass Sie Ihre eigene Suche auf dem unten beschriebenen Algorithmus basieren können. Beachten Sie, dass dies nicht nur mit JSON-Dateien, sondern mit jeder Art von Datei möglich ist – Sie müssen nur ein entsprechendes Lua-Skript erstellen.
Sie können das im Artikel verwendete Skript hier kopieren:
-- Werte angeben, die in der sensitive_from_json-Liste entdeckt werden sollen -- z.B. {"data","id","name"} sensitive_from_json = {"id", "data"} -- valStr enthält JSON als Text local valStr = tostring(columnValue) local valStrLen = string.len(valStr) -- Funktion, um die Länge einer Tabelle zu erhalten local function tablelength(T) local count = 0 for _ in pairs(T) do count = count + 1 end return count end -- Anzahl der Elemente in der sensitive_from_json-Liste abrufen local count = tablelength(sensitive_from_json) -- Identifizieren, ob die Spalte JSON-formatierte Daten enthält if string.sub(valStr, 1, 1) == '{' and string.sub(valStr, valStrLen, valStrLen) == '}' then for i = 1, count do -- Wenn JSON mindestens einen gewünschten Wert enthält, 1 zurückgeben, sonst 0 if string.find(valStr, '"' .. tostring(sensitive_from_json[i]) .. '":') then return 1 end end return 0 else return 0 end
Erstellen Sie zunächst Ihr Lua-Skript, um Ihre eigenen interessierenden Daten zu durchsuchen. Beachten Sie, dass das spezifische Skript, das wir für diesen Artikel erstellt haben, unter anderem überprüft, ob die verarbeitete Datei wie eine JSON-Datei formatiert ist. Für andere Dateitypen sollten Sie andere Validierungsalgorithmen verwenden. Wir füllen die erforderlichen Werte im Skript aus. Zu Ihrem Komfort haben wir dort einige Kommentare hinterlassen.
Unser Skript ist also bereit zur Verarbeitung und wir können zur DataSunrise-Webkonsole gehen.
Wir navigieren zu Data Discovery -> Information Types und erstellen einen neuen Informationstyp.

Bild 1. Informationstyp hinzufügen
Wir fügen ein neues Attribut hinzu und wählen in den Attribut-Einstellungen Column Data aus. Im Column Data Type wählen wir Strings Only. In der Suchmethode wählen wir Lua Script aus.

Bild 2. Attribute hinzufügen

Bild 3. Lua-Skript bearbeiten
Dann klicken wir auf Edit Lua Script, um den Skriptcode zu bearbeiten. Wir fügen unser Skript in das Skriptfeld ein und speichern es.

Bild 4. Lua-Skript
Nun können wir eine neue Data Discovery-Aufgabe erstellen. Im Unterabschnitt Suchfilter wählen wir Informationstypen und wählen unseren Informationstyp aus, den wir für die Entdeckung verwenden möchten.

Bild 5. Data Discovery Filter
Um die Aufgabe auszuführen, müssen wir die manuelle Startfrequenz auswählen, auf die Schaltfläche Apply drücken, um die Änderungen zu speichern, und auf Start Now drücken, um die Aufgabe zu starten.

Bild 6. Data Discovery-Aufgabe mit Lua-Skript starten
Wenn die Aufgabe erfolgreich war, können wir die Ergebnisse anzeigen, indem wir auf die Schaltfläche Show klicken. Dies zeigt, dass Datenbankobjekte vorliegen, die sensible Daten im JSON-Format enthalten.

Bild 7. Ergebnisse
Zusammenfassend lässt sich sagen, dass die Verwendung von Lua-Skripten innerhalb der DataSunrise Data Discovery-Funktion Ihre Fähigkeit, einzigartige und sensible Daten über den Rahmen vorgefertigter Filter hinaus zu identifizieren, erheblich verbessert. Durch Befolgen der beschriebenen Schritte können Sie benutzerdefinierte Skripten erstellen, die auf die Suche nach spezifischen Textwerten in verschiedenen Dateiformaten, einschließlich JSON, zugeschnitten sind. Diese Methode erweitert nicht nur die Bandbreite der durchsuchbaren Daten, sondern bietet auch ein flexibles und leistungsstarkes Tool für Datenbankadministratoren, die versuchen, sensible Informationen zu schützen. Die einfache Integration dieser Skripten über die DataSunrise-Webkonsole und die anschließende Möglichkeit, Entdeckungsaufgaben zu automatisieren und anzuzeigen, straffen den Prozess und machen ihn zu einer effizienten Lösung für das umfassende Datenmanagement zur Sicherheit.