
Statische Datenmaskierung für Scylla

Einleitung
Da Organisationen zunehmend auf verteilte Datenbanken wie ScyllaDB setzen, wird die Datensicherheit zu einer obersten Priorität. Sensible Informationen wie persönliche Identifikationsmerkmale, Kreditkartendetails und Kontaktinformationen müssen vor unbefugtem Zugriff geschützt werden. Eine der effektivsten Methoden, solche Daten zu sichern, ist die Datenmaskierung.
Die statische Datenmaskierung (SDM) beinhaltet die Erstellung einer bereinigten, nicht umkehrbaren Version sensibler Daten zur Nutzung in Nicht-Produktionsumgebungen. Dieser Ansatz ermöglicht es Entwicklern, Analysten und Testern, mit realistischen Datensätzen zu arbeiten, ohne tatsächliche sensible Informationen preiszugeben. In diesem Artikel untersuchen wir, wie man die Datenmaskierung für ScyllaDB sowohl mit nativen Methoden als auch mit fortschrittlichen, automatisierten Lösungen wie DataSunrise, einem führenden Anbieter von Sicherheits- und Compliance-Tools, implementiert.
Warum Datenmaskierung für ScyllaDB unerlässlich ist
ScyllaDB ist eine Hochleistungs-NoSQL-Datenbank, die für ihre Skalierbarkeit und Effizienz bekannt ist. Allerdings verfügt sie nicht über integrierte Datenmaskierungsfunktionen. Ohne eine ordnungsgemäße Maskierung für ScyllaDB laufen Organisationen Gefahr, gegen branchenspezifische Vorschriften wie:
- DSGVO – Erfordert die Anonymisierung personenbezogener Daten zum Schutz der Privatsphäre der Nutzer.
- HIPAA – Verlangt die Sicherung geschützter Gesundheitsinformationen (PHI).
- PCI DSS – Erzwingt die Verschlüsselung und Maskierung von Zahlungsdaten.
Durch die Implementierung der Datenmaskierung für ScyllaDB können Organisationen Risiken im Zusammenhang mit versehentlichen Datenlecks und unbefugtem Zugriff verringern und gleichzeitig die Einhaltung dieser Vorschriften sicherstellen.
Erstellen von Beispieldaten in ScyllaDB
Bevor die Datenmaskierung für ScyllaDB angewendet wird, benötigen wir Beispieldaten für Tests. Nachfolgend finden Sie ein Python-Skript, das mithilfe der Faker-Bibliothek gefälschte Kundendatensätze in ScyllaDB einfügt.
Erzeugen von Beispieldaten
import faker
from cassandra.cluster import Cluster
fake = faker.Faker()
def generate_data(n=10):
return [(fake.uuid4(), fake.name(), fake.email(), fake.phone_number(),
fake.credit_card_number(card_type="visa"), fake.address()) for _ in range(n)]
def connect_to_scylla():
session = Cluster(["127.0.0.1"]).connect("test_keyspace")
return session
def insert_data(session, data):
query = "INSERT INTO mock_data (customer_id, name, email, phone, credit_card, address) VALUES (?, ?, ?, ?, ?, ?)"
for entry in data:
session.execute(query, entry)
if __name__ == "__main__":
session = connect_to_scylla()
insert_data(session, generate_data(100))
So funktioniert es
- Erstellt 100 Datensätze mit gefälschten Namen, E-Mails, Telefonnummern, Kreditkartendaten und Adressen.
- Stellt eine Verbindung her zu einer lokal laufenden ScyllaDB-Instanz.
- Fügt die erzeugten Daten ein in eine
mock_data
-Tabelle.
Implementierung der statischen Datenmaskierung in ScyllaDB
Um sensible Kundendaten zu maskieren, können wir mithilfe von CQL eine bereinigte Version des Datensatzes erstellen.
CQL-basierte Datenmaskierung für ScyllaDB
CREATE TABLE test_keyspace.mock_data_masked AS
SELECT customer_id,
address,
'XXXX-XXXX-XXXX-' || substr(credit_card, -4) AS credit_card,
'XXX@' || substr(email, position('@' IN email)) AS email,
substr(name, 1, 1) || '***' AS name,
'XXX-XXX-' || substr(phone, -4) AS phone
FROM test_keyspace.mock_data;
Wesentliche Maskierungstechniken
- Kreditkartennummern behalten nur die letzten vier Ziffern bei.
- E-Mails zeigen nur die Domain mit einem verschleierten Benutzernamen an.
- Namen geben nur den ersten Buchstaben preis.
- Telefonnummern behalten nur die letzten vier Ziffern bei.
Obwohl dieser Ansatz einfach ist, erfordert er eine manuelle Ausführung und unterstützt keine automatischen Aktualisierungen.
Erweiterte Datenmaskierung für ScyllaDB mit DataSunrise
Obwohl das Erstellen von Duplikat-Maskierungstabellen für kleine Projekte effektiv sein kann, wird es schwierig, ein zuverlässiges Setup ausschließlich mit Datenbankabfragen aufrechtzuerhalten. Hier bieten Drittanbieterlösungen wie DataSunrise eine effizientere und skalierbarere Alternative.
Schritte zur Implementierung der Datenmaskierung für ScyllaDB mit DataSunrise
Schritt 1: ScyllaDB zu DataSunrise hinzufügen
Zuerst fügen Sie Ihre ScyllaDB-Instanz über die Web-Oberfläche zu DataSunrise hinzu:

Schritt 2: Erstellen einer Objektgruppe
Definieren Sie eine Objektgruppe, um die notwendigen Spalten zu identifizieren und zu maskieren:

Schritt 3: Planen periodischer Maskierungsaufgaben
Richten Sie eine geplante Aufgabe ein, um nach sensiblen Daten anhand der zuvor definierten Regeln zu suchen. Dadurch wird die Einhaltung von Vorschriften wie der DSGVO und HIPAA gewährleistet:

Schritt 4: Definieren statischer Maskierungsregeln
Erstellen Sie eine statische Maskierungsregel, die sensible Daten automatisch bereinigt. Wählen Sie Ihre Datenbank als Quelle und Ziel aus, um eine In-Place-Maskierung durchzuführen:

Vorteile der Verwendung von DataSunrise zur Datenmaskierung in ScyllaDB
- Benutzerfreundlichkeit – Die DataSunrise Web-GUI vereinfacht die Konfiguration.
- Einsatzbereite Lösung – Sie bietet umfassende Sicherheitsfunktionen über die Datenmaskierung hinaus.
- Skalierbarkeit – Für verteilte Datenbanken wie ScyllaDB konzipiert, was sie zu einem zuverlässigen Werkzeug für komplexe Umgebungen macht.
Neben der Datenmaskierung für ScyllaDB bietet DataSunrise auch Compliance-Management und verbesserte Sicherheit. Wenn Sie eine persönliche Beurteilung der Funktionen wünschen, buchen Sie eine Online-Demo. Sie können auch eine Testversion herunterladen, um die Funktionen aus erster Hand zu erkunden.
Fazit
Die Datenmaskierung ist entscheidend, um sensible Daten zu schützen und gleichzeitig die Nutzbarkeit in Nicht-Produktionsumgebungen zu gewährleisten. Während die manuelle, CQL-basierte Maskierung eine schnelle Lösung darstellt, bietet DataSunrise einen skalierbaren, automatisierten Ansatz mit fortgeschrittenen Sicherheits-, Compliance- und Prüfungsfunktionen.
Durch den Einsatz von DataSunrise zur Datenmaskierung in ScyllaDB können Organisationen sicherstellen: – Kontinuierlichen Datenschutz vor unbefugtem Zugriff. – Automatisierte Einhaltung der branchenspezifischen Vorschriften. – Reduzierte betriebliche Belastungen durch nahtlose Integration und Automatisierung.
Die Investition in eine zuverlässige Datenmaskierungslösung für ScyllaDB verbessert sowohl die Sicherheit als auch die Einhaltung gesetzlicher Vorschriften und stellt somit eine wesentliche Strategie für moderne Unternehmen dar.