DataSunrise Obtient le Statut Compétence DevOps AWS dans AWS DevSecOps et Surveillance, Journalisation, Performance

Masquage de données dynamique pour Amazon Redshift

Masquage de données dynamique pour Amazon Redshift

Introduction

Les organisations font face à une pression croissante pour protéger les données personnelles tout en respectant les réglementations en vigueur. Découvrez le masquage de données dynamique pour Amazon Redshift – une solution puissante qui aide les entreprises à sécuriser leurs données sans compromettre leur fonctionnalité.

Plongeons dans l’univers du masquage de données dynamique et découvrons comment il peut révolutionner votre stratégie de sécurité des données.

Selon le Tableau de bord de la Base Nationale de Vulnérabilités (NVD) Dashboard, en date d’août 2024, 24 457 nouveaux enregistrements de Vulnérabilités et Expositions Communes (CVE) ont été rapportés cette année – et nous n’en sommes qu’à la moitié.

Cette statistique stupéfiante souligne la nécessité critique de mettre en place des mesures de protection des données robustes. Le masquage de données dynamique offre une approche de pointe pour protéger les informations sensibles dans les bases de données Amazon Redshift.

Comprendre les capacités d’AWS Redshift pour le masquage de données

Amazon Redshift offre plusieurs fonctions intégrées pouvant être utilisées pour un masquage de données basique. Bien que ces fonctions ne soient pas aussi complètes que les solutions de masquage dédiées, elles constituent un point de départ pour la protection des données sensibles.

Données de test

create table MOCK_DATA (
id INT,
first_name VARCHAR(50),
last_name VARCHAR(50),
email VARCHAR(50)
);
insert into MOCK_DATA (id, first_name, last_name, email) values (6, 'Bartlet', 'Wank', '[email protected]');
insert into MOCK_DATA (id, first_name, last_name, email) values (7, 'Leupold', 'Gullen', '[email protected]');
insert into MOCK_DATA (id, first_name, last_name, email) values (8, 'Chanda', 'Matiebe', '[email protected]');
…

Utiliser REGEXP_REPLACE

L’une des manières les plus simples de masquer des données dans Redshift est d’utiliser la fonction REGEXP_REPLACE. Cette fonction permet de remplacer des parties d’une chaîne de caractères en fonction d’un motif d’expression régulière.

Voici un exemple d’utilisation des restrictions et de REGEXP_REPLACE pour masquer un numéro de téléphone :

SELECT RIGHT(email, 4) AS masked_email
FROM mock_data;
SELECT REGEXP_REPLACE(email, '.', '*') AS masked_email
FROM mock_data;

Cette requête remplace les six premiers chiffres d’un numéro de téléphone par des caractères ‘X’, ne laissant visibles que les quatre derniers chiffres.

Ou encore plus simplement :

SELECT '[email protected]' AS masked_email
FROM mock_data;

Vues de masquage

CREATE VIEW masked_users AS
SELECT 
  id,
  LEFT(email, 1) || '****' || SUBSTRING(email FROM POSITION('@' IN email)) AS masked_email,
  LEFT(first_name, 1) || REPEAT('*', LENGTH(first_name) - 1) AS masked_first_name
FROM mock_data;
SELECT * FROM masked_users;

Exploiter les fonctions Python intégrées

Redshift supporte également les fonctions définies par l’utilisateur (UDF) écrites en Python. Ces fonctions peuvent être des outils puissants pour implémenter une logique de masquage plus complexe.

Voici un exemple simple d’UDF Python qui masque des adresses e-mail et des prénoms :

-- Masquer l'e-mail --
CREATE OR REPLACE FUNCTION f_mask_email(email VARCHAR(255))
RETURNS VARCHAR(255)
STABLE
AS $$
    import re
    def mask_part(part):
        return re.sub(r'[a-zA-Z0-9]', '*', part)
    if '@' not in email:
        return email
    local, domain = email.split('@', 1)
    masked_local = mask_part(local)
    domain_parts = domain.split('.')
    masked_domain_parts = [mask_part(part) for part in domain_parts[:-1]] + [domain_parts[-1]]
    masked_domain = '.'.join(masked_domain_parts)
    return "{0}@{1}".format(masked_local, masked_domain)
$$ LANGUAGE plpythonu;
-- Masquage du prénom --
CREATE OR REPLACE FUNCTION f_mask_name(name VARCHAR(255))
RETURNS VARCHAR(255)
STABLE
AS $$
    import re
    if not name:
        return name
    # Conserver le premier caractère, masquer le reste
    masked = name[0] + re.sub(r'[a-zA-Z]', '*', name[1:])
    return masked
$$ LANGUAGE plpythonu;
SELECT id, f_mask_name(first_name) AS masked_first_name, last_name
FROM MOCK_DATA;

Création d’une instance DataSunrise pour le masquage de données dynamique

Bien que les capacités intégrées de Redshift offrent un masquage de base, elles manquent de la flexibilité et de la facilité d’utilisation fournies par des solutions spécialisées comme DataSunrise. Examinons comment configurer le masquage de données dynamique avec DataSunrise.

Configuration du masquage de données dynamique

Pour configurer le masquage de données dynamique :

  1. Dans le tableau de bord, naviguez jusqu’à la section “Masking”.
  2. Sélectionnez “Dynamic Masking Rules” dans le menu.
  3. Cliquez sur “Add New Rule” pour créer une nouvelle règle de masquage.
  4. Choisissez votre instance de base de données Amazon Redshift dans la liste des bases connectées.
  5. Sélectionnez la table et la colonne que vous souhaitez masquer.
  6. Choisissez une méthode de masquage (nous en parlerons plus en détail dans la section suivante).
  7. Enregistrez votre règle et appliquez les modifications.

L’image affiche deux règles de masquage de données dynamique. La première règle, intitulée “RedshiftMaskingRule01”, est configurée pour masquer les adresses e-mail. La deuxième règle, “RedshiftMaskingRule02”, est configurée pour masquer les prénoms.

Après avoir configuré les règles, vous pouvez exécuter une requête de test pour voir les données masquées dynamiquement en action. L’accès aux données masquées dans DBeaver est illustré ci-dessous.

La création de règles de masquage dynamique avec DataSunrise est remarquablement simple, nécessitant seulement quelques clics. Ce processus simplifié contraste fortement avec les approches natives plus complexes. Mieux encore, cette facilité d’utilisation s’applique à des dizaines de bases de données et systèmes de stockage pris en charge, offrant une polyvalence et une efficacité inégalées en matière de protection des données.

Exploration des méthodes de masquage

DataSunrise propose plusieurs méthodes de masquage adaptées à différents types de données et exigences de sécurité. Examinons trois approches courantes :

Chiffrement à Format Conservé (FPE)

Le FPE est une technique de masquage avancée qui chiffre les données tout en conservant leur format original. Cela est particulièrement utile pour des champs comme les numéros de carte de crédit ou les numéros de sécurité sociale, où les données masquées doivent conserver la même structure que les données originales.

Exemple : Original : 1234-5678-9012-3456 Masqué : 8736-2940-5281-7493

Valeur de chaîne fixe

Cette méthode remplace l’intégralité du champ par une chaîne prédéfinie. Elle est simple mais efficace pour les cas où la structure réelle des données n’a pas d’importance.

Exemple : Original : John Doe Masqué : [REDACTED]

Valeur nulle

Parfois, la meilleure manière de protéger des données sensibles est de les masquer complètement. La méthode de la valeur nulle remplace les données originales par une valeur nulle, les supprimant effectivement des résultats de requêtes pour les utilisateurs non autorisés.

Exemple : Original : [email protected] Masqué : NULL

DataSunrise offre une gamme diversifiée de méthodes de masquage, vous proposant de nombreuses options pour adapter votre stratégie de protection des données :

Avantages du masquage de données dynamique

La mise en place du masquage de données dynamique pour Amazon Redshift offre plusieurs avantages clés :

  1. Sécurité renforcée des données : Protégez les informations sensibles contre tout accès non autorisé.
  2. Conformité réglementaire : Répondez aux exigences des règlements de protection des données comme le RGPD et le CCPA.
  3. Flexibilité : Appliquez différentes règles de masquage en fonction des rôles des utilisateurs ou des éléments de données spécifiques.
  4. Intégration transparente : Masquez les données dynamiquement sans modifier la structure sous-jacente de la base de données.
  5. Amélioration des tests et du développement : Fournissez des données réalistes mais sécurisées pour les environnements non-production.

Bonnes pratiques pour la mise en œuvre du masquage de données dynamique

Pour maximiser l’efficacité de votre stratégie de masquage des données :

  1. Identifiez les données sensibles : Effectuez un processus de découverte complet pour localiser toutes les informations sensibles.
  2. Définissez des politiques claires : Établissez des règles de masquage cohérentes au sein de votre organisation.
  3. Testez minutieusement : Vérifiez que le masquage n’interfère pas avec la fonctionnalité de l’application.
  4. Surveillez et auditez : Revoyez régulièrement les règles de masquage et leur efficacité.
  5. Formez votre équipe : Assurez-vous que toutes les parties prenantes comprennent l’importance du masquage des données et sachent comment l’utiliser correctement.

Conclusion

Le masquage de données dynamique pour Amazon Redshift est un outil puissant dans l’arsenal moderne de la sécurité des données. En mettant en place des stratégies de masquage robustes, les organisations peuvent protéger les données sensibles, maintenir la conformité réglementaire et réduire les risques associés aux violations de données.

À mesure que la protection des données devient de plus en plus cruciale, des solutions comme DataSunrise offrent des outils conviviaux et à la pointe de la technologie pour une sécurité globale des bases de données. En plus du masquage de données dynamique, DataSunrise fournit des fonctionnalités telles que l’audit et la découverte des données, renforçant ainsi votre capacité à protéger les informations précieuses.

Prêt à porter la sécurité de vos données Amazon Redshift à un niveau supérieur ? Visitez le site Web de DataSunrise pour une démo en ligne et découvrez comment nos outils avancés peuvent transformer votre approche de la protection des données.

Suivant

Protéger les Informations Sensibles avec le Masquage de Données Statiques dans SQL Server

Protéger les Informations Sensibles avec le Masquage de Données Statiques dans SQL Server

En savoir plus

Besoin de l'aide de notre équipe de support ?

Nos experts seront ravis de répondre à vos questions.

Informations générales :
[email protected]
Service clientèle et support technique :
support.datasunrise.com
Demandes de partenariat et d'alliance :
[email protected]