DataSunrise Obtient le Statut Compétence DevOps AWS dans AWS DevSecOps et Surveillance, Journalisation, Performance

Découverte de données plus intelligente avec AI Score & vitesse GPU

Découverte de données plus intelligente avec AI Score & vitesse GPU

La fonctionnalité de découverte de données vient de recevoir une mise à jour majeure. DataSunrise propose désormais un modèle de scoring alimenté par l’IA qui améliore considérablement la précision de la détection des données sensibles — et une option d’accélération GPU pour la rendre plus rapide que jamais.

Le défi : les faux positifs dans la découverte de données

La découverte traditionnelle basée sur des modèles s’appuie sur des expressions régulières et des règles prédéfinies. Bien que ces méthodes soient efficaces dans les cas évidents, elles déclenchent souvent des alertes sur des données qui semblent simplement être des informations sensibles. Un SKU produit peut correspondre à un motif de carte de crédit. Une chaîne alphanumérique aléatoire pourrait déclencher une alerte numéro de passeport. Le résultat ? Les équipes de sécurité perdent du temps à examiner des faux positifs au lieu de se concentrer sur les risques réels.

La solution : AI Score avec métriques de confiance

Notre nouvelle fonctionnalité AI Score ajoute une couche d’apprentissage automatique à la découverte de données. Plutôt que de se baser uniquement sur la correspondance de modèles, le système :

  • Analyse le contexte — Examine les données environnantes pour comprendre ce que représente réellement une valeur
  • Prend en compte les métadonnées — Utilise les noms de colonnes et la structure des données comme indices de classification
  • Attribue des scores de confiance — Fournit un score de 0 à 100 indiquant la probabilité qu’une correspondance soit authentique

Le modèle IA utilise sept étiquettes de classification telles que PERSONNE, NUMÉRO DE CARTE DE CRÉDIT, E-MAIL, LOCALISATION, PASSEPORT, CODE POSTAL et DATE-TEMPS pour valider les correspondances de motifs par rapport aux prédictions ML. Lorsque les deux correspondent, vous pouvez faire confiance au résultat. En cas de désaccord, vous savez qu’il faut enquêter plus en profondeur.

Extraits verticaux : intelligence au niveau de la colonne

AI Score va au-delà de l’analyse des valeurs individuelles avec les Extraits verticaux. Cette fonctionnalité examine plusieurs valeurs au sein d’une colonne pour créer une image complète :

  • Une colonne nommée « customer_email » contenant des chaînes ressemblant à des e-mails ? Forte confiance.
  • Une colonne nommée « product_code » avec les mêmes motifs ? Probablement un faux positif.

Ce contexte au niveau de la colonne réduit considérablement le bruit dans les rapports de découverte.

Accélération GPU pour AI Score

Pour les organisations qui scannent de grands volumes de données, AI Score prend en charge l’accélération NVIDIA CUDA. L’inférence accélérée par GPU traite les tâches de découverte beaucoup plus rapidement que les déploiements uniquement CPU — sans sacrifier la précision.

Pas de GPU ? Aucun problème. La fonctionnalité fonctionne également sur CPU avec le runtime ONNX, rendant la découverte augmentée par IA accessible à tout type de déploiement.

Accélération CUDA sur toutes les fonctionnalités ML

L’accélération GPU ne se limite pas à AI Score. DataSunrise prend désormais en charge CUDA dans toutes les fonctionnalités alimentées par ML :

  • Découverte de données NLP — Le traitement du langage naturel pour détecter les données sensibles dans les textes non structurés fonctionne désormais sur GPU pour des scans plus rapides de grands référentiels de documents
  • Détection de comportements utilisateurs suspects basée sur ML — L’analyse comportementale en temps réel bénéficie de l’accélération GPU, permettant un entraînement et une validation plus rapides des modèles sur les schémas d’activité dans les bases de données

Les trois fonctionnalités partagent la même infrastructure runtime ONNX, ainsi une seule configuration CUDA accélère l’ensemble de votre pipeline ML. Configurez une fois, bénéficiez partout.

Déploiement flexible

AI Score s’intègre directement aux flux de travail de découverte de données existants :

  • Activation via les paramètres du type de rapport — aucun changement d’infrastructure requis
  • Compatible avec CSV, XML, JSON, PDF, Parquet, et les fichiers de texte non structurés
  • Personnalisez les poids des scores pour correspondre à la tolérance au risque de votre organisation
  • Entraînez des modèles ONNX personnalisés pour des schémas de données spécifiques à une région ou un secteur

Avantages clés de la découverte de données avec AI Score

Avant Après
Taux élevés de faux positifs Correspondances validées par ML avec scores de confiance
Examen manuel de chaque alerte Concentrez-vous uniquement sur les éléments à faible confiance
Correspondance basée uniquement sur les modèles Classification consciente du contexte
Traitement limité au CPU Accélération GPU optionnelle

Commencez dès maintenant

AI Score est disponible dès aujourd’hui dans DataSunrise. Activez-le dans les paramètres de votre tâche de découverte de données et commencez à obtenir immédiatement des résultats plus propres et plus exploitables.

Pour les options de configuration détaillées, consultez les sections appropriées nouvellement ajoutées/mises à jour dans notre guide utilisateur.

Informations supplémentaires

Documentation NVIDIA CUDA
Runtime ONNX

Protégez vos données avec DataSunrise

Sécurisez vos données à chaque niveau avec DataSunrise. Détectez les menaces en temps réel grâce à la surveillance des activités, au masquage des données et au pare-feu de base de données. Appliquez la conformité des données, découvrez les données sensibles et protégez les charges de travail via plus de 50 intégrations supportées pour le cloud, sur site et les systèmes de données basés sur l'IA.

Commencez à protéger vos données critiques dès aujourd’hui

Demander une démo Télécharger maintenant

Besoin de l'aide de notre équipe de support ?

Nos experts seront ravis de répondre à vos questions.

Informations générales :
[email protected]
Service clientèle et support technique :
support.datasunrise.com
Demandes de partenariat et d'alliance :
[email protected]