Découverte de données plus intelligente avec AI Score & vitesse GPU
La fonctionnalité de découverte de données vient de recevoir une mise à jour majeure. DataSunrise propose désormais un modèle de scoring alimenté par l’IA qui améliore considérablement la précision de la détection des données sensibles — et une option d’accélération GPU pour la rendre plus rapide que jamais.
Le défi : les faux positifs dans la découverte de données
La découverte traditionnelle basée sur des modèles s’appuie sur des expressions régulières et des règles prédéfinies. Bien que ces méthodes soient efficaces dans les cas évidents, elles déclenchent souvent des alertes sur des données qui semblent simplement être des informations sensibles. Un SKU produit peut correspondre à un motif de carte de crédit. Une chaîne alphanumérique aléatoire pourrait déclencher une alerte numéro de passeport. Le résultat ? Les équipes de sécurité perdent du temps à examiner des faux positifs au lieu de se concentrer sur les risques réels.
La solution : AI Score avec métriques de confiance
Notre nouvelle fonctionnalité AI Score ajoute une couche d’apprentissage automatique à la découverte de données. Plutôt que de se baser uniquement sur la correspondance de modèles, le système :
- Analyse le contexte — Examine les données environnantes pour comprendre ce que représente réellement une valeur
- Prend en compte les métadonnées — Utilise les noms de colonnes et la structure des données comme indices de classification
- Attribue des scores de confiance — Fournit un score de 0 à 100 indiquant la probabilité qu’une correspondance soit authentique
Le modèle IA utilise sept étiquettes de classification telles que PERSONNE, NUMÉRO DE CARTE DE CRÉDIT, E-MAIL, LOCALISATION, PASSEPORT, CODE POSTAL et DATE-TEMPS pour valider les correspondances de motifs par rapport aux prédictions ML. Lorsque les deux correspondent, vous pouvez faire confiance au résultat. En cas de désaccord, vous savez qu’il faut enquêter plus en profondeur.
Extraits verticaux : intelligence au niveau de la colonne
AI Score va au-delà de l’analyse des valeurs individuelles avec les Extraits verticaux. Cette fonctionnalité examine plusieurs valeurs au sein d’une colonne pour créer une image complète :
- Une colonne nommée « customer_email » contenant des chaînes ressemblant à des e-mails ? Forte confiance.
- Une colonne nommée « product_code » avec les mêmes motifs ? Probablement un faux positif.
Ce contexte au niveau de la colonne réduit considérablement le bruit dans les rapports de découverte.
Accélération GPU pour AI Score
Pour les organisations qui scannent de grands volumes de données, AI Score prend en charge l’accélération NVIDIA CUDA. L’inférence accélérée par GPU traite les tâches de découverte beaucoup plus rapidement que les déploiements uniquement CPU — sans sacrifier la précision.
Pas de GPU ? Aucun problème. La fonctionnalité fonctionne également sur CPU avec le runtime ONNX, rendant la découverte augmentée par IA accessible à tout type de déploiement.
Accélération CUDA sur toutes les fonctionnalités ML
L’accélération GPU ne se limite pas à AI Score. DataSunrise prend désormais en charge CUDA dans toutes les fonctionnalités alimentées par ML :
- Découverte de données NLP — Le traitement du langage naturel pour détecter les données sensibles dans les textes non structurés fonctionne désormais sur GPU pour des scans plus rapides de grands référentiels de documents
- Détection de comportements utilisateurs suspects basée sur ML — L’analyse comportementale en temps réel bénéficie de l’accélération GPU, permettant un entraînement et une validation plus rapides des modèles sur les schémas d’activité dans les bases de données
Les trois fonctionnalités partagent la même infrastructure runtime ONNX, ainsi une seule configuration CUDA accélère l’ensemble de votre pipeline ML. Configurez une fois, bénéficiez partout.
Déploiement flexible
AI Score s’intègre directement aux flux de travail de découverte de données existants :
- Activation via les paramètres du type de rapport — aucun changement d’infrastructure requis
- Compatible avec CSV, XML, JSON, PDF, Parquet, et les fichiers de texte non structurés
- Personnalisez les poids des scores pour correspondre à la tolérance au risque de votre organisation
- Entraînez des modèles ONNX personnalisés pour des schémas de données spécifiques à une région ou un secteur
Avantages clés de la découverte de données avec AI Score
| Avant | Après |
|---|---|
| Taux élevés de faux positifs | Correspondances validées par ML avec scores de confiance |
| Examen manuel de chaque alerte | Concentrez-vous uniquement sur les éléments à faible confiance |
| Correspondance basée uniquement sur les modèles | Classification consciente du contexte |
| Traitement limité au CPU | Accélération GPU optionnelle |
Commencez dès maintenant
AI Score est disponible dès aujourd’hui dans DataSunrise. Activez-le dans les paramètres de votre tâche de découverte de données et commencez à obtenir immédiatement des résultats plus propres et plus exploitables.
Pour les options de configuration détaillées, consultez les sections appropriées nouvellement ajoutées/mises à jour dans notre guide utilisateur.
Informations supplémentaires
Documentation NVIDIA CUDA
Runtime ONNX
Protégez vos données avec DataSunrise
Sécurisez vos données à chaque niveau avec DataSunrise. Détectez les menaces en temps réel grâce à la surveillance des activités, au masquage des données et au pare-feu de base de données. Appliquez la conformité des données, découvrez les données sensibles et protégez les charges de travail via plus de 50 intégrations supportées pour le cloud, sur site et les systèmes de données basés sur l'IA.
Commencez à protéger vos données critiques dès aujourd’hui
Demander une démo Télécharger maintenant