Descubrimiento de Datos Más Inteligente con Puntuación de IA y Velocidad GPU
La función de descubrimiento de datos acaba de recibir una gran actualización. DataSunrise ahora cuenta con un modelo de puntuación impulsado por IA que mejora drásticamente la precisión en la detección de datos sensibles, además de una aceleración opcional con GPU para hacerlo más rápido que nunca.
El Desafío: Falsos Positivos en el Descubrimiento de Datos
El descubrimiento tradicional basado en patrones se apoya en expresiones regulares y reglas predefinidas. Si bien es efectivo para casos claros, estos métodos suelen marcar datos que simplemente parecen ser información sensible. Un SKU de producto puede coincidir con un patrón de tarjeta de crédito. Una cadena alfanumérica aleatoria podría activar una alerta de número de pasaporte. ¿El resultado? Los equipos de seguridad pierden tiempo revisando falsos positivos en lugar de centrarse en riesgos reales.
La Solución: Puntuación de IA con Métricas de Confianza
Nuestra nueva función de Puntuación de IA añade una capa de aprendizaje automático al descubrimiento de datos. En lugar de depender únicamente de la coincidencia de patrones, el sistema ahora:
- Analiza el contexto — Examina los datos circundantes para entender qué representa realmente un valor
- Considera los metadatos — Usa los nombres de columna y la estructura de los datos como pistas para la clasificación
- Asigna puntuaciones de confianza — Proporciona una puntuación de 0 a 100 que indica qué tan probable es que la coincidencia sea genuina
El modelo de IA utiliza siete etiquetas de clasificación como PERSONA, NÚMERO DE TARJETA DE CRÉDITO, EMAIL, UBICACIÓN, PASAPORTE, CÓDIGO POSTAL y FECHA-HORA para validar cruzadamente las coincidencias de patrones con las predicciones de ML. Cuando ambos coinciden, puedes confiar en el resultado. Cuando no, sabes que debes investigar más a fondo.
Fragmentos Verticales: Inteligencia a Nivel de Columna
Puntuación de IA va más allá del análisis de valores individuales con Fragmentos Verticales. Esta función examina múltiples valores dentro de una columna para construir una imagen completa:
- ¿Una columna llamada "customer_email" que contiene cadenas similares a correos electrónicos? Alta confianza.
- ¿Una columna llamada "product_code" con los mismos patrones? Probablemente un falso positivo.
Este contexto a nivel de columna reduce drásticamente el ruido en los informes de descubrimiento.
Aceleración GPU para Puntuación de IA
Para organizaciones que escanean grandes volúmenes de datos, Puntuación de IA soporta aceleración NVIDIA CUDA. La inferencia impulsada por GPU procesa las tareas de descubrimiento significativamente más rápido que implementaciones solo con CPU, sin sacrificar precisión.
¿No tienes GPU? No hay problema. La función también funciona con CPU usando el runtime ONNX, manteniendo el descubrimiento mejorado por IA accesible para cualquier despliegue.
Aceleración CUDA en Todas las Funcionalidades de ML
La aceleración GPU no está limitada a Puntuación de IA. DataSunrise ahora soporta CUDA en todas las funciones impulsadas por ML:
- Descubrimiento de Datos NLP — El procesamiento de lenguaje natural para detectar datos sensibles en texto no estructurado ahora se ejecuta en GPU para escaneos más rápidos de grandes repositorios de documentos
- Detección de Comportamiento Sospechoso de Usuario basada en ML — El análisis comportamental en tiempo real se beneficia de la aceleración GPU, permitiendo un entrenamiento y validación más rápidos de modelos frente a patrones de actividad en bases de datos
Las tres funciones comparten la misma infraestructura del runtime ONNX, por lo que una única configuración CUDA acelera toda tu pipeline de ML. Configura una vez, obtén beneficios en todas partes.
Despliegue Flexible
Puntuación de IA se integra directamente en los flujos de trabajo ya existentes de Descubrimiento de Datos:
- Habilítalo a través de la configuración del tipo de reporte—sin cambios en infraestructura requeridos
- Funciona con archivos CSV, XML, JSON, PDF, Parquet y texto no estructurado
- Personaliza los pesos de puntuación para adaptarlos a la tolerancia al riesgo de tu organización
- Entrena modelos ONNX personalizados para patrones de datos específicos de región o industria
Beneficios Clave del Descubrimiento de Datos con Puntuación de IA
| Antes | Después |
|---|---|
| Altas tasas de falsos positivos | Coincidencias validadas por ML con puntuaciones de confianza |
| Revisión manual de cada alerta | Enfócate solo en elementos con baja confianza |
| Sólo coincidencia de patrones | Clasificación consciente del contexto |
| Procesamiento limitado a CPU | Aceleración GPU opcional |
Comienza Ahora
Puntuación de IA está disponible ahora en DataSunrise. Actívalo en la configuración de tus tareas de Descubrimiento de Datos y empieza a ver resultados más claros y accionables de inmediato.
Para opciones de configuración detalladas, consulta las secciones nuevas o actualizadas en nuestra Guía del Usuario.
Información adicional
Documentación NVIDIA CUDA
ONNX Runtime
Protege tus datos con DataSunrise
Protege tus datos en cada capa con DataSunrise. Detecta amenazas en tiempo real con Monitoreo de Actividad, Enmascaramiento de Datos y Firewall para Bases de Datos. Garantiza el Cumplimiento de Datos, descubre información sensible y protege cargas de trabajo en más de 50 integraciones de fuentes de datos compatibles en la nube, en instalaciones y sistemas de IA.
Empieza a proteger tus datos críticos hoy
Solicita una Demostración Descargar Ahora