DataSunrise Logra el Estado de Competencia en AWS DevOps en AWS DevSecOps y Monitoreo, Registro, Rendimiento

Integración de Snowflake con Looker

Integración de Snowflake con Looker

Imagen de contenido de Snowflake Looker

Introducción

Snowflake, una plataforma de almacenamiento de datos basada en la nube, y Looker, una herramienta de inteligencia de negocio y visualización de datos moderna, son dos de las herramientas más populares para la analítica de datos hoy en día. Integrar Snowflake y Looker permite a las organizaciones aprovechar el poder del almacenamiento de datos escalable y flexible de Snowflake con las capacidades intuitivas de exploración de datos y creación de paneles de Looker.

En este artículo, cubriremos los aspectos básicos del uso de Snowflake con Looker, incluyendo cómo configurar la integración, gestionar usuarios y roles, implementarseguridad a nivel de filas, usar la capa de modelado LookML de Looker con Snowflake, y aplicar mejores prácticas de gobernanza de datos. Al final, tendrás una base sólida para construir una pila de analítica moderna con Snowflake y Looker.

Configurando la integración de Snowflake Looker

El primer paso es conectar tu cuenta de Snowflake a Looker.

Así es como:

  1. En Looker, ve a Admin > Connections y haz clic en “New Connection”.
  2. Selecciona “Snowflake” como el dialecto.
  3. Introduce la URL de tu cuenta de Snowflake, nombre de usuario, y contraseña.
  4. Selecciona la base de datos, esquema, y almacén predeterminados a usar.
  5. Prueba la conexión y guarda.

Por ejemplo:


Connection Name: My Snowflake Connection 
Dialect: snowflake
Host: myaccount.snowflakecomputing.com
Database: MYDB
Schema: PUBLIC
Warehouse: MYWH

Una vez configurada la conexión, Looker ahora puede consultar los datos almacenados en tu cuenta de Snowflake. El siguiente paso es crear un proyecto LookML para modelar y explorar estos datos.

Modelando datos de Snowflake en Looker usando LookML

LookML es el lenguaje de modelado de Looker para describir el esquema de tu base de datos de una manera controlable por versiones. En lugar de escribir consultas SQL, defines tu modelo de datos en LookML y dejas que Looker genere SQL optimizado por ti. Esto promueve la reutilización y consistencia en tu equipo de datos.

Arquitectura de Snowflake Looker

Este es un ejemplo de una vista LookML simple para una tabla de usuarios en Snowflake:


view: users {
  sql_table_name: MYDB.PUBLIC.USERS ;;
  dimension: user_id {
    primary_key: yes
    type: number
    sql: ${TABLE}.ID ;;
  }

  dimension: name {
    type: string 
    sql: ${TABLE}.NAME ;;
  }

  dimension: email {
    type: string
    sql: ${TABLE}.EMAIL ;;
  }

  measure: count {
    type: count
  }
}

Esta vista se mapea a la tabla USERS en Snowflake y define dimensiones y medidas que pueden ser usadas en la sección Explore de Looker para crear gráficos y paneles.

Algunos conceptos clave de LookML para entender al modelar datos de Snowflake en Looker:

  • Las vistas se mapean a tablas o tablas derivadas
  • Las dimensiones se mapean a columnas y pueden ser usadas para agrupación y filtrado
  • Las medidas son agregaciones como COUNT, SUM, AVG
  • Puedes definir relaciones entre vistas que Looker usará para unir tablas automáticamente

Looker maneja automáticamente la generación del dialecto SQL óptimo para la base de datos Snowflake a la que está conectado. Esto abstrae las complejidades de la base de datos subyacente y permite a los analistas centrarse en hacer preguntas y obtener insights.

Gestión de roles y usuarios en Snowflake y Looker

Al configurar Snowflake y Looker para tu organización, es crucial gestionar adecuadamente los roles y usuarios para asegurar que el acceso a los datos esté restringido de manera adecuada. Snowflake proporciona un extenso control de acceso basado en roles, y Looker te permite asignar roles y privilegios de Snowflake a grupos de Looker.

Roles en Snowflake

En Snowflake, los roles son la base para los privilegios y el control de acceso. Algunos conceptos clave:

  • Los roles pueden ser asignados con privilegios a bases de datos específicas, esquemas, tablas y vistas
  • Los roles pueden ser asignados a usuarios y otros roles
  • Snowflake tiene varios roles definidos por el sistema como ACCOUNTADMIN, SYSADMIN, SECURITYADMIN
  • Es una mejor práctica crear roles personalizados específicos para las necesidades de tu organización

Por ejemplo, para crear un rol ANALYST que pueda leer datos en la base de datos MYDB:


USE ROLE SECURITYADMIN;
CREATE ROLE ANALYST;
GRANT USAGE ON DATABASE MYDB TO ROLE ANALYST;
GRANT USAGE ON ALL SCHEMAS IN DATABASE MYDB TO ROLE ANALYST;
GRANT SELECT ON ALL TABLES IN DATABASE MYDB TO ROLE ANALYST;
GRANT SELECT ON FUTURE TABLES IN DATABASE MYDB TO ROLE ANALYST;

Este rol ahora puede ser asignado a usuarios o grupos de Snowflake que necesiten acceso de solo lectura a los datos en MYDB para propósitos de análisis.

Roles y grupos en Looker

En Looker, asignas roles y privilegios a grupos, que son colecciones de usuarios de Looker. Los roles de Snowflake pueden ser mapeados a grupos de Looker para extender el control de acceso de Snowflake a la capa de Looker.

Para mapear un rol de Snowflake a un grupo de Looker:

  1. Ve a Admin > Groups en Looker
  2. Crea un nuevo grupo o edita uno existente
  3. Bajo Roles, selecciona la conexión de Snowflake y elige el rol de Snowflake a asignar
  4. Cualquier usuario agregado a este grupo de Looker ahora tendrá los privilegios del rol de Snowflake asignado al explorar datos a través de Looker

Por ejemplo, podrías crear un grupo de Looker llamado “Analistas de Negocios”, asignarle el rol ANALYST de Snowflake mencionado antes, y agregar todos tus usuarios analistas de Looker a este grupo. Estarán restringidos a consultas de solo lectura en la base de datos MYDB.

La combinación de roles de Snowflake y grupos de Looker proporciona una forma poderosa de gestionar el acceso a los datos en tu pila de analítica de Snowflake Looker. Al adoptar un enfoque estratégico para configurar estos permisos, puedes asegurar que las personas adecuadas tengan acceso a los datos correctos.

Implementando seguridad a nivel de filas con Snowflake y Looker

La seguridad a nivel de filas restringe el acceso a los datos a nivel de fila individual basado en atributos del usuario. Esto es importante para asegurar que los usuarios solo vean los datos que están autorizados a acceder. Snowflake y Looker soportan seguridad a nivel de filas aprovechando Secure Views en Snowflake y User Attributes en Looker.

Secure Views en Snowflake

Secure Views en Snowflake son vistas que hacen referencia a otros objetos de la base de datos y aplican políticas de seguridad a nivel de filas mediante predicados SQL.

Por ejemplo, supongamos que tenemos una tabla de ORDERS y solo queremos que los usuarios puedan ver sus propias órdenes. Podríamos crear una vista segura como esta:


CREATE SECURE VIEW MY_ORDERS AS
SELECT * 
FROM ORDERS
WHERE USER_ID = CURRENT_USER();

La función CURRENT_USER() devuelve el nombre del usuario de Snowflake actualmente conectado. Esta vista segura solo devolverá filas de la tabla ORDERS donde la columna USER_ID coincida con el usuario actual.

Atributos de usuario en Looker

Looker te permite definir Atributos de Usuario, que son pares clave-valor asociados con cuentas de usuario. Estos atributos pueden ser pasados a las consultas para filtrar dinámicamente los datos basados en el usuario actual.

Para configurar un Atributo de Usuario en Looker:

  1. Ve a Admin > User Attributes
  2. Define un nuevo atributo, por ejemplo, “snowflake_user”
  3. Establece el valor de este atributo para cada usuario de Looker para que coincida con su nombre de usuario de Snowflake.

Ahora en tu modelo LookML, puedes referenciar este atributo de usuario en el SQL para tu vista:


view: orders {
  sql_table_name: MYDB.PUBLIC.ORDERS ;;

  dimension: user_id {
    type: number
    sql: ${TABLE}.USER_ID ;; 
  }

  dimension: order_id {
    primary_key: yes
    type: number
    sql: ${TABLE}.ORDER_ID ;;
  }

  dimension: total_amount {
    type: number
    sql: ${TABLE}.TOTAL_AMOUNT ;;
  }

  dimension: order_date {
    type: date
    sql: ${TABLE}.ORDER_DATE ;;
  }

  measure: count {
    type: count
  }

  measure: total_sales {
    type: sum
    sql: ${total_amount} ;;
  }

  # Aquí añadimos un filtro basado en el atributo de usuario "snowflake_user" 
  filter: user_filter {
    type: string
    sql: {% condition user_id %} ${user_id} {% endcondition %} ;;
  }
}

Con esta configuración, Looker añadirá automáticamente una cláusula WHERE a cualquier consulta contra la vista ORDERS para filtrar los resultados basados en el valor del atributo de usuario “snowflake_user” del usuario actual. El resultado final es que los usuarios solo pueden ver sus propios datos de órdenes al explorar estos datos en Looker.

Al combinar vistas seguras en Snowflake con atributos de usuario en Looker, puedes implementar políticas de seguridad a nivel de filas granulares y dinámicas en tus datos. Esta es una forma poderosa de garantizar el cumplimiento de las regulaciones de privacidad de datos y proteger la información sensible.

Conclusión

La integración de Snowflake y Looker permite a las organizaciones construir una plataforma de analítica moderna y escalable. Al aprovechar las poderosas capacidades de almacenamiento de datos de Snowflake con la capa de modelado y exploración de datos flexible de Looker, los equipos de datos pueden proporcionar acceso seguro y de autoservicio a los datos en toda la organización.

En este artículo, cubrimos los aspectos clave de usar Snowflake con Looker juntos:

  • Configurar la conexión de Snowflake en Looker
  • Modelar datos de Snowflake usando el LookML de Looker
  • Gestionar usuarios y roles en toda la organización en Snowflake
  • Implementar seguridad a nivel de filas con vistas seguras y atributos de usuario

Los ejemplos proporcionados sirven como referencia para implementar estos conceptos en tu propio entorno de Snowflake Looker. Al configurar adecuadamente roles, privilegios y seguridad a nivel de filas, puedes asegurar que los datos sean accedidos de manera segura y apropiada en toda la organización.

Hay muchas más capacidades avanzadas en la integración de Snowflake y Looker, como el uso de PDTs (tablas derivadas persistentes) de Looker, aprovechar la clonación sin copiar de Snowflake para flujos de trabajo de desarrollo, y optimizar el rendimiento de las consultas. Te animo a explorar estos temas más a fondo mientras construyes tu pila de analítica.

La combinación de Snowflake y Looker es una base poderosa para cualquier organización basada en datos. Siguiendo las mejores prácticas en torno al modelado de datos, seguridad y gobernanza, puedes empoderar a tu equipo para obtener valiosos conocimientos de forma rápida y segura.

Siguiente

Capacidades de Gestión de Datos de Snowflake

Capacidades de Gestión de Datos de Snowflake

Más información

¿Necesita la ayuda de nuestro equipo de soporte?

Nuestros expertos estarán encantados de responder a sus preguntas.

Información general:
[email protected]
Servicio al Cliente y Soporte Técnico:
support.datasunrise.com
Consultas sobre Asociaciones y Alianzas:
[email protected]