DataSunrise Consegue la Certificazione AWS DevOps Competency per AWS DevSecOps e Monitoraggio, Logging e Performance

Registro di Audit di Amazon Redshift

Amazon Redshift è ampiamente utilizzato per carichi di lavoro analitici su larga scala, supportando dashboard BI, pipeline ETL e query di data science su cluster distribuiti. Man mano che gli ambienti Redshift crescono e diventano condivisi tra team, applicazioni e servizi automatizzati, le organizzazioni devono mantenere una visibilità affidabile su come i dati vengono accessi e modificati. Questo requisito rende un registro di audit strutturato di Amazon Redshift un elemento fondamentale per la sicurezza, la governance e la conformità normativa, strettamente legato a pratiche più ampie come il monitoraggio dell’attività del database e la cronologia delle attività sui dati.

A differenza dei database transazionali, Redshift esegue query su più nodi di calcolo e mantiene i metadati in una combinazione di tabelle di sistema e log di servizio. Sebbene questi record contengano informazioni preziose, non sono progettati per funzionare da registro di audit completo da soli. Ricostruire una sequenza chiara di eventi, correlare gli utenti alle azioni e dimostrare conformità richiede spesso ulteriori elaborazioni e correlazioni, specialmente in ambienti soggetti a rigide normative di conformità sui dati.

Questo articolo spiega come funziona il logging di audit in Amazon Redshift, facendo riferimento alle funzionalità native descritte nella documentazione ufficiale di Amazon Redshift, e mostra come le piattaforme di audit centralizzate estendano i registri di audit di Redshift in una traccia di audit completa e pronta per la conformità, in linea con i requisiti moderni di audit trail del database.

Importanza del Registro di Audit

In piattaforme analitiche come Amazon Redshift, i dati sono spesso accessi simultaneamente da molti utenti, servizi e pipeline automatizzate. Le query possono essere generate da strumenti BI, job programmati, carichi di lavoro di machine learning o attività utente ad hoc. Senza un registro di audit affidabile, diventa difficile comprendere chi ha accesso a dati specifici, come sono stati utilizzati e se tale accesso è stato conforme alle policy interne o ai requisiti normativi. Questa sfida è ancora più evidente in ambienti che si affidano a un continuo monitoraggio dell’attività del database per mantenere la visibilità attraverso sistemi distribuiti.

Un registro di audit gioca un ruolo fondamentale nell’instaurare responsabilità. Consente alle organizzazioni di tracciare le azioni sul database fino a utenti o applicazioni individuali, rendendo possibile indagare sugli incidenti, convalidare l’uso corretto dei dati e risolvere dispute relative ad accessi non autorizzati o modifiche inaspettate ai dati. In pratica, questo livello di tracciabilità è un obiettivo centrale di una ben definita traccia di audit del database.

I registri di audit sono inoltre essenziali per la visibilità operativa. Quando si verificano problemi di performance, anomalie nei dati o modifiche inaspettate allo schema, i record di audit aiutano i team a ricostruire la sequenza degli eventi che ha portato al problema. Questa visibilità riduce i tempi di troubleshooting e supporta un’analisi delle cause radice più rapida in ambienti complessi e distribuiti dove mantenere una coerente cronologia dell’attività dei dati è cruciale.

Da un punto di vista della conformità, i registri di audit servono come prove formali durante revisioni interne e audit esterni. Regolamenti come GDPR, HIPAA, PCI DSS e SOX richiedono alle organizzazioni di dimostrare il controllo sull’accesso e la gestione dei dati. Un registro di audit ben mantenuto fornisce la prova storica necessaria per dimostrare che i dati sensibili sono stati accessi correttamente e monitorati con costanza.

In implementazioni Redshift su larga scala, il registro di audit non è solo un artefatto di sicurezza. Diventa uno strumento operativo e di governance che supporta fiducia, trasparenza e controllo a lungo termine sulle piattaforme di dati analitici.

Capacità Native di Logging di Audit di Amazon Redshift

Amazon Redshift offre diversi meccanismi nativi per la raccolta dei dati rilevanti ai fini di audit riguardanti l’esecuzione delle query, l’accesso utente e l’attività amministrativa. Questi meccanismi espongono telemetria a basso livello che può essere utilizzata per ricostruire l’attività sul database, analizzare i modelli di utilizzo e supportare le revisioni di sicurezza. Tuttavia, i dati sono distribuiti su più fonti, ognuna cattura un aspetto specifico del comportamento del sistema.

Tabelle e Views di Sistema

Redshift conserva informazioni storiche dettagliate su query, utenti e sessioni in tabelle e views di sistema interne. Queste tabelle costituiscono la fonte primaria di visibilità nativa per gli audit e sono comunemente interrogate per analisi delle attività e indagini.

Esecuzione delle Query e Attività di Sessione

La tabella STL_QUERY cattura metadati di esecuzione delle query ad alto livello, inclusi tempi di esecuzione, identità dell’utente e stati di errore.

SELECT
    query,
    userid,
    starttime,
    endtime,
    aborted,
    substring
FROM stl_query
ORDER BY starttime DESC
LIMIT 20;

Questa query consente agli amministratori di rivedere le esecuzioni recenti delle query, identificare query fallite e correlare il tempo di esecuzione con l’attività utente.

La visibilità su sessioni e autenticazioni è fornita da STL_CONNECTION_LOG, che registra tentativi di connessione sia riusciti che falliti.

SELECT
    recordtime,
    remotehost,
    username,
    event,
    pid
FROM stl_connection_log
ORDER BY recordtime DESC
LIMIT 20;

Questi dati sono comunemente utilizzati per auditare i comportamenti di login, rilevare fallimenti di autenticazione ripetuti e identificare fonti di connessione insolite.

Modifiche allo Schema e agli Oggetti (DDL)

Le modifiche strutturali sono tracciate attraverso la tabella STL_DDLTEXT, che registra le istruzioni di Data Definition Language eseguite sul cluster.

SELECT
    xid,
    starttime,
    text
FROM stl_ddltext
ORDER BY starttime DESC
LIMIT 20;

Questa tabella è essenziale per auditare l’evoluzione dello schema, tracciare creazioni o cancellazioni di tabelle e convalidare modifiche amministrative.

Ricostruzione Completa del Testo SQL

Per istruzioni SQL lunghe o complesse, Redshift divide il testo della query in più segmenti interni. La view SVL_STATEMENTTEXT ricostruisce tali frammenti in istruzioni leggibili.

SELECT
    query,
    sequence,
    text
FROM svl_statementtext
WHERE query = 123456
ORDER BY sequence;

Questa funzionalità è particolarmente utile quando si auditano SQL generati da strumenti BI o framework ETL che producono query in più parti.

Attività di Accesso e Modifica dei Dati

La tabella STL_SCAN fornisce visibilità su quali tabelle sono state lette durante l’esecuzione di una query, includendo numero di righe e contesto di esecuzione.

SELECT
    query,
    tbl,
    rows,
    bytes
FROM stl_scan
ORDER BY query DESC
LIMIT 20;

Per le operazioni di modifica dei dati, Redshift espone attività di insert e delete tramite tabelle di sistema dedicate.

SELECT
    query,
    tbl,
    rows
FROM stl_insert
ORDER BY query DESC
LIMIT 20;
SELECT
    query,
    tbl,
    rows
FROM stl_delete
ORDER BY query DESC
LIMIT 20;

Insieme, queste tabelle permettono agli amministratori di analizzare l’attività di lettura e scrittura a livello di oggetto. Tuttavia, tutte le tabelle di sistema sono locali al nodo e con ritenzione limitata. I record più vecchi vengono automaticamente cancellati durante il funzionamento del sistema, e una ricostruzione significativa dell’audit richiede correlazione manuale tra più tabelle.

Audit Logging del Database su Amazon S3

Oltre alle tabelle di sistema, Amazon Redshift supporta l’esportazione dei registri di audit direttamente su Amazon S3. Quando abilitato, Redshift consegna continuamente i file di log a un bucket S3, offrendo uno storage durevole al di fuori del ciclo di vita del cluster.

Il logging di audit su S3 è configurato a livello di cluster. Una volta abilitato, Redshift scrive automaticamente i log senza necessità di configurazione a livello di query.

AuditLogging = Enabled
S3BucketName = redshift-audit-logs

Redshift consegna a S3 molteplici tipi di log, inclusi:

  • Log delle attività utente
  • Log di connessione
  • Log di autenticazione utente
  • Eventi DDL e amministrativi

Questi log sono scritti come file partizionati per intervalli temporali e possono essere consumati da sistemi esterni. Un modello comune prevede interrogarli tramite Athena o pipeline di analytics a valle.

SELECT
    user_name,
    database_name,
    query_text,
    record_time
FROM redshift_audit_logs
WHERE record_time > current_timestamp - interval '1 day';

Archiviare i log di audit in Amazon S3 permette una ritenzione più lunga, uno storage centralizzato e l’integrazione con strumenti SIEM o di compliance. I log conservano i dettagli grezzi di esecuzione e accesso e rimangono disponibili indipendentemente dagli eventi del ciclo di vita del cluster Redshift.

Contemporaneamente, i log esportati restano file piatti non correlati. Non forniscono una timeline di esecuzione unificata, un contesto cross-sessione, né meccanismi integrati per reporting di conformità e enforcement di policy.

Audit Logging Centralizzato di Amazon Redshift con DataSunrise

Per costruire una traccia di audit strutturata sopra il logging nativo di Redshift, le organizzazioni spesso implementano piattaforme di audit centralizzate che aggregano, normalizzano e arricchiscono i dati di audit di Redshift.

DataSunrise estende il logging di audit di Amazon Redshift operando come motore centralizzato di audit e cronologia delle attività. Raccoglie eventi generati da Redshift e li trasforma in record di audit strutturati e ricercabili, adatti ad analisi operative e workflow di conformità.

Raccolta Unificata del Registro di Audit

DataSunrise consolida i segnali di audit di Redshift da più fonti in un unico flusso di audit. Ciò include attività di query, eventi di autenticazione, modifiche allo schema e accesso ad oggetti sensibili. Normalizzando questi dati, crea un formato di audit coerente tra sessioni, utenti e cluster, conformandosi alle best practice per il monitoraggio centralizzato dell’attività del database.

  • DataSunrise aggrega i segnali di audit di Amazon Redshift da tabelle di sistema, log esportati e metadati di accesso in un flusso di audit unificato.
  • L’esecuzione delle query, gli eventi di autenticazione, le modifiche allo schema e l’accesso a oggetti sensibili vengono normalizzati in una struttura coerente.
  • La raccolta unificata elimina la frammentazione tra sessioni, utenti e cluster, abilitando una visibilità centralizzata dell’audit.

Audit Trail Consapevoli del Contesto

Ogni evento di audit è arricchito con metadati contestuali che chiariscono come e perché un’azione è avvenuta. Questo contesto permette ai record di audit di andare oltre i dettagli grezzi di esecuzione e di diventare utilizzabili per indagini e flussi di lavoro di conformità, similmente agli obiettivi di una ben definita traccia di audit del database.

  • Ogni evento di audit è arricchito con identità utente, ruolo e contesto di sessione per una chiara attribuzione.
  • Applicazione sorgente, tipo di client e timestamp di esecuzione sono aggiunti per fornire contesto operativo.
  • Oggetti accessi, categorie di dati e rilevanza per la conformità sono associati a ogni evento.
  • I record di audit arricchiti sono adatti per analisi forense e reportistica normativa.

Regole di Audit Dettagliate

Invece di catturare indiscriminatamente ogni evento, DataSunrise consente politiche di audit granulari che si concentrano su attività di alto valore e alto rischio. Questo approccio selettivo rispecchia le indicazioni moderne sulla progettazione di regole di audit efficaci per ambienti di database complessi.

  • DataSunrise supporta politiche di audit a granularità fine invece della cattura totale degli eventi.
  • Le regole possono mirare a schemi specifici, tabelle e categorie di dati sensibili.
  • Utenti privilegiati, account di servizio e operazioni ad alto rischio come DDL o esportazioni massive possono essere auditati selettivamente.
  • Le regole di audit focalizzate riducono il rumore assicurando che l’attività critica venga catturata completamente.
Senza titolo - Screenshot della dashboard DataSunrise che mostra il menu di navigazione e i dettagli della versione.
Lo screenshot mostra l’interfaccia della dashboard DataSunrise con un menu di navigazione a sinistra, incluse sezioni come Conformità dei dati, Regole di Audit, Analytics, Sicurezza.

Cronologia Centralizzata delle Attività

Tutti i dati di audit raccolti e arricchiti da DataSunrise sono conservati in una cronologia centralizzata delle attività. Questo repository fornisce una vista continua e ordinata temporalmente dell’attività sul database attraverso gli ambienti Redshift, supportando analisi a lungo termine della cronologia delle attività dei dati.

  • Tutti gli eventi di audit sono memorizzati in un repository centralizzato della cronologia delle attività.
  • La cronologia delle attività fornisce una timeline continua tra cluster e ambienti.
  • La centralizzazione semplifica le indagini e accelera l’analisi delle cause radice.
  • Una vista unificata migliora la visibilità operativa in ambienti analitici distribuiti.

Allineamento a Conformità e Regolamentazioni

Amazon Redshift è frequentemente implementato in ambienti soggetti a rigidi requisiti normativi. Una strategia strutturata per il registro di audit è essenziale per dimostrare controllo sull’accesso e sulla gestione dei dati e per allinearsi alle riconosciute normative di conformità sui dati.

  • Gli ambienti Amazon Redshift sono comunemente regolati da GDPR, HIPAA, PCI DSS e SOX.
  • Una strategia strutturata per i registri di audit garantisce registrazioni coerenti e verificabili dell’attività sul database.
  • Le piattaforme di audit centralizzato supportano la generazione di prove per audit e valutazioni di conformità.
  • La gestione automatizzata dei dati di audit riduce sforzi manuali e oneri di conformità.
Senza titolo - Interfaccia DataSunrise che mostra la sezione Conformità dei dati
Screenshot dell’interfaccia DataSunrise che mostra la sezione ‘Conformità dei dati’.

Principali Vantaggi di DataSunrise

Vantaggio Descrizione
Raccolta Unificata del Registro di Audit Consolida i segnali di audit di Amazon Redshift da tabelle di sistema, log esportati e metadati di accesso in un unico flusso di audit normalizzato, eliminando la frammentazione tra sessioni, utenti e cluster.
Audit Trail Consapevoli del Contesto Arricchisce ogni evento di audit con identità utente, ruolo, applicazione sorgente, oggetti accessi, timestamp di esecuzione e contesto di conformità per supportare indagini e reportistica.
Regole di Audit Dettagliate Permette politiche di audit a granularità fine focalizzate su schemi specifici, tabelle, categorie di dati sensibili, utenti privilegiati e operazioni ad alto rischio come DDL o esportazioni massive.
Cronologia Centralizzata delle Attività Conserva tutti gli eventi di audit in una cronologia delle attività unificata e ordinata temporalmente, offrendo visibilità continua tra ambienti Redshift e semplificando l’analisi forense.
Allineamento a Conformità e Regolamentazioni Supporta la conformità a GDPR, HIPAA, PCI DSS e SOX mantenendo registri di audit coerenti e verificabili e abilitando la generazione di prove per audit e valutazioni.
Riduzione degli Oneri Operativi Minimizza la correlazione e analisi manuale dei log centralizzando, normalizzando e strutturando i dati di audit per una revisione efficiente e una conservazione a lungo termine.

Conclusione

Amazon Redshift fornisce logging di audit nativo tramite tabelle di sistema e file di log esportati, formando la base per il tracciamento delle attività e la visibilità operativa. Tuttavia, produrre un record di audit strutturato e completo in ambienti distribuiti richiede raccolta e arricchimento centralizzati.

Estendendo i registri di audit di Redshift in una storia di audit unificata e ricercabile, DataSunrise consente alle organizzazioni di ottenere visibilità coerente, allineamento alla conformità e chiarezza operativa attraverso la loro infrastruttura analitica.

Per i team che gestiscono Amazon Redshift in ambienti regolamentati o sensibili alla sicurezza, una strategia strutturata di registro di audit basata su capacità centralizzate di data audit è una componente critica di operazioni responsabili sui dati.

Ha bisogno del nostro team di supporto?

I nostri esperti saranno lieti di rispondere alle Sue domande.

Informazioni generali:
[email protected]
Servizio clienti e supporto tecnico:
support.datasunrise.com
Richieste di collaborazione e alleanza:
[email protected]