DataSunrise Obtient le Statut Compétence DevOps AWS dans AWS DevSecOps et Surveillance, Journalisation, Performance

Améliorer les requêtes Redshift avec des expressions CASE WHEN

Améliorer les requêtes Redshift avec des expressions CASE WHEN

Redshift Case When

Introduction

Lorsque vous utilisez l’entrepôt de données Amazon Redshift, vous pouvez avoir besoin d’utiliser une logique conditionnelle pour interroger et transformer vos données. L’expression ‘CASE WHEN’ aide à évaluer les conditions et à renvoyer des résultats différents selon que les conditions sont vraies ou fausses.

Dans cet article, nous allons plonger dans les bases de l’utilisation des expressions ‘CASE WHEN’ dans Redshift SQL. Nous aborderons également l’instruction ELSE au cours de la discussion. Vous apprendrez la syntaxe, verrez des exemples et comprendrez les cas d’utilisation courants. À la fin, vous serez équipé pour exploiter cette logique conditionnelle SQL essentielle dans vos propres requêtes Redshift.

Syntaxe CASE WHEN

La syntaxe générale pour une expression CASE WHEN dans Redshift est :

CASE
WHEN condition1 THEN result1
WHEN condition2 THEN result2
...
ELSE default_result
END

Voici comment cela fonctionne :

  • Le mot-clé CASE signale le début de l’expression conditionnelle
  • Vous spécifiez une ou plusieurs clauses WHEN contenant chacune une condition à évaluer
  • Pour la première condition qui s’avère vraie, le résultat THEN correspondant est renvoyé
  • Si aucune des conditions n’est vraie, le défaut de ELSE default_result est renvoyé
  • Le mot-clé END signale la fin de l’expression CASE

Jetons un coup d’œil à un simple exemple pour illustrer. Imaginez une table “utilisateurs” avec des colonnes pour id, nom et âge. Pour catégoriser les utilisateurs comme ‘enfant’, ‘adulte’ ou ‘sénior’ en fonction de l’âge, vous pourriez utiliser :

SELECT id, name,
CASE
WHEN age < 18 THEN 'enfant'
WHEN age < 65 THEN 'adulte'
ELSE 'sénior'
END AS age_category
FROM users;

Cela évaluerait chaque ligne, vérifierait l’âge de l’utilisateur et renverrait la catégorie d’âge correspondante.

Création de données d’exemple

Pour démontrer des exemples plus complexes de CASE WHEN, créons d’abord quelques données d’exemple. Exécutez la SQL suivante dans Redshift pour créer une table “commandes” :

CREATE TABLE orders (
order_id INT,
customer_id INT,
order_date DATE,
total DECIMAL(10,2),
status VARCHAR(20)
);
INSERT INTO orders
VALUES
(1, 101, '2023-01-15', 150.00, 'completed'),
(2, 102, '2023-02-10', 75.50, 'pending'),
(3, 101, '2023-03-01', 200.00, 'completed'),
(4, 103, '2023-03-05', 120.00, 'cancelled'),
(5, 102, '2023-04-12', 300.00, 'completed');

Cette expression simple crée une table de commandes avec quelques enregistrements d’exemple sur lesquels nous pouvons maintenant exécuter des expressions CASE.

Utiliser CASE pour dériver de nouvelles colonnes

Les instructions CASE peuvent être utilisées pour créer de nouvelles colonnes dans un ensemble de données en catégorisant les données existantes. Lors de l’organisation des commandes par montant total, une instruction CASE peut définir les règles pour chaque groupe.

Les commandes de moins de 100 $ sont “Low Value”. La plage des commandes entre 100 $ et 500 $ est “Medium Value”. Les commandes supérieures à 500 $ sont “High Value”. Vous pouvez facilement catégoriser les données d’un ensemble de données en utilisant une instruction CASE, ce qui aide à l’analyse et à la compréhension.

SELECT order_id, customer_id, total,
CASE
WHEN total < 100 THEN 'small'
WHEN total < 250 THEN 'medium'
ELSE 'large'
END AS order_size
FROM orders;

Cela renverrait :

order_id | customer_id | total  | order_size
----------------------------------------------
1        | 101         | 150.00 | medium
2        | 102         | 75.50  | small
3        | 101         | 200.00 | medium
4        | 103         | 120.00 | medium
5        | 102         | 300.00 | large

Aggregate avec CASE

Les expressions CASE sont également très utiles dans les fonctions d’agrégation comme SUM() et COUNT(). Par exemple, pour compter le nombre de petites, moyennes et grandes commandes :

SELECT
COUNT(CASE WHEN total < 100 THEN 1 END) AS small_orders,
COUNT(CASE WHEN total >= 100 AND total < 250 THEN 1 END) AS medium_orders,
COUNT(CASE WHEN total >= 250 THEN 1 END) AS large_orders
FROM orders;

Cela renverrait :

small_orders | medium_orders | large_orders
--------------------------------------------
1            | 3             | 1

Dans chaque COUNT(), le CASE renvoie 1 lorsque la condition est remplie, que le COUNT() additionne ensuite.

CASE dans les clauses WHERE et HAVING

Vous pouvez également utiliser des expressions CASE dans les clauses WHERE et HAVING pour filtrer les résultats en fonction de la logique conditionnelle. Par exemple, pour trouver tous les clients qui ont passé une ‘grande’ commande :

SELECT DISTINCT customer_id
FROM orders
WHERE
CASE
WHEN total >= 250 THEN 'large'
ELSE 'not large'
END = 'large';

Cela renverrait le client 102, car c’est le seul avec une ‘grande’ commande de plus de 250 $.

Gérer les valeurs NULL

Les expressions CASE sont également utiles pour gérer les valeurs NULL. Vous pouvez utiliser CASE pour remplacer les NULL par une valeur par défaut ou pour appliquer une logique différente lorsqu’une valeur est NULL.

Par exemple, si notre table “commandes” avait une colonne “shipped_date” qui pourrait être NULL si la commande n’a pas encore été expédiée. Pour renvoyer ‘Non expédié’ pour ces commandes :

SELECT order_id, status,
CASE
WHEN shipped_date IS NULL THEN 'Not Shipped'
ELSE CAST(shipped_date AS VARCHAR(10))
END AS shipped
FROM orders;

Cela vérifie si shipped_date IS NULL, et si oui, renvoie ‘Not Shipped’. Sinon, il convertit shipped_date en chaîne pour le renvoyer. Nous devons noter ici que l’utilisation de NVL ou COALESCE peut être un meilleur choix.

Conseils pour l’utilisation de CASE WHEN

Voici quelques conseils à garder à l’esprit lors de l’utilisation d’expressions CASE WHEN dans Redshift :

  • Les expressions CASE peuvent être imbriquées les unes dans les autres pour une logique plus complexe
  • La clause ELSE est optionnelle et, si elle est omise, NULL sera renvoyé si aucune condition ne correspond
  • Les expressions CASE peuvent être utilisées presque partout dans une instruction SQL, y compris les clauses SELECT, WHERE, HAVING, GROUP BY et ORDER BY
  • Faites attention aux types de données – les résultats d’une expression CASE doivent tous être convertibles en un type de données commun

Résumé

L’expression CASE WHEN est un outil polyvalent pour appliquer une logique conditionnelle dans les requêtes SQL de Redshift. Vous pouvez l’utiliser pour dériver de nouvelles colonnes, agréger des données, filtrer des résultats, gérer les valeurs NULL, et bien plus encore.

En comprenant la syntaxe et les cas d’utilisation courants, vous serez en mesure d’écrire du SQL plus puissant et efficace pour analyser vos données dans Redshift.

DataSunrise propose des outils conviviaux et flexibles pour la sécurité des bases de données, l’audit et la conformité qui s’intègrent parfaitement avec Amazon Redshift. Visitez le site Web de DataSunrise pour demander une démonstration en ligne de notre équipe d’experts.

Visitez le site Web de DataSunrise pour demander une démonstration en ligne de notre équipe d’experts.

Suivant

Clause LIMIT de Snowflake : Un Utilitaire Pratique pour la Gestion des Données

Clause LIMIT de Snowflake : Un Utilitaire Pratique pour la Gestion des Données

En savoir plus

Besoin de l'aide de notre équipe de support ?

Nos experts seront ravis de répondre à vos questions.

Informations générales :
[email protected]
Service clientèle et support technique :
support.datasunrise.com
Demandes de partenariat et d'alliance :
[email protected]