Types de Bases de Données - Guides de Connexion Détaillés

Ce guide fournit des instructions détaillées pour se connecter à chaque type de base de données pris en charge, y compris où trouver les informations d'identification et les exigences de configuration spécifiques.

MySQL & MariaDB

MySQL et MariaDB sont des systèmes de gestion de bases de données relationnelles open-source populaires. Ils partagent les mêmes paramètres de connexion.

Paramètres de Connexion

  • Hôte: L'adresse IP ou le nom d'hôte de votre serveur MySQL
  • Port: La valeur par défaut est 3306, mais peut varier
  • Nom de la Base de Données: La base de données spécifique à laquelle vous souhaitez vous connecter
  • Nom d'Utilisateur: Votre nom d'utilisateur MySQL
  • Mot de Passe: Votre mot de passe MySQL

Où Trouver les Informations d'Identification

  • Auto-hébergé: Vérifiez vos fichiers de configuration MySQL ou contactez votre administrateur système
  • cPanel/Hébergement partagé: Disponible dans votre panneau de contrôle d'hébergement sous "Bases de données MySQL"
  • AWS RDS: Disponible dans la console AWS RDS
  • Google Cloud SQL: Disponible dans la console Google Cloud
  • Azure Database: Disponible sur le portail Azure

Problèmes de Connexion Courants

  • Assurez-vous que votre base de données autorise les connexions externes
  • Vérifiez les paramètres du pare-feu sur le port 3306
  • Vérifiez que l'utilisateur a la permission de se connecter à distance
  • Pour les services cloud, assurez-vous que votre IP est sur la liste blanche

Exemple de Configuration

Hôte: mysql.example.com
Port: 3306
Base de Données: ma_base_de_donnees
Nom d'Utilisateur: utilisateur_bd
Mot de Passe: mot_de_passe_securise

PostgreSQL

PostgreSQL est un puissant système de base de données objet-relationnel open-source.

Paramètres de Connexion

  • Hôte: L'adresse IP ou le nom d'hôte de votre serveur PostgreSQL
  • Port: La valeur par défaut est 5432
  • Nom de la Base de Données: La base de données spécifique à laquelle vous souhaitez vous connecter
  • Nom d'Utilisateur: Votre nom d'utilisateur PostgreSQL
  • Mot de Passe: Votre mot de passe PostgreSQL

Où Trouver les Informations d'Identification

  • Auto-hébergé: Vérifiez les fichiers pg_hba.conf et postgresql.conf
  • Heroku Postgres: Disponible dans les Paramètres de votre application → Variables de Configuration
  • AWS RDS: Disponible dans la console AWS RDS
  • Google Cloud SQL: Disponible dans la console Google Cloud
  • Azure Database: Disponible sur le portail Azure
  • DigitalOcean: Disponible dans votre panneau de contrôle DigitalOcean

Problèmes de Connexion Courants

  • Vérifiez pg_hba.conf pour les connexions autorisées
  • Vérifiez que postgresql.conf autorise les connexions sur la bonne interface
  • Assurez-vous que l'utilisateur a le privilège CONNECT sur la base de données
  • Vérifiez les paramètres du pare-feu sur le port 5432

Exemple de Configuration

Hôte: postgres.example.com
Port: 5432
Base de Données: ma_base_de_donnees
Nom d'Utilisateur: utilisateur_postgres
Mot de Passe: mot_de_passe_securise

Google BigQuery

BigQuery est l'entrepôt de données entièrement géré de Google pour l'analytique.

Exigences de Connexion

  • Projet Google Cloud avec l'API BigQuery activée
  • Compte de Service avec les autorisations appropriées
  • Fichier de clé JSON du Compte de Service

Configuration de l'Accès

  1. Créer un Projet Google Cloud:

  2. Activer l'API BigQuery:

    • Naviguez vers API & Services → Bibliothèque
    • Recherchez "API BigQuery"
    • Cliquez sur "Activer"
  3. Créer un Compte de Service:

    • Allez dans IAM & Admin → Comptes de Service
    • Cliquez sur "Créer un Compte de Service"
    • Fournissez un nom et une description
  4. Attribuer des Autorisations:

    • Lecteur de données BigQuery (minimum)
    • Utilisateur de tâches BigQuery (pour exécuter des requêtes)
    • Rôles supplémentaires selon les besoins de vos données
  5. Générer un Fichier de Clé:

    • Cliquez sur votre compte de service
    • Allez à l'onglet Clés → Ajouter une Clé → Créer une nouvelle clé
    • Choisissez le format JSON et téléchargez

Paramètres de Connexion

  • ID du Projet: Votre ID de Projet Google Cloud
  • JSON du Compte de Service: Contenu du fichier JSON téléchargé
  • Ensemble de Données (optionnel): Ensemble de données par défaut à utiliser

Exemple de Configuration

ID du Projet: mon-projet-bigquery-123456
JSON du Compte de Service: {
  "type": "service_account",
  "project_id": "mon-projet-bigquery-123456",
  ...
}

Amazon Redshift

Redshift est le service d'entrepôt de données basé sur le cloud d'Amazon.

Paramètres de Connexion

  • Hôte: Le point de terminaison de votre cluster Redshift
  • Port: La valeur par défaut est 5439
  • Nom de la Base de Données: Le nom de la base de données dans votre cluster
  • Nom d'Utilisateur: Votre nom d'utilisateur Redshift
  • Mot de Passe: Votre mot de passe Redshift

Où Trouver les Informations d'Identification

  1. Console AWS:

    • Naviguez vers Amazon Redshift
    • Sélectionnez votre cluster
    • Les détails de connexion sont affichés dans les propriétés du cluster
  2. Format du Point de Terminaison: nom-cluster.identifiant.region.redshift.amazonaws.com

Configuration de l'Accès

  • Assurez-vous que le cluster est accessible publiquement (si vous vous connectez depuis l'extérieur d'AWS)
  • Configurez les groupes de sécurité pour autoriser les connexions entrantes
  • Créez des utilisateurs de base de données avec les autorisations appropriées

Problèmes de Connexion Courants

  • Vérifiez les règles entrantes du groupe de sécurité pour le port 5439
  • Vérifiez que le cluster est à l'état "disponible"
  • Assurez-vous que l'utilisateur a le privilège CONNECT sur la base de données
  • Vérifiez les configurations VPC et sous-réseau

Exemple de Configuration

Hôte: mon-cluster.abc123def456.us-west-2.redshift.amazonaws.com
Port: 5439
Base de Données: analytique
Nom d'Utilisateur: utilisateur_redshift
Mot de Passe: mot_de_passe_securise

Azure SQL Database

Azure SQL Database est le service de base de données SQL basé sur le cloud de Microsoft.

Paramètres de Connexion

  • Serveur: Le nom de votre serveur Azure SQL
  • Nom de la Base de Données: Le nom spécifique de la base de données
  • Nom d'Utilisateur: Votre nom d'utilisateur d'authentification SQL
  • Mot de Passe: Votre mot de passe d'authentification SQL

Où Trouver les Informations d'Identification

  1. Portail Azure:

    • Naviguez vers les bases de données SQL
    • Sélectionnez votre base de données
    • Cliquez sur "Chaînes de connexion" pour tous les détails
  2. Format du Serveur: nom-serveur.database.windows.net

Options d'Authentification

  • Authentification SQL: Nom d'utilisateur/mot de passe (recommandé pour les applications)
  • Authentification Azure AD: Utilise Azure Active Directory (pour l'accès utilisateur)

Configuration de l'Accès

  • Configurez les règles de pare-feu pour autoriser votre adresse IP
  • Assurez-vous que l'Authentification SQL est activée
  • Créez des utilisateurs de base de données avec les autorisations appropriées

Problèmes de Connexion Courants

  • Vérifiez les paramètres du pare-feu Azure SQL
  • Vérifiez que l'Authentification SQL est activée
  • Assurez-vous que l'utilisateur a au minimum l'autorisation db_datareader
  • Vérifiez le format de la chaîne de connexion

Exemple de Configuration

Hôte: monserveur.database.windows.net
Port: 1433
Base de Données: mabasesdedonnees
Nom d'Utilisateur: sqladmin
Mot de Passe: mot_de_passe_securise

Google Sheets

L'intégration de Google Sheets vous permet de vous connecter à des feuilles de calcul dans votre Google Drive en tant que sources de données.

Exigences de Connexion

  • Compte Google avec accès à Google Sheets
  • Authentification OAuth 2.0 via Google
  • Accès aux API Google Sheets et Google Drive

Configuration de l'Accès

  1. Processus d'Authentification:

    • Cliquez sur "Se connecter avec Google" lors de la création de la connexion
    • Connectez-vous à votre compte Google
    • Accordez l'autorisation d'accéder à vos Google Sheets
  2. Autorisations Requises:

    • Accès en lecture à vos Google Sheets
    • Accès en lecture à votre Google Drive (pour lister les feuilles de calcul)

Comment Ça Marche

  • Feuilles de Calcul comme Sources de Données: Chaque feuille de calcul de votre Google Drive devient une source de données disponible
  • Feuilles comme Tables de Données: Chaque feuille d'une feuille de calcul fournit des données brutes
  • Première Ligne comme En-têtes: La première ligne de chaque feuille est traitée comme des en-têtes de colonne
  • Types de Données: Toutes les données sont importées en tant que texte par défaut

Méthode d'Accès aux Données

Contrairement aux bases de données traditionnelles, Google Sheets ne prend pas en charge les requêtes SQL. Au lieu de cela :

  • Importation de Données Brutes: PyQueryHub importe les données complètes de la feuille
  • Filtrage au Niveau du Graphique: Tout le filtrage, le tri et l'agrégation se font dans la configuration du graphique
  • Pas de Support SQL: Vous ne pouvez pas écrire de déclarations SELECT ou de clauses WHERE
  • Sélection de Feuille: Choisissez la feuille de calcul et la feuille à utiliser comme source de données

Opérations Prises en Charge

  • Accès en lecture seule: Vous ne pouvez que lire les données, pas les modifier
  • Données en temps réel: Les données sont extraites directement de Google Sheets lors de l'exécution des rapports
  • Détection automatique du schéma: Les noms de colonnes sont détectés à partir de la première ligne
  • Filtrage basé sur les graphiques: Utilisez les contrôles de graphique pour filtrer et agréger les données

Limitations

  • Pas de requêtes SQL: Impossible d'utiliser WHERE, GROUP BY, JOIN ou d'autres opérations SQL
  • Traitement au niveau du graphique uniquement: Toute manipulation de données se fait dans la configuration du graphique
  • Accès en lecture seule: Pas d'opérations INSERT/UPDATE/DELETE
  • Limité à votre compte Google: Uniquement les feuilles de calcul auxquelles vous avez accès
  • Performance: Dépend de la taille de la feuille de calcul et des limites de l'API Google
  • Types de données: Tous importés en tant que texte (formatage appliqué dans les graphiques)

Meilleures Pratiques

  • Gardez les en-têtes de colonne dans la première ligne
  • Utilisez un formatage de données cohérent dans les colonnes
  • Évitez les caractères spéciaux dans les noms de feuilles
  • Tenez compte de la taille des données - les grandes feuilles peuvent avoir un impact sur les performances
  • Structurez les données de manière appropriée car vous ne pouvez pas utiliser SQL pour les remodeler
  • Utilisez plusieurs feuilles pour différentes entités de données plutôt que des requêtes complexes

Exemple de Flux de Travail

  1. Source de Données: Choisissez la feuille de calcul "Données de Ventes 2024"
  2. Sélection de Feuille: Sélectionnez la feuille "Résultats T1"
  3. Création de Graphique: Créez des graphiques qui filtrent/agrègent les données brutes de la feuille
  4. Pas de SQL: Tout le traitement se fait via la configuration du graphique, pas les requêtes

Dépannage

  • Authentification expirée: Ré-authentifiez-vous avec Google
  • Feuille de calcul non trouvée: Vérifiez l'orthographe et assurez-vous qu'elle existe dans votre Drive
  • Autorisation refusée: Vérifiez que vous avez accès à la feuille de calcul
  • Résultats vides: Vérifiez si la feuille contient des données et des en-têtes appropriés

Tunnelisation SSH (Tous les Types de Bases de Données)

Pour une sécurité renforcée, vous pouvez vous connecter via un tunnel SSH. Ceci est disponible pour tous les types de bases de données traditionnelles (MySQL, PostgreSQL, Redshift, Azure SQL).

Quand Utiliser la Tunnelisation SSH

  • Le serveur de base de données n'est accessible que via un serveur de rebond/bastion
  • Une couche de sécurité supplémentaire est requise
  • La base de données se trouve derrière un pare-feu qui autorise SSH mais pas les connexions directes à la base de données

Paramètres de Connexion SSH

  • Hôte SSH: Le nom d'hôte ou l'IP de votre serveur SSH
  • Port SSH: Généralement 22 (port SSH par défaut)
  • Nom d'Utilisateur SSH: Votre nom d'utilisateur SSH
  • Authentification SSH: Soit par mot de passe, soit par clé privée
  • Mot de Passe SSH: Votre mot de passe SSH (si vous n'utilisez pas de clé)
  • Clé Privée SSH: Contenu de votre fichier de clé privée (si vous n'utilisez pas de mot de passe)

Configuration de la Clé SSH

  1. Générez une paire de clés SSH (si vous n'en avez pas) :

    ssh-keygen -t rsa -b 4096
  2. Copiez la clé publique sur le serveur :

    ssh-copy-id nom_utilisateur@serveur-ssh.com
  3. Utilisez le contenu de la clé privée dans PyQueryHub :

    • Copiez l'intégralité du contenu de votre fichier de clé privée
    • Collez-le dans le champ "Clé Privée SSH"

Chiffrement SSL/TLS

Le chiffrement SSL/TLS sécurise la connexion entre PyQueryHub et votre base de données. Disponible pour MySQL, PostgreSQL et autres bases de données traditionnelles.

Types de Certificats SSL

  • Certificat CA: Certificat de l'Autorité de Certification
  • Certificat Client: Votre certificat client (pour l'authentification mutuelle)
  • Clé Client: Votre clé privée client

Où Obtenir des Certificats SSL

  • Fournisseurs cloud: Fournissent généralement des certificats téléchargeables
  • Auto-signés: Générés par votre administrateur de base de données
  • Autorités de certification: Pour les environnements de production

Configuration SSL

  1. Obtenez les certificats de votre fournisseur de base de données
  2. Copiez le contenu des certificats (pas les chemins de fichiers)
  3. Collez-les dans les champs appropriés de PyQueryHub
  4. Testez la connexion pour vérifier que SSL fonctionne

Problèmes SSL Courants

  • Problèmes de format de certificat (assurez-vous du format PEM)
  • Certificats expirés
  • Inadéquation du nom d'hôte dans les certificats
  • Certificats intermédiaires manquants

Dépannage Général

Échecs du Test de Connexion

  1. Vérifiez les informations d'identification: Revérifiez tous les paramètres de connexion
  2. Connectivité réseau: Assurez-vous que le serveur de base de données est joignable
  3. Règles de pare-feu: Vérifiez les pare-feu locaux et côté serveur
  4. Autorisations utilisateur: Vérifiez que l'utilisateur de la base de données dispose des privilèges nécessaires
  5. État du service: Confirmez que le service de base de données est en cours d'exécution

Problèmes de Performance

  1. Latence réseau: Tenez compte de la proximité géographique de la base de données
  2. Charge de la base de données: Vérifiez si le serveur de base de données est soumis à une forte charge
  3. Optimisation des requêtes: Révisez l'efficacité des requêtes
  4. Pool de connexions: Limites de connexion du serveur de base de données

Meilleures Pratiques de Sécurité

  1. Utilisez des mots de passe forts: Mots de passe complexes et uniques pour les utilisateurs de la base de données
  2. Limitez les autorisations: Accordez les privilèges de base de données minimaux nécessaires
  3. Activez le chiffrement: Utilisez SSL/TLS lorsque disponible
  4. Audits réguliers: Révisez et renouvelez périodiquement les informations d'identification
  5. Sécurité réseau: Utilisez la tunnelisation SSH lorsque c'est approprié

Obtenir de l'Aide

Si vous continuez à rencontrer des problèmes de connexion :

  1. Vérifiez les journaux du serveur de base de données pour les détails de l'erreur
  2. Vérifiez la connectivité réseau à l'aide d'outils comme telnet ou nc
  3. Testez la connexion depuis un autre client pour isoler les problèmes
  4. Contactez notre équipe de support avec des messages d'erreur spécifiques

Pour les problèmes spécifiques à la base de données, consultez la documentation ou les ressources de support de votre fournisseur de base de données.