Analyse Python en base de données pour les développeurs SQL
Étape 1: Téléchargez des exemples de données
Étape 3: Recherche et visualisation des données
Dans cette étape, vous exécuterez le script téléchargé RunSQL_SQL_Walkthrough.ps1
pour créer les objets de base de données nécessaires au didacticiel et importer les exemples de données.
Exécutez le script PowerShell RunSQL_SQL_Walkthrough.ps1
dans les fichiers téléchargés pour préparer l'environnement du didacticiel. Ce script exécute les actions suivantes:
--Installez SQL Native Client et l'utilitaire de ligne de commande SQL s'ils ne sont pas déjà installés. Ceux-ci sont nécessaires pour le chargement de données en masse à l'aide de bcp.
--Créez une base de données et une table dans votre instance SQL Server et chargez-y les données en masse.
--Créez plus de fonctions et de procédures stockées.
En tant qu'administrateur, ouvrez une invite de commandes PowerShell et exécutez la commande suivante:
.\RunSQL_SQL_Walkthrough.ps1
Vous serez invité à saisir les informations suivantes:
Le nom ou l'adresse du serveur sur lequel Machine Learning Services (Python) est installé.
Le nom de la base de données à créer
Le nom d'utilisateur et le mot de passe du serveur SQL cible. Cet utilisateur doit avoir l'autorisation de créer des bases de données, des tables, des procédures stockées, des fonctions et de charger des données dans des tables. Si vous omettez le nom d'utilisateur et le mot de passe, vous serez connecté en tant qu'utilisateur Windows actuel.
Le chemin de l'exemple de fichier de données nyctaxi1pct.csv
dans les fichiers téléchargés. Par exemple, C: \ tempPythonSQL \ nyctaxi1pct.csv
.
Tous les scripts T-SQL ont été modifiés pour remplacer la base de données et les noms d'utilisateur spécifiés dans le cadre des étapes ci-dessus par des espaces réservés.
Assurez-vous que les procédures stockées et les fonctions créées par le script T-SQL sont créées dans la base de données.
T-Fichier de script SQL | Procédure / fonction mémorisée |
---|---|
create-db-tb-upload-data.sql | Créez une base de données et quatre tables. table nyctaxi_sample :Le jeu de données principal NYC Taxi est créé. Les données chargées sont un échantillon de 1% de l'ensemble de données NYC Taxi. La définition de l'index de stockage de colonnes en cluster améliore l'efficacité du stockage et les performances des requêtes.table nyc_taxi_models :Un modèle analytique avancé formé est enregistré.table nyctaxi_sample_training :L'ensemble de données utilisé pour entraîner le modèle est créé.table nyctaxi_sample_testing :L'ensemble de données utilisé pour tester le modèle est enregistré. |
fnCalculateDistance.sql | Fonction de valeur scalaire qui calcule la distance directe entre la position d'embarquement et la position de débarquementfnCalculateDistance Créer un. |
fnEngineerFeatures.sql | Une fonction table qui renvoie un jeu de valeurs de fonction pour l'entraînement du modèlefnEngineerFeatures Créer un. |
TrainingTestingSplit.sql | nyctaxi_Données dans l'exemple de table, nyctaxi_sample_formation et nyctaxi_sample_Procédure pour diviser en deux testsTrainingTestingSplit Créer un. |
PredictTipSciKitPy.sql | Scikit pour la prédiction à l'aide du modèle-Procédure pour appeler le modèle entraîné créé par learnPredictTipSciKitPy Créer un. La procédure accepte une requête comme paramètre d'entrée et renvoie une colonne de nombres contenant le score de la ligne d'entrée. |
PredictTipRxPy.sql | Procédures pour appeler des modèles entraînés créés avec RevoScalePy pour la prédiction basée sur un modèlePredictTipRxPy Créer un. La procédure accepte une requête comme paramètre d'entrée et renvoie une colonne de nombres contenant le score de la ligne d'entrée. |
PredictTipSingleModeSciKitPy.sql | Scikit pour la prédiction à l'aide du modèle-Procédure pour appeler le modèle entraîné créé par learnPredictTipSingleModeSciKitPy Créer un. Cette procédure stockée prend de nouvelles observations en entrée, accepte des valeurs de caractéristiques individuelles en tant que paramètres en ligne et renvoie des prédictions pour les nouvelles observations. |
PredictTipSingleModeRxPy.sql | Scikit pour la prédiction à l'aide du modèle-Procédure pour appeler le modèle entraîné créé par learnPredictTipSingleModeRxPy Créer un. Cette procédure stockée prend de nouvelles observations en entrée, accepte des valeurs de caractéristiques individuelles en tant que paramètres en ligne et renvoie des prédictions pour les nouvelles observations. |
SerializePlots.sql | Procédure de récupération des donnéesSerializePlots Créer un. Cette procédure stockée utilise Python pour créer des graphiques et sérialiser des objets graphiques. |
TrainTipPredictionModelSciKitPy.sql | scikit-Procédure de formation d'un modèle de régression logistique par learnTrainTipPredictionModelSciKitPy Créer un. Ce modèle est entraîné en utilisant 60% de données sélectionnées au hasard pour prédire la valeur exploitée (s'il faut ou non obtenir une puce). La sortie de la procédure stockée est un modèle entraîné, une tablenyc_taxi_models Sera enregistré dans. |
TrainTipPredictionModelRxPy.sql | Procédure de formation d'un modèle de régression logistique avec RevoScalePyTrainTipPredictionModelRxPy Créer un. Ce modèle est entraîné en utilisant 60% de données sélectionnées au hasard pour prédire la valeur exploitée (s'il faut ou non obtenir une puce). La sortie de la procédure stockée est un modèle entraîné, une tablenyc_taxi_models Sera enregistré dans. |
[!NOTE]
Le script T-SQL ne recrée pas l'objet de base de données, donc s'il existe déjà, les données seront dupliquées. Par conséquent, supprimez l'objet existant avant d'exécuter à nouveau le script.
Après avoir effectué les étapes ci-dessus, exécutez le SQL suivant pour redéfinir certains objets. ** Les spécifications de RevoScalePy ont changé lors de la mise à niveau de SQL Server 2017 CTP vers SQL Server 2017 RC, et la principale raison de cette redéfinition est de s'adapter à ces changements. ** **
Étape 3: Recherche et visualisation des données
Étape 1: Téléchargez des exemples de données
Analyse Python en base de données pour les développeurs SQL
Step 2: Import Data to SQL Server using PowerShell
Machine Learning Services with Python
Recommended Posts