Im folgenden Artikel habe ich versucht, TPC-H-Daten zu erstellen. Da ich die Datei jedoch mit Azcopy von CentOS hochgeladen habe, werde ich die Methode beschreiben. Erstellen Sie eine Testumgebung mit TPC-H (Synapse SQL Pool)
Erstellen Sie zunächst ein Speicherkonto und einen Container zum Hochladen.
In diesem Beispiel werden standardmäßig alle außer "Ressourcengruppe", "Speicherkontoname" und "Replikation" angegeben.
In den Netzwerkeinstellungen habe ich es dieses Mal erstellt, ohne die Standardeinstellungen zu ändern.
Diesmal ist nichts eingestellt.
Klicken Sie auf die Schaltfläche Erstellen, um ein Speicherkonto zu erstellen.
Erstellen Sie nach dem Erstellen des Speicherkontos einen Container aus dem erstellten Speicherkonto. Wählen Sie "+ Container" aus dem Bildschirm unten. Ich habe einen Container namens "Azcopytest" erstellt.
Für den Zugriff auf Blob sind IAM-Einstellungen erforderlich. Zusätzlich wird eine Azkopie unter Verwendung der hier festgelegten IAM-Informationen durchgeführt. Wenn diese Einstellung nicht vorgenommen wird, tritt während der Azkopie ein Fehler wie "403 Diese Anforderung ist nicht berechtigt, diesen Vorgang mit dieser Berechtigung auszuführen" auf, und eine Azkopie ist nicht möglich.
Wählen Sie für die Rolle die erforderlichen Berechtigungen aus, z. B. "Storage BLOB Data Co-Creator", und geben Sie den Benutzer an, der IAM zuweisen soll.
Laden Sie zuerst azcopy mit wget herunter.
$ wget https://azcopyvnext.azureedge.net/release20200818/azcopy_linux_amd64_10.6.0.tar.gz
Entpacken Sie nach dem Herunterladen und wechseln Sie in das erstellte Verzeichnis.
$ tar xvfx azcopy_linux_amd64_10.6.0.tar.gz
$ cd azcopy_linux_amd64_10.6.0
Sie müssen sich mit azcopy anmelden, bevor Sie die Datei mit azcopy hochladen.
Bestätigen Sie die Mandanten-ID, da Sie die Mandanten-ID eingeben müssen, wenn Sie sich mit azcopy anmelden. Die Mandanten-ID kann von Azure AD bestätigt werden.
Sie können dies nach dem Bildschirmübergang unter "Mandanteninformationen" überprüfen.
Melden Sie sich wie folgt von CentOS aus an.
$ ./azcopy login --tenant-id "<Mieter-ID>"
Wenn Sie es ausführen, wird ein Browser geöffnet und Sie werden aufgefordert, den Code über die angegebene URL einzugeben. Öffnen Sie daher den Browser und geben Sie den Code ein.
Wenn Sie die angegebene URL im Browser eingeben, wird der folgende Bildschirm angezeigt. Geben Sie also den Code ein.
Wenn die Anmeldung erfolgreich ist, wird die Meldung "erfolgreich" wie unten gezeigt ausgegeben.
Mit dem Kopierbefehl von azcopy auf Blob hochladen.
$ ./azcopy copy "Lokaler Dateiname" "https://<Name des Speicherkontos>.blob.core.windows.net/<Containername>"
Wenn Sie mehrere Dateien hochladen möchten, können Sie auch "*" usw. angeben.
$ ./azcopy copy "Lokales Verzeichnis/*" "https://<Name des Speicherkontos>.blob.core.windows.net/<Containername>"
Nach Abschluss des Uploads können Sie die Daten mithilfe von PolyBase usw. in den Azure Syanpase Analytics SQL-Pool laden. Die Methode ist in einem anderen Artikel enthalten. Wenn Sie möchten, lesen Sie sie bitte. Ich habe versucht, den Synapse SQL-Pool mit PolyBase zu füllen