SAS Viya est une plateforme d'IA. Il est disponible via des langages tels que Python, Java et R. Un objet table appelé CASTable est utilisé dans SAS Viya (CAS signifie Cloud Analytic Services). Cette fois, je vais essayer d'obtenir les informations de colonne de CASTable par différentes méthodes.
Tout d'abord, connectez-vous à SAS Viya.
import swat
conn = swat.CAS('server-name.mycompany.com', 5570, 'username', 'password')
Ensuite, récupérez le CASTable. Cette fois, j'utiliserai CSV des données IRIS.
tbl = conn.loadtable('data/iris.csv', caslib='casuser').casTable
Il est possible d'obtenir uniquement le nom de la colonne avec «for in».
for col in tbl:
print(col)
La sortie est la suivante.
sepal_length
sepal_width
petal_length
petal_width
species
Si vous voulez obtenir l'index en plus du nom de la colonne, utilisez la fonction ʻenumerate`.
for i, col in enumerate(tbl):
print(i, col)
La sortie est la suivante.
0 sepal_length
1 sepal_width
2 petal_length
3 petal_width
4 species
Utilisez la fonction zip
pour obtenir le type en plus du nom de la colonne.
for col, dtype in zip(tbl, tbl.dtypes):
print(col, dtype)
La sortie est la suivante.
sepal_length double
sepal_width double
petal_length double
petal_width double
species varchar
Utilisez la méthode ʻiteritemspour l'obtenir en tant que
CASColumn` où vous pouvez obtenir des informations plus détaillées.
for col, obj in tbl.iteritems():
print(col, obj)
print('')
La sortie est la suivante.
sepal_length CASColumn('DATA.IRIS', caslib='CASUSER(username)')['sepal_length'].sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])
sepal_width CASColumn('DATA.IRIS', caslib='CASUSER(username)')['sepal_width'].sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])
petal_length CASColumn('DATA.IRIS', caslib='CASUSER(username)')['petal_length'].sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])
petal_width CASColumn('DATA.IRIS', caslib='CASUSER(username)')['petal_width'].sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])
species CASColumn('DATA.IRIS', caslib='CASUSER(username)')['species'].sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])
Voici comment obtenir les données ligne par ligne. La première concerne l'utilisation de la méthode ʻiterrows`.
for row in tbl.iterrows():
print(row)
La sortie est la suivante. Il y a 150 lignes au total.
(0, sepal_length 7.9
sepal_width 3.8
petal_length 6.4
petal_width 2
species virginica
Name: 0, dtype: object)
(1, sepal_length 7.7
sepal_width 2.6
petal_length 6.9
petal_width 2.3
species virginica
:
Name: 148, dtype: object)
(149, sepal_length 4.3
sepal_width 3
petal_length 1.1
petal_width 0.1
species setosa
Name: 149, dtype: object)
Vient ensuite le cas de l'utilisation de la méthode «itertuples».
for row in tbl.itertuples():
print(row)
Le résultat est le suivant, seule la valeur est renvoyée.
(0, 7.9000000000000004, 3.7999999999999998, 6.4000000000000004, 2.0, 'virginica')
(1, 7.7000000000000002, 2.6000000000000001, 6.9000000000000004, 2.2999999999999998, 'virginica')
:
(148, 4.4000000000000004, 3.2000000000000002, 1.3, 0.20000000000000001, 'setosa')
(149, 4.2999999999999998, 3.0, 1.1000000000000001, 0.10000000000000001, 'setosa')
Il existe différentes manières d'obtenir des informations sur les colonnes. Veuillez utiliser correctement selon vos besoins.
Recommended Posts