SAS Viya est une plateforme d'IA. Il est disponible via des langages tels que Python, Java et R. Un objet table appelé CASTable est utilisé dans SAS Viya (CAS signifie Cloud Analytic Services). Cette fois, je vais vous présenter comment extraire uniquement certaines colonnes et afficher les informations dans CASTable.
Tout d'abord, connectez-vous à SAS Viya.
import swat
conn = swat.CAS('server-name.mycompany.com', 5570, 'username', 'password')
Ensuite, récupérez le CASTable. Cette fois, j'utiliserai CSV des données IRIS.
tbl = conn.loadtable('data/iris.csv', caslib='casuser').casTable
Vous pouvez récupérer la colonne en spécifiant la clé avec tbl comme dict.
col = tbl['sepal_width']
col
La sortie ressemble à ceci:
CASColumn('DATA.IRIS', caslib='CASUSER(username)')['sepal_width'].sort_values(['sepal_length', 'sepal_width'], ascending=[False, True])
Si vous utilisez la méthode head
d'une colonne, seule la valeur de cette colonne sera affichée.
col.head()
0 3.8
1 2.6
2 2.8
3 3.0
4 3.8
Name: sepal_width, dtype: float64
De même, si vous donnez la clé sous forme de tableau, vous pouvez obtenir plusieurs colonnes.
widths = tbl[['sepal_width', 'petal_width', 'species']]
Le contenu est le suivant.
sepal_width | petal_width | species | |
---|---|---|---|
0 | 3.8 | 2.0 | virginica |
1 | 2.6 | 2.3 | virginica |
2 | 2.8 | 2.0 | virginica |
3 | 3.0 | 2.3 | virginica |
4 | 3.8 | 2.2 | virginica |
Vous pouvez également consulter le résumé des données.
widths.describe()
sepal_width | petal_width | |
---|---|---|
count | 150.000000 | 150.000000 |
mean | 3.054000 | 1.198667 |
std | 0.433594 | 0.763161 |
min | 2.000000 | 0.100000 |
25% | 2.800000 | 0.300000 |
50% | 3.000000 | 1.300000 |
75% | 3.300000 | 1.800000 |
max | 4.400000 | 2.500000 |
Les informations de colonne s'affichent de la même manière.
widths.columninfo()
Column | ID | Type | RawLength | FormattedLength | NFL | NFD | |
---|---|---|---|---|---|---|---|
0 | sepal_width | 2 | double | 8 | 12 | 0 | 0 |
1 | petal_width | 4 | double | 8 | 12 | 0 | 0 |
2 | species | 5 | varchar | 10 | 10 | 0 | 0 |
Si vous obtenez des colonnes, vous pouvez limiter l'analyse à celles dont vous avez besoin, même si le tableau comporte de nombreuses colonnes. Il peut être utilisé lorsqu'il y a trop de données numériques et que vous ne savez pas où traiter l'analyse.
Recommended Posts