SAS Viya est une plateforme d'IA. Il est disponible via des langages tels que Python, Java et R. Un objet table appelé CASTable est utilisé dans SAS Viya (CAS signifie Cloud Analytic Services). Cette fois, je vais vous expliquer comment obtenir des données en spécifiant une colonne en utilisant loc / iloc / ix dans CASTable.
Tout d'abord, connectez-vous à SAS Viya.
import swat
conn = swat.CAS('server-name.mycompany.com', 5570, 'username', 'password')
Ensuite, récupérez le CASTable. Cette fois, j'utiliserai CSV des données IRIS.
tbl = conn.loadtable('data/iris.csv', caslib='casuser').casTable
Utilisez loc pour spécifier la colonne et spécifiez le nom de la colonne dans le deuxième argument.
tbl.loc[:, 'petal_width'].head()
Ensuite, vous ne pouvez obtenir que la valeur de la colonne spécifiée.
0 2.0
1 2.3
2 2.0
3 2.3
4 2.2
Name: petal_width, dtype: float64
Cela peut être spécifié dans plusieurs colonnes.
tbl.loc[:, 'sepal_length':'petal_length'].head()
Pour plusieurs colonnes, la ligne d'en-tête s'affiche. Puisqu'il est spécifié par la plage, la largeur de sepal qui existe entre eux est également affichée.
sepal_length | sepal_width | petal_length | |
---|---|---|---|
0 | 7.9 | 3.8 | 6.4 |
1 | 7.7 | 2.6 | 6.9 |
2 | 7.7 | 2.8 | 6.7 |
3 | 7.7 | 3.0 | 6.1 |
4 | 7.7 | 3.8 | 6.7 |
Si vous souhaitez spécifier la colonne, spécifiez-la en tant que tableau.
tbl.loc[:, ['petal_width', 'sepal_width']].head()
petal_width | sepal_width | |
---|---|---|
0 | 2.0 | 3.8 |
1 | 2.3 | 2.6 |
2 | 2.0 | 2.8 |
3 | 2.3 | 3.0 |
4 | 2.2 | 3.8 |
Vous pouvez spécifier un nombre au lieu d'un nom de colonne.
tbl.loc[:, 3].head()
0 2.0
1 2.3
2 2.0
3 2.3
4 2.2
Name: petal_width, dtype: float64
La même chose s'applique aux spécifications de plusieurs colonnes.
tbl.iloc[:, 0:3].head()
sepal_length | sepal_width | petal_length | |
---|---|---|---|
0 | 7.9 | 3.8 | 6.4 |
1 | 7.7 | 2.6 | 6.9 |
2 | 7.7 | 2.8 | 6.7 |
3 | 7.7 | 3.0 | 6.1 |
4 | 7.7 | 3.8 | 6.7 |
Lors de la spécification d'une colonne, il en va de même pour un tableau.
tbl.iloc[:, [3, 1]].head()
petal_width | sepal_width | |
---|---|---|
0 | 2.0 | 3.8 |
1 | 2.3 | 2.6 |
2 | 2.0 | 2.8 |
3 | 2.3 | 3.0 |
4 | 2.2 | 3.8 |
Une combinaison de nombres et de noms de colonnes est également possible.
tbl.ix[:, [3, 'sepal_width']].head()
petal_width | sepal_width | |
---|---|---|
0 | 2.0 | 3.8 |
1 | 2.3 | 2.6 |
2 | 2.0 | 2.8 |
3 | 2.3 | 3.0 |
4 | 2.2 | 3.8 |
Il existe de nombreuses situations dans lesquelles vous souhaitez analyser uniquement certaines des données. Dans ce cas, utilisez loc, iloc ou ix pour extraire rapidement les données. Les nombres sont également faciles à utiliser pour la boucle, ils devraient donc également être utiles pour automatiser l'analyse et le calcul.
Recommended Posts