SAS Viya est une plateforme d'IA. Il est disponible via des langages tels que Python, Java et R. Un objet table appelé CASTable est utilisé dans SAS Viya (CAS signifie Cloud Analytic Services). Cette fois, je vais vous présenter comment changer les conditions d'extraction lors de l'affichage de l'état des données dans CASTable.
Tout d'abord, connectez-vous à SAS Viya.
import swat
conn = swat.CAS('server-name.mycompany.com', 5570, 'username', 'password')
Ensuite, récupérez le CASTable. Cette fois, j'utiliserai CSV des données IRIS.
tbl = conn.loadtable('data/iris.csv', caslib='casuser').casTable
Utilisez la méthode describe
pour voir les données dont vous disposez.
tbl.describe()
Le résultat sera renvoyé comme suit. Vous pouvez voir le nombre de lignes, l'écart type, la valeur minimale, la valeur maximale et les données d'une valeur de 25% / 50% / 75%.
sepal_length | sepal_width | petal_length | petal_width |
---|---|---|---|
count | 150.000000 | 150.000000 | 150.000000 |
mean | 5.843333 | 3.054000 | 3.758667 |
std | 0.828066 | 0.433594 | 1.764420 |
min | 4.300000 | 2.000000 | 1.000000 |
25% | 5.100000 | 2.800000 | 1.600000 |
50% | 5.800000 | 3.000000 | 4.350000 |
75% | 6.400000 | 3.300000 | 5.100000 |
max | 7.900000 | 4.400000 | 6.900000 |
Changer les percentiles
changera les données récupérées. Voici un exemple de changement de données à 30% et 80%.
tbl.describe(percentiles=[0.3, 0.8])
sepal_length | sepal_width | petal_length | petal_width |
---|---|---|---|
count | 150.000000 | 150.000000 | 150.000000 |
mean | 5.843333 | 3.054000 | 3.758667 |
std | 0.828066 | 0.433594 | 1.764420 |
min | 4.300000 | 2.000000 | 1.000000 |
30% | 5.250000 | 2.800000 | 1.700000 |
50% | 5.800000 | 3.000000 | 4.350000 |
80% | 6.550000 | 3.400000 | 5.350000 |
max | 7.900000 | 4.400000 | 6.900000 |
Spécifiez ʻinclude = 'all'` pour vérifier toutes les données.
tbl.describe(include='all')
sepal_length | sepal_width | petal_length | petal_width | species |
---|---|---|---|---|
count | 150 | 150 | 150 | 150 |
unique | 35 | 23 | 43 | 22 |
top | 5 | 3 | 1.5 | 0.2 |
freq | 10 | 26 | 14 | 28 |
mean | 5.84333 | 3.054 | 3.75867 | 1.19867 |
std | 0.828066 | 0.433594 | 1.76442 | 0.763161 |
min | 4.3 | 2 | 1 | 0.1 |
25% | 5.1 | 2.8 | 1.6 | 0.3 |
50% | 5.8 | 3 | 4.35 | 1.3 |
75% | 6.4 | 3.3 | 5.1 | 1.8 |
max | 7.9 | 4.4 | 6.9 | 2.5 |
Le nombre peut également être un nombre à virgule flottante.
tbl.describe(stats='all')
sepal_length | sepal_width | petal_length | petal_width |
---|---|---|---|
count | 1.500000e+02 | 1.500000e+02 | 1.500000e+02 |
unique | 3.500000e+01 | 2.300000e+01 | 4.300000e+01 |
mean | 5.843333e+00 | 3.054000e+00 | 3.758667e+00 |
std | 8.280661e-01 | 4.335943e-01 | 1.764420e+00 |
min | 4.300000e+00 | 2.000000e+00 | 1.000000e+00 |
25% | 5.100000e+00 | 2.800000e+00 | 1.600000e+00 |
50% | 5.800000e+00 | 3.000000e+00 | 4.350000e+00 |
75% | 6.400000e+00 | 3.300000e+00 | 5.100000e+00 |
max | 7.900000e+00 | 4.400000e+00 | 6.900000e+00 |
nmiss | 0.000000e+00 | 0.000000e+00 | 0.000000e+00 |
sum | 8.765000e+02 | 4.581000e+02 | 5.638000e+02 |
stderr | 6.761132e-02 | 3.540283e-02 | 1.440643e-01 |
var | 6.856935e-01 | 1.880040e-01 | 3.113179e+00 |
uss | 5.223850e+03 | 1.427050e+03 | 2.583000e+03 |
cv | 1.417113e+01 | 1.419759e+01 | 4.694272e+01 |
tvalue | 8.642537e+01 | 8.626430e+01 | 2.609020e+01 |
probt | 3.331256e-129 | 4.374977e-129 | 1.994305e-57 |
Vous pouvez utiliser la méthode describe pour obtenir une vue d'ensemble des données dans CASTable. Veuillez l'utiliser comme base pour l'analyse des données.
Recommended Posts