Notez que j'ai parfois voulu utiliser des quadrants pour détecter les valeurs aberrantes
Q1 = series.quantile(.25)
Q3 = series.quantile(.75)
Ou
Q1 = series.describe()['25%']
Q3 = series.describe()['75%']
#Extraire uniquement les données dont la valeur est dans le désordre dans la colonne A
IQR = Q3 - Q1
threshold = Q3 + 1.5 * IQR
df_outlier = df[df['A'].apply(lambda x:x > threshold)]
Au contraire, si vous voulez les données qui correspondent, vous pouvez prendre un déni logique comme df [~ df ...] C'est bien si vous changez la direction de l'inégalité.
Il semble y avoir un gars qui peut sortir du prix d'un seul coup sans faire ça ...
Les débutants en statistique bricolent des données à l'aide de pandas. Je vous serais reconnaissant de bien vouloir me dire s’il existe un bon moyen.
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.quantile.html
Reportez-vous à ce document pour les quadrants http://www.contents-station.net/gacco/Data_Analysis_Innovation/Week03/3-4.pdf