Lazy loaded image
Python y Librerías para Ciencias de Datos
Lazy loaded imageSummary Statistics
Palabras 250Tiempo de lectura 1 min
Jan 9, 2025
Jan 11, 2025
type
status
slug
summary
tags
category
icon
password
Tal y como su nombre lo dice, las summary statistics (estadísticas de resumen), son herramientas que nos ayudan a resumir un conjunto de datos.
notion image

★ღ .mean() ★ღ

Una de las estadísticas de resumen que más se usan, es la media. La media nos dice dónde está el centro de sus datos.
Podemos calcular la media de una columna seleccionando la columna entre los corchetes y usando .mean()
notion image
 

★ღ .min() .max() ★ღ

Los usamos para encontrar el valor mínimo y el valor máximo de un conjunto de datos. Por ejemplo, podemos encontrar la fecha de nacimiento del perrito mas viejo usando min:
notion image
Y usamos max para encontrar la fecha de nacimiento del perrito mas joven:
notion image

★ღ .agg() ★ღ

Nos permite calcular estadísticas mucho más personalizadas. Por ejemplo, si quisiéramos calcular el percentil 30 de una columna de nuestro data frame, crearíamos una función:
notion image
Ahora que tenemos esta función para calcular el percentil 30, podemos crear un subconjunto y llamar a .agg(pct30):
notion image
También se puede usar en más de una columna:
notion image
Podemos incluso realizar varias estadísticas al tiempo
notion image

★ღ Estadísticas Acumulativas ★ღ✰

Pandas tiene métodos que nos ayudan a calcular estadísticas acumulativas. Normalmente veríamos los datos de esta forma:
notion image
Para tener las sumas acumulativas, llamamos a .cumsum() de una columna y nos retornará no solo un número, sino un número para cada fila de nuestro DataFrame:
notion image
 
上一篇
Sorting y Subsetting
下一篇
Métodos para Transformación de Datos