type
status
slug
summary
tags
category
icon
password
La oficina de la veterinaria quiere saber cuántos perritos de cada raza han visitado su oficina. Sin embargo, algunos perritos han ido al veterinario más de una vez, como Max y Stella, entonces no podemos simplemente contar el número de cada raza en la columna. Tenemos el DataSet Vet visits que registra las visitas de un grupo de perritos en una veterinaria. Vet visits contiene las columnas:
- Date: Fecha de visita.
- Name: Nombre del perrito.
- Breed: Raza del perrito.
- Weight_kg: Peso en kilogramos del perrito

- Podríamos solucionarlo eliminando las filas que contienen un nombre de perrito que ya está, usando el método drop_duplicates:


Pero esto no sería eficiente porque perderíamos datos en el caso de que dos perritos se llamen igual pero no sean de la misma raza. Por ejemplo, tenemos un perrito llamado Max que es un Chow Chow y otro perrito con el mismo nombre pero que es un labrador.

- Esto podemos solucionarlo al seleccionar tanto nombre, como raza:


- Para contar a los perritos de cada raza, simplemente dividiremos la columna de raza y usamos el método value_counts:


- El argumento sort nos da las razas que más se repiten:


- El argumento normalize lo podemos utilizar para convertirlo en proporcionas del total de razas:


- Autor:ByIris
- URL:http://145.223.74.189:3000//article/counting-pandas
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!