type
status
slug
summary
tags
category
icon
password
✰ღ★ღ ¿Qué es el Machine Learning? ღ★ღ✰
.png?table=block&id=7b9432e6-9157-44e0-b53d-206eb7d79eae&t=7b9432e6-9157-44e0-b53d-206eb7d79eae&width=432&cache=v2)
El machine learning es el proceso mediante el cual los computadores tienen la habilidad de tomar decisiones basadas en datos. Si por ejemplo quisiéramos predecir si un correo electrónico es spam o no lo es, en función del contenido y remitente, podemos usar el machine learning para predecirlo.
✰ღ★ღ Aprendizaje Supervisado ღ★ღ✰
El aprendizaje supervisado es un tipo de aprendizaje automático donde los valores a predecir ya son conocidos, también usamos características para predecir el valor de una variable objetivo. Podemos predecir la posición de un jugador de baloncesto en función de sus puntos por partido. En el aprendizaje supervisado, nos encontramos con x (input) e y (output).
.png?table=block&id=35632f0d-f323-4ddf-8ee8-b18a9e78f2e7&t=35632f0d-f323-4ddf-8ee8-b18a9e78f2e7&width=470.984375&cache=v2)
Es decir, se entrena un modelo con ejemplos de entrada y salida, y luego se utiliza para predecir la salida de nuevas entradas. Hay varios ejemplos de aprendizaje supervisado.
.png?table=block&id=0b880d1e-f619-436e-b4cd-3502e2cc5df4&t=0b880d1e-f619-436e-b4cd-3502e2cc5df4&width=1821&cache=v2)
ღ★ღ Tipos de Aprendizaje Supervisado ღ★ღ
ღ★ღ Clasificación ღ★ღ
.png?table=block&id=ce9c2ac4-8b84-461a-ba43-d39e61e6cff3&t=ce9c2ac4-8b84-461a-ba43-d39e61e6cff3&width=60&cache=v2)
Se utiliza para predecir la categoría de una observación. Por ejemplo, podríamos predecir si una transacción bancaria es fraudulenta o no. Como tenemos las dos opciones fraudulenta y no fraudulenta, es una clasificación binaria.
ღ★ღ Regresión ღ★ღ
.png?table=block&id=eb18d1a1-8667-4e7d-a552-72a387c7988a&t=eb18d1a1-8667-4e7d-a552-72a387c7988a&width=84&cache=v2)
La utilizamos para predecir valores continuos. Por ejemplo, podemos usar funciones como el número de habitaciones y el tamaño de una propiedad para predecir el precio de la propiedad.
ღ★ღ Convenciones de nombres ღ★ღ
ღ★ღ Datos de Entrenamiento
Lo utilizamos para entrenar el modelo y así poder ajustar los parámetros del modelo con el fin de que aprenda las relaciones entre características (features) y las etiquetas (labels). Si por ejemplo estamos construyendo un modelo para predecir el precio de casas. Nuestro conjunto de datos de entrenamiento podría consistir en 80% de los datos totales, incluyendo características como el tamaño de la casa, el número de habitaciones, la ubicación, etc., y la etiqueta correspondiente sería el precio de la casa.
ღ★ღ Datos de Prueba ღ★ღ
Los utilizamos para evaluar el rendimiento del modelo entrenado. No se utilizan durante el entrenamiento del modelo, lo que permite medir cómo generaliza el modelo a datos no vistos. Ejemplo: El 20% restante de los datos totales. Usamos este conjunto para verificar la precisión de el modelo en predecir precios de casas que no estaban en el conjunto de datos de entrenamiento.
.png?table=block&id=bd984d89-3035-461b-9d92-f4ed7fe6fee7&t=bd984d89-3035-461b-9d92-f4ed7fe6fee7&width=1839&cache=v2)
ღ★ღ Características (Features) ღ★ღ
Son los atributos o propiedades de los datos que se utilizan como entradas para el modelo. Si por ejemplo, tenemos el caso de predicción de los precios de casas, las características podrían incluir:
- Tamaño de la casa en metros cuadrados.
- Número de habitaciones.
- Ubicación (puede estar codificada de alguna manera).
- Edad de la casa.
- Proximidad a escuelas, parques, etc.
.png?table=block&id=98a14e94-1ad5-48bd-9eaa-99a74ce3dbcb&t=98a14e94-1ad5-48bd-9eaa-99a74ce3dbcb&width=470.984375&cache=v2)
ღ★ღ Etiquetas (Labels) ღ★ღ
Son las salidas o valores que el modelo intenta predecir, como el precio de la casa.
.png?table=block&id=26ad0140-c7ff-474e-b941-1663de073557&t=26ad0140-c7ff-474e-b941-1663de073557&width=470.984375&cache=v2)
ღ★ღ Sobreajuste (Overfitting) ღ★ღ
Ocurre cuando el modelo se ajusta demasiado bien a los datos de entrenamiento, capturando incluso el ruido y las peculiaridades específicas de esos datos, lo que resulta en un mal rendimiento en datos no vistos (datos de prueba). Esto terminaría en que el modelo tiene un alto rendimiento en el conjunto de entrenamiento, pero un bajo rendimiento en el conjunto de prueba.
ღ★ღ Subajuste (Underfitting) ღ★ღ
Ocurre cuando el modelo es demasiado simple para capturar las relaciones subyacentes en los datos, resultando en un mal rendimiento tanto en el conjunto de entrenamiento como en el conjunto de prueba. Quiere decir que el modelo tiene un bajo rendimiento en ambos conjuntos de datos.
.png?table=block&id=ca3334ef-28e1-413b-893c-77cf8090dc16&t=ca3334ef-28e1-413b-893c-77cf8090dc16&width=1680&cache=v2)
✰ღ★ღ Modelos Comunes ღ★ღ✰
Algunos de los modelos comunes de aprendizaje supervisado son:
★ Regresión Lineal ★
- Lo utilizamos para problemas de regresión (predicción de valores continuos).
- Es un modelo sencillo que asume una relación lineal entre las características y la etiqueta.
.png?table=block&id=930b9ef5-7f39-4415-927e-048f487c372f&t=930b9ef5-7f39-4415-927e-048f487c372f&width=1423&cache=v2)
★ Regresión Logística ★
- Lo utilizamos para problemas de clasificación binaria.
- Es un modelo que predice la probabilidad de que una entrada pertenezca a una clase específica.
.png?table=block&id=9f9fb196-8fa5-482b-a2c8-984e464ff137&t=9f9fb196-8fa5-482b-a2c8-984e464ff137&width=470.984375&cache=v2)
★ Máquinas de Vectores de Soporte (SVM) ★
- Lo utilizamos para clasificación y regresión.
- Encuentra el hiperplano que mejor separa las clases en los datos.
.png?table=block&id=062803fc-4947-4224-b266-ca6a6e7ba3f8&t=062803fc-4947-4224-b266-ca6a6e7ba3f8&width=470.984375&cache=v2)
★ Árboles de Decisión ★
- Lo utilizamos para clasificación y regresión.
- Crea un modelo basado en reglas de decisión derivadas de las características de los datos.
.png?table=block&id=b33590f3-922d-4bfc-984b-7ad622fe48fb&t=b33590f3-922d-4bfc-984b-7ad622fe48fb&width=1117&cache=v2)
★ Bosques Aleatorios (Random Forests) ★
- Es un conjunto de árboles de decisión para mejorar la precisión y reducir el sobreajuste.
- Lo utilizamos para clasificación y regresión.
.png?table=block&id=c09d254e-333c-4ae4-9101-2ed84d0a0330&t=c09d254e-333c-4ae4-9101-2ed84d0a0330&width=470.96875&cache=v2)
★ K-Nearest Neighbors (K-NN) ★
- Lo utilizamos para clasificar las entradas basándose en la mayoría de las clases de sus k vecinos más cercanos.
- Es un modelo muy sencillo pero puede ser computacionalmente costoso para grandes conjuntos de datos.
.png?table=block&id=663d445a-823d-4e9c-9c7a-1ca13d685a65&t=663d445a-823d-4e9c-9c7a-1ca13d685a65&width=470.96875&cache=v2)
✰ღ★ღ Sintaxis de Sickit Learn ღ★ღ✰
.png?table=block&id=242e5f2a-8a75-4163-98f2-54536ff5d909&t=242e5f2a-8a75-4163-98f2-54536ff5d909&width=1117&cache=v2)
- Autor:ByIris
- URL:http://145.223.74.189:3000//article/introduccion-al-aprendizaje-supervisado
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!