Machine Learning · Todo lo importante · Bien estructurado
Un programa aprende de la experiencia E respecto a una tarea T con una medida de rendimiento P, si su rendimiento mejora con la experiencia.
Se entrena con datos etiquetados (entrada → salida conocida). El modelo aprende a mapear entradas a salidas.
Ej: Spam, precios casas, diagnóstico
Datos sin etiquetar. El modelo descubre patrones y estructuras ocultas por sí solo.
Ej: Segmentación clientes, PCA
Un agente aprende mediante prueba/error recibiendo recompensas o penalizaciones por sus acciones.
Ej: Juegos, robótica, AlphaGo
Predice valores continuos. Minimiza el error cuadrático.
Clasificación binaria. Aplica función sigmoide.
Divide el espacio usando preguntas if/else. Estructura jerárquica.
Ensemble de árboles entrenados en subconjuntos aleatorios (bagging). Vota por mayoría.
Encuentra el hiperplano que maximiza el margen entre clases.
Clasifica según los k puntos más similares en el entrenamiento.
Ensemble secuencial: cada árbol corrige los errores del anterior.
Basado en el teorema de Bayes. Asume independencia entre características.
Agrupa datos en k clusters minimizando la distancia intra-cluster.
Elegir k: método del codo (Elbow)
Construye un dendrograma. Dos enfoques:
Reduce la dimensionalidad manteniendo la máxima varianza.
Clustering basado en densidad. No requiere definir k.
| Función | Rango | Uso típico |
|---|---|---|
| ReLU | [0, ∞) | Capas ocultas (estándar) |
| Sigmoid | (0, 1) | Salida binaria |
| Softmax | (0,1), suma=1 | Salida multiclase |
| Tanh | (-1, 1) | Capas ocultas (RNNs) |
| Leaky ReLU | (-∞, ∞) | Evita neuronas muertas |
| Pred. Positivo | Pred. Negativo | |
|---|---|---|
| Real Positivo | TP (Verdadero +) | FN (Falso -) |
| Real Negativo | FP (Falso +) | TN (Verdadero -) |
Divide datos en k subconjuntos. Entrena k veces usando k-1 como train y 1 como validación. Métrica final = media de las k evaluaciones.
k típico: 5 o 10. Reduce varianza en la estimación.
División fija: train/val/test. Rápido pero más variable. Se usa con datasets grandes.
Caso extremo de k-fold donde k = n. Costoso pero sin sesgo.
El modelo es demasiado simple. Error alto en train y test.
Error bajo en train y generaliza bien a nuevos datos (test).
El modelo memoriza el train. Error bajo en train, alto en test.
Añade penalización |w| a la función de coste. Produce modelos sparse (pesos = 0). Útil para selección de features.
Añade penalización w² . Reduce los pesos sin llevarlos a cero. Más estable numéricamente.
Combinación de L1 y L2. Equilibrio entre ambos efectos.
Desactiva neuronas aleatoriamente durante entrenamiento (tasa típica 0.2–0.5). Previene co-adaptación.
Detiene el entrenamiento cuando la pérdida en validación empieza a subir.
Genera más datos de entrenamiento mediante transformaciones (rotación, flip, ruido).
Prueba todas las combinaciones posibles de hiperparámetros en una rejilla definida.
Costoso en tiempo. Garantiza encontrar el mejor dentro del espacio definido.
Muestrea combinaciones aleatorias. Más eficiente que Grid Search en espacios grandes.
Suele encontrar buenas soluciones con menos iteraciones.
Usa resultados previos para guiar la búsqueda. Modela la función objetivo con un proceso gaussiano.
Más eficiente. Herramientas: Optuna, Hyperopt.
| Técnica | Estrategia | Cómo combina | Ejemplos |
|---|---|---|---|
| Bagging | Entrena modelos en paralelo en subsets con reemplazo (bootstrap) | Voto mayoritario / promedio | Random Forest |
| Boosting | Modelos secuenciales; cada uno corrige errores del anterior | Suma ponderada | XGBoost, AdaBoost, LightGBM |
| Stacking | Entrena un metamodelo que aprende a combinar predicciones base | Modelo de nivel 2 (meta-learner) | Blending en Kaggle |
| Voting | Combina distintos tipos de modelos | Voto duro o blando | VotingClassifier sklearn |
| Aspecto | BI / OLAP | Data Mining | ML |
|---|---|---|---|
| Enfoque | Descriptivo | Exploratorio | Predictivo |
| Intervención | Alta | Media | Baja (auto) |
| Datos | Estructurados | Estructurados | Cualquier tipo |
| Objetivo | ¿Qué pasó? | ¿Qué hay? | ¿Qué pasará? |