Bienvenido al curso práctico definitivo en preprocesamiento de datos para aprendizaje automático. A través de 6 módulos enfocados, pasarás de datos crudos y desordenados a caracterÃsticas listas para producción — dominando cada paso crÃtico del camino:
🔹 Módulo 1: Diagnosticar y Limpiar — Manejar valores faltantes, valores atÃpicos y formatos inconsistentes.
🔹 Módulo 2: Codificar Inteligentemente — Transformar categorÃas con Codificación de Etiquetas, One-Hot y Codificación de Objetivo.
🔹 Módulo 3: Escalar y Seleccionar — Estandarizar caracterÃsticas, combatir la dimensionalidad, extraer la señal.
🔹 Módulo 4: Medir lo que Importa — Más allá de la precisión: usar Recall, F1, AUC-ROC para datos desbalanceados.
🔹 Módulo 5: Validar para Generalizar — Detectar y prevenir el sobreajuste con Validación Cruzada.
🔹 Módulo 6: Proyecto Final — Construir un Sistema Real de Detección de Fraude desde cero, de extremo a extremo.
Herramientas: Python, Pandas, Scikit-learn, Seaborn.
Prerrequisitos: Conocimientos básicos de Python + Introducción a ML.
Deja de alimentar basura a tus modelos. Aprende a preprocesar como un profesional — porque grandes modelos comienzan con grandes datos.