Sección 3.3 #
Datos numéricos #
Recetas comunes para escalar, transformar distribuciones, limitar outliers, imputar valores faltantes y seleccionar características.
| Tarea | Objetivo | Herramientas |
|---|---|---|
| Estandarizar / Normalizar | Estabilizar el comportamiento del modelo | StandardScaler, MinMaxScaler, RobustScaler |
| Transformaciones de potencia | Hacer los datos más parecidos a normales | PowerTransformer, Box‑Cox, Yeo‑Johnson |
| Manejo de outliers | Reducir influencia indebida | Winsorización, filtro IQR, IsolationForest |
| Valores faltantes | Conservar filas, agregar indicadores | Simple/Iterative/KNN Imputer + indicador |
| Selección de características | Reducir dimensionalidad | Umbral de varianza, PCA, métodos basados en modelos |
Pautas: explora distribuciones, trata outliers con criterio y construye el preprocesamiento dentro de pipelines para evitar fugas.