Datos numéricos | Preprocesamiento

Prep

Datos numéricos | Preprocesamiento

Sección 3.3 #

Datos numéricos #

Recetas comunes para escalar, transformar distribuciones, limitar outliers, imputar valores faltantes y seleccionar características.

TareaObjetivoHerramientas
Estandarizar / NormalizarEstabilizar el comportamiento del modeloStandardScaler, MinMaxScaler, RobustScaler
Transformaciones de potenciaHacer los datos más parecidos a normalesPowerTransformer, Box‑Cox, Yeo‑Johnson
Manejo de outliersReducir influencia indebidaWinsorización, filtro IQR, IsolationForest
Valores faltantesConservar filas, agregar indicadoresSimple/Iterative/KNN Imputer + indicador
Selección de característicasReducir dimensionalidadUmbral de varianza, PCA, métodos basados en modelos

Pautas: explora distribuciones, trata outliers con criterio y construye el preprocesamiento dentro de pipelines para evitar fugas.