4.3.14
Estrategias de promediado
Resumen
- Elegir estrategias de promediado para métricas de clasificaciónの概要を押さえ、評価対象と読み取り方を整理します。
- Python 3.13 のコード例で算出・可視化し、手順と実務での確認ポイントを確認します。
- 図表や補助指標を組み合わせ、モデル比較や閾値調整に活かすヒントをまとめます。
1. Principales opciones de promediado #
| average | Cómo se calcula | Cuándo utilizarla |
|---|---|---|
micro | Suma TP/FP/FN de todas las muestras y luego calcula la métrica | Enfatiza la corrección global sin importar la distribución de clases |
macro | Calcula la métrica por clase y promedia sin ponderar | Da el mismo peso a cada clase; resalta las minoritarias |
weighted | Calcula la métrica por clase y promedia ponderando por soporte | Mantiene las proporciones reales; se comporta parecido a Accuracy |
samples | Solo para multietiqueta. Promedia las métricas por muestra | Para casos donde cada muestra puede tener varias etiquetas |
2. Comparación en Python 3.13 #
| |
| |
classification_report muestra las métricas por clase junto con macro avg, weighted avg y micro avg, lo que permite comparar las estrategias de un vistazo.
3. Cómo elegir #
- micro: ideal si te importa la corrección global y cada predicción tiene el mismo peso.
- macro: úsalo cuando las clases minoritarias sean críticas; penaliza la baja cobertura en etiquetas raras.
- weighted: útil para mantener la distribución real de clases y seguir informando Precision/Recall/F1.
- samples: opción por defecto en tareas multietiqueta donde una muestra puede tener varias etiquetas verdaderas.
Conclusiones #
- El parámetro
averagecambia radicalmente el significado de la métrica; ajústalo al objetivo del proyecto. - Recuerda:
macrotrata a las clases por igual,microprioriza la proporción global,weightedmantiene el balance ysamplesestá pensado para multietiqueta. - scikit-learn permite calcular varios promedios a la vez, así que vale la pena reportarlos para evitar malinterpretar la calidad del modelo.