検証曲線

モデルの訓練データへの適合度と検証用データへの予測性能を同時に比較するための便利機能。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_classification
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.model_selection import KFold, StratifiedKFold
from sklearn.model_selection import validation_curve
from sklearn.metrics import roc_auc_score

サンプルデータに対してモデルを作成し交差検証

実験用データ

X, y = make_classification(
    n_samples=1000,
    n_classes=2,
    n_informative=4,
    n_clusters_per_class=3,
    random_state=RND,
)