検証曲線
モデルの訓練データへの適合度と検証用データへの予測性能を同時に比較するための便利機能。
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_classification
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.model_selection import KFold, StratifiedKFold
from sklearn.model_selection import validation_curve
from sklearn.metrics import roc_auc_score
サンプルデータに対してモデルを作成し交差検証
実験用データ
X, y = make_classification(
n_samples=1000,
n_classes=2,
n_informative=4,
n_clusters_per_class=3,
random_state=RND,
)