実験を作成する - Weights & Biases Documentation

W&B Python SDKを使用して、機械学習の Experiments を追跡できます。その後、インタラクティブなダッシュボードで結果を確認したり、W&B Public API を使用してプログラムからデータにアクセスするために Python へデータをエクスポートしたりできます。このガイドでは、W&B の構成要素を使用して W&B Experiment を作成する方法を説明します。

W&B Experiment の作成方法

W&B Experiment は次の4つのステップで作成します。

W&B Run の初期化
ハイパーパラメーターの辞書の取得
トレーニングループ内でのメトリクスのログ記録
W&B への Artifacts のログ記録

W&B Run の初期化

wandb.init() を使用して W&B Run を作成します。以下のスニペットでは、run を識別しやすくするために、“cat-classification” という名前の W&B Projects 内に “My first experiment” という説明付きで run を作成します。また、この run が将来の論文発表のためのベースライン実験であることを忘れないように、“baseline” と “paper1” というタグを含めています。

import wandb

with wandb.init(
    project="cat-classification",
    notes="My first experiment",
    tags=["baseline", "paper1"],
) as run:
    ...

wandb.init() は Run オブジェクトを返します。

注意: wandb.init() を呼び出した際に指定したプロジェクトが既に存在する場合、run は既存の Projects に追加されます。例えば、既に “cat-classification” というプロジェクトがある場合、そのプロジェクトは削除されず、新しい run がそこに追加されます。

ハイパーパラメーターの辞書の取得

学習率やモデルタイプなどのハイパーパラメーターの辞書を保存します。config で取得したモデルの設定は、後で結果を整理したりクエリしたりする際に役立ちます。

with wandb.init(
    ...,
    config={"epochs": 100, "learning_rate": 0.001, "batch_size": 128},
) as run:
    ...

実験の設定方法の詳細については、Configure Experiments を参照してください。

トレーニングループ内でのメトリクスのログ記録

run.log() を呼び出して、精度（accuracy）や損失（loss）などの各トレーニングステップに関するメトリクスをログに記録します。

model, dataloader = get_model(), get_data()

for epoch in range(run.config.epochs):
    for batch in dataloader:
        loss, accuracy = model.training_step()
        run.log({"accuracy": accuracy, "loss": loss})

W&B でログを記録できるさまざまなデータ型の詳細については、Log Data During Experiments を参照してください。

W&B への Artifacts のログ記録

任意で W&B Artifacts をログに記録します。Artifacts を使用すると、Datasets や Models のバージョン管理が簡単になります。

# 任意のファイルやディレクトリーを保存できます。この例では、
# モデルに ONNX ファイルを出力する save() メソッドがあると仮定します。
model.save("path_to_model.onnx")
run.log_artifact("path_to_model.onnx", name="trained-model", type="model")

Artifacts の詳細、または Registry でのモデルのバージョン管理について詳しく学びましょう。

すべてをまとめる

これまでのコードスニペットをまとめたフルスクリプトは以下の通りです。

import wandb

with wandb.init(
    project="cat-classification",
    notes="",
    tags=["baseline", "paper1"],
    # Runのハイパーパラメーターを記録
    config={"epochs": 100, "learning_rate": 0.001, "batch_size": 128},
) as run:
    # モデルとデータのセットアップ
    model, dataloader = get_model(), get_data()

    # モデルのパフォーマンスを可視化するためにメトリクスをログに記録しながらトレーニングを実行
    for epoch in range(run.config["epochs"]):
        for batch in dataloader:
            loss, accuracy = model.training_step()
            run.log({"accuracy": accuracy, "loss": loss})

    # トレーニング済みモデルを Artifact としてアップロード
    model.save("path_to_model.onnx")
    run.log_artifact("path_to_model.onnx", name="trained-model", type="model")

次のステップ：実験の可視化

W&B ダッシュボードを、機械学習モデルの結果を整理・可視化するための中心的な場所として活用してください。数回のクリックで、平行座標プロット、パラメータの重要度分析、その他のグラフタイプなどの豊富なインタラクティブなグラフを作成できます。

Experiments や特定の Runs を表示する方法の詳細については、Visualize results from experiments を参照してください。

ベストプラクティス

実験を作成する際に考慮すべき、推奨されるガイドラインを以下に示します。

Runs を終了させる: with ステートメント内で wandb.init() を使用すると、コードが完了するか例外が発生したときに、自動的に run が終了としてマークされます。
- Jupyter Notebook では、Run オブジェクトを自分で管理する方が便利な場合があります。この場合、Run オブジェクトに対して明示的に finish() を呼び出して完了をマークできます。
  # Notebook のセル内で: run = wandb.init() # 別のセル内で: run.finish()
Config: ハイパーパラメーター、アーキテクチャー、データセット、その他モデルを再現するために必要なものを追跡します。これらは列として表示されます。config の列を使用して、アプリ内で動的に run をグループ化、ソート、フィルタリングできます。
Project: Projects は、一緒に比較できる一連の Experiments です。各プロジェクトには専用のダッシュボードページがあり、異なる run のグループを簡単にオン・オフして、異なるモデルバージョンを比較できます。
Notes: スクリプトから直接、簡単なコミットメッセージのようなメモを設定できます。W&B アプリの run の Overview セクションでノートを編集したりアクセスしたりできます。
Tags: ベースラインの run やお気に入りの run を特定します。タグを使用して run をフィルタリングできます。タグは、後で W&B アプリのプロジェクトダッシュボードの Overview セクションで編集可能です。
比較のために複数の run set を作成する: 実験を比較する際は、メトリクスを比較しやすくするために複数の run set を作成してください。同じグラフやグラフグループ内で run set の表示・非表示を切り替えることができます。

以下のコードスニペットは、上記のベストプラクティスを使用して W&B Experiment を定義する方法を示しています。

import wandb

config = {
    "learning_rate": 0.01,
    "momentum": 0.2,
    "architecture": "CNN",
    "dataset_id": "cats-0192",
}

with wandb.init(
    project="detect-cats",
    notes="tweak baseline",
    tags=["baseline", "paper1"],
    config=config,
) as run:
    ...

W&B Experiment を定義する際に利用可能なパラメータの詳細については、API Reference Guide の wandb.init() API ドキュメントを参照してください。

W&B モデル

参照

​W&B Experiment の作成方法

​W&B Run の初期化

​ハイパーパラメーターの辞書の取得

​トレーニングループ内でのメトリクスのログ記録

​W&B への Artifacts のログ記録

​すべてをまとめる

​次のステップ：実験の可視化

​ベストプラクティス

W&B Experiment の作成方法

W&B Run の初期化

ハイパーパラメーターの辞書の取得

トレーニングループ内でのメトリクスのログ記録

W&B への Artifacts のログ記録

すべてをまとめる

次のステップ：実験の可視化

ベストプラクティス