ユースケース
ML ワークフロー全体を通して、 runs の入力および出力として Artifacts を使用できます。データセット、モデル、あるいは他の Artifacts をプロセッシングの入力として使用することが可能です。
| ユースケース | 入力 | 出力 |
|---|---|---|
| モデルトレーニング (Model Training) | データセット (トレーニングおよび検証データ) | トレーニング済みモデル (Trained Model) |
| データセットの前処理 (Dataset Pre-Processing) | データセット (生データ) | データセット (前処理済みデータ) |
| モデルの評価 (Model Evaluation) | モデル + データセット (テストデータ) | W&B Table |
| モデルの最適化 (Model Optimization) | モデル | 最適化されたモデル (Optimized Model) |
以下のコードスニペットは、順番に実行することを想定しています。
Artifacts を作成する
4 行のコードで Artifacts を作成できます。- W&B run を作成します。
wandb.Artifactで Artifacts オブジェクトを作成します。wandb.Artifact.add_file()を使用して、モデルファイルやデータセットなどの 1 つ以上のファイルを Artifacts オブジェクトに追加します。wandb.Run.log_artifact()を使用して、Artifacts を W&B にログ記録します。
dataset.h5 という名前のファイルを example_artifact という名前の Artifacts にログ記録する方法を示しています。
- Artifacts の
typeは、W&B プラットフォーム上での表示方法に影響します。typeを指定しない場合、デフォルトでunspecifiedになります。 - ドロップダウンの各ラベルは、異なる
typeパラメータ値を表します。上記のコードスニペットでは、 Artifacts のtypeはdatasetです。
Amazon S3 バケットなどの外部オブジェクトストレージに保存されているファイルやディレクトリーへの参照を追加する方法については、 外部ファイルの追跡 ページを参照してください。
Artifacts をダウンロードする
wandb.Run.use_artifact() メソッドを使用して、 run の入力としてマークしたい Artifacts を指定します。
前のコードスニペットの続きとして、以下のコード例は、先ほど作成した example_artifact という名前の Artifacts を使用する方法を示しています。
root パラメータ にカスタムパスを渡すことで、特定のディレクトリーに Artifacts をダウンロードできます。 Artifacts をダウンロードするその他の方法や追加のパラメータについては、 Artifacts のダウンロードと使用 ガイドを参照してください。