sweep コマンドでは、--pause や --resume などのフラグを使用して、新しい W&B Runs を作成する能力を制御します。既存の Runs への影響は以下の通りです:
--pause: Sweep を一時停止すると、再開するまで エージェント は新しい Runs を作成しません。実行中の既存の Runs は通常通り続行されます。--resume: Sweep を再開すると、 エージェント は探索戦略に従って新しい Runs の作成を続行します。--stop: Sweep を停止すると、 エージェント は新しい Runs の作成を停止します。実行中の既存の Runs は完了するまで続行されます。--cancel: Sweep をキャンセルすると、 エージェント は現在実行中のすべての Runs を即座に終了させ、新しい Runs の作成を停止します。
Sweep の一時停止
Sweep を一時停止して、新しい Runs の作成を一時的に止めます。既に実行中の Runs は完了するまで実行され続けます。 Sweep を一時停止するには、wandb sweep --pause コマンドを使用し、一時停止したい Sweep ID を指定します。
Sweep の再開
一時停止した Sweep を再開するには、wandb sweep --resume コマンドを使用します。 Sweep は探索戦略に従って、再び新しい Runs の作成を開始します。再開したい Sweep ID を指定してください:
Sweep の停止
新しい Runs の作成を停止しつつ、現在実行中の Runs を正常に終了させるには、 Sweep を終了(Stop)させます。wandb sweep --stop コマンドを使用します:
Sweep のキャンセル
Sweep をキャンセルすると、実行中のすべての Runs を即座に終了させ、新しい Runs の作成を停止します。これは、既存の Runs を強制終了させる唯一の Sweep コマンドです。 Sweep をキャンセルするには、wandb sweep --cancel コマンドを使用し、キャンセルしたい Sweep ID を指定します。
Sweep と Run のステータスの理解
Sweep は複数の Runs をオーケストレーションして ハイパーパラメーター の組み合わせを探索します。 Sweep のステータスと Run のステータスがどのように相互作用するかを理解することは、 ハイパーパラメーター 最適化を効果的に管理するために不可欠です。主な違い
- Sweep status は、新しい Runs を作成するかどうかを制御します (Running, Paused, Stopped, Cancelled, Finished, Failed, Crashed)
- Run status は、個々の Runs の実行状態を反映します (Pending, Running, Finished, Failed, Crashed, Killed)
ベストプラクティス
- 実行中の実験を失わずに探索を一時的に中断したい場合は、キャンセルではなく
--pauseを使用してください。 - 個々の Run のステータスを監視し、系統的な失敗がないか確認してください。
- 満足のいく ハイパーパラメーター が見つかった場合は、正常終了させるために
--stopを使用してください。 - Runs が過剰なリソースを消費している場合やエラーが発生している場合などの緊急時には、
--cancelを使用してください。