데이터셋 CSV 파일 가져오기 및 로그
CSV 파일의 내용을 더 쉽게 재사용할 수 있도록 W&B Artifacts를 활용하는 것을 권장합니다.- 시작하려면 먼저 CSV 파일을 가져옵니다. 다음 코드조각에서
iris.csv파일명을 사용자의 CSV 파일명으로 바꿉니다.
- W&B Dashboards를 활용하기 위해 CSV 파일을 W&B Table로 변환합니다.
- 다음으로, W&B Artifact를 생성하고 테이블을 Artifact에 추가합니다.
- 마지막으로,
wandb.init으로 W&B에 트래킹 및 로그를 시작하기 위해 새로운 W&B Run을 시작합니다.
wandb.init() API는 데이터를 Run에 로그하기 위해 새로운 백그라운드 프로세스를 생성하며, (기본적으로) 데이터를 wandb.ai에 동기화합니다. W&B Workspace 대시보드에서 실시간 시각화를 확인하세요. 다음 이미지는 코드조각 데모의 결과를 보여줍니다.

실험 CSV 파일 가져오기 및 로그
경우에 따라 실험 세부 정보가 CSV 파일에 저장되어 있을 수 있습니다. 이러한 CSV 파일에서 흔히 볼 수 있는 세부 정보는 다음과 같습니다:- 실험 run의 이름
- 초기 노트
- 실험을 구분하기 위한 태그
- 실험에 필요한 설정 (당사의 Sweeps 하이퍼파라미터 튜닝을 활용할 수 있는 추가적인 이점 포함)
| Experiment | Model Name | Notes | Tags | Num Layers | Final Train Acc | Final Val Acc | Training Losses |
|---|---|---|---|---|---|---|---|
| Experiment 1 | mnist-300-layers | 트레이닝 데이터에 너무 많이 과적합됨 | [latest] | 300 | 0.99 | 0.90 | [0.55, 0.45, 0.44, 0.42, 0.40, 0.39] |
| Experiment 2 | mnist-250-layers | 현재 베스트 모델 | [prod, best] | 250 | 0.95 | 0.96 | [0.55, 0.45, 0.44, 0.42, 0.40, 0.39] |
| Experiment 3 | mnist-200-layers | 베이스라인 모델보다 결과가 나쁨. 디버깅 필요 | [debug] | 200 | 0.76 | 0.70 | [0.55, 0.45, 0.44, 0.42, 0.40, 0.39] |
| … | … | … | … | … | … | … | |
| Experiment N | mnist-X-layers | 메모 | … | … | … | … | […, …] |
- 시작하려면 먼저 CSV 파일을 읽어 Pandas DataFrame으로 변환합니다.
"experiments.csv"를 사용자의 CSV 파일 이름으로 바꿉니다.
-
다음으로,
wandb.init()을 사용하여 W&B에 트래킹 및 로그를 위한 새로운 W&B Run을 시작합니다.
run.log() 코맨드를 사용하세요.
define_metric API를 사용하여 실행 결과를 정의하는 최종 요약 메트릭을 로그할 수 있습니다. 이 예시에서는 run.summary.update()를 사용하여 요약 메트릭을 run에 추가합니다.