標籤
MLflow 是用來管理機器學習實驗、模型版本與部署流程的開源平台,常和 MLOps、SageMaker、S3 一起出現。它讓訓練參數、指標、模型產物與追蹤紀錄可重現,也方便比較不同資料量與微調設定的效果。
2 篇文章
MLOps 把模型訓練、測試、部署和監控變成可重複流程。這篇用 AWS 的視角,拆解它怎麼運作、為何重要,以及和 DevOps 的差別。
AWS 示範怎麼用 SageMaker Unified Studio、S3 和 MLflow,拿 DocVQA 資料微調 Llama 3.2 11B Vision Instruct,並比較 1,000、5,000、10,000 筆資料的訓練效果。