MLOps Zoomcamp 把模型帶上線的完整路線
9 個免費模組、14.8k 星標,從實驗追蹤到部署監控與最終專案,幫你判斷這門 MLOps 課程是否適合把模型推進 production。

這門免費課程用 9 個模組帶你把機器學習模型做成可部署、可監控的 production 系統。
MLOps Zoomcamp 是一門免費的 9 週課程,GitHub 上有 14.8k stars,重點不是再教一次模型訓練,而是把你從實驗腳本一路帶到部署與監控。看完下面 5 項,你可以判斷自己缺的是模型管理、pipeline、部署方式,還是工程化習慣。
| 項目 | 重點 | 可比規格 |
|---|---|---|
| 課程長度 | 學習節奏 | 9 週 |
| GitHub 熱度 | 社群關注 | 14.8k stars |
| 模組數 | 內容範圍 | 9 個模組 |
| 專案收尾 | 實作成果 | 1 個 final project |
1. 先把 MLOps 的全貌看懂
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
這門課先回答一個最關鍵的問題:模型訓練完之後,接下來到底要做什麼。開場模組會講 MLOps 的基本概念、課程結構,並用 MLOps Zoomcamp 的 NY Taxi 範例把整條流程串起來。

如果你已經會基本機器學習,但還沒碰過 production 流程,這一段最適合先看。它也明確設了門檻:Python、Docker、命令列工具,還有大約一年的程式經驗,代表這不是入門 ML 課,而是把既有技能接到實戰管線。
- 適合:資料科學家、ML 工程師、軟體工程師
- 形式:預錄影片加作業
- 主軸:MLOps maturity model、環境設定、課程導覽
2. 先管住實驗,才管得住模型
很多團隊卡住的第一步,不是訓練不出模型,而是忘了哪次實驗用了什麼參數。這一模組把 experiment tracking、MLflow、模型儲存與載入、model registry 放在一起,讓你能比較 run、保留版本、追蹤結果。
如果你曾經在 notebook、腳本、雲端實驗之間迷路,這段會很有感。它的價值在於把一次性的訓練行為,變成可重現、可查詢、可交接的流程。
重點:experiment tracking / MLflow basics / model registry / save-load / homework3. 把零散腳本變成可跑的 pipeline
當實驗管理穩定後,課程接著談 orchestration,也就是怎麼讓資料處理、訓練、驗證按順序可靠執行。這一段的核心不是炫技,而是把分散的腳本整理成能重複跑的 ML pipeline。

對需要減少人工操作、降低 glue code 脆弱度的團隊來說,這是很實用的一章。它讓你開始思考「流程」而不只是「單次訓練」,也更接近真實團隊的交付方式。
- 目標:自動化多步驟工作流
- 結果:可重用的 pipeline 結構
- 練習:完成 orchestration 作業
4. 部署不是只有一種做法
部署模組會比較 online、streaming 和 batch 三種方式,並提到 Flask、AWS Kinesis、Lambda 與 batch scoring。這種安排很重要,因為不同模型對延遲、吞吐和成本的要求完全不同。
如果你主要只接觸過訓練,這一章會幫你補上「模型怎麼真的到使用者手上」的那一段。你會更清楚什麼情況該做 web service,什麼情況適合串流,什麼情況 batch 就夠了。
- Online:web service 或 streaming
- Offline:batch scoring
- 工具:Flask、AWS Kinesis、Lambda
5. 監控是 production ML 的分水嶺
這門課把 monitoring 當成正式模組處理,而不是附帶補充。它同時涵蓋 service monitoring 與 batch monitoring,工具包含 Prometheus、Evidently、Grafana,以及 Prefect、MongoDB、Evidently 的組合。
這種拆法很實際,因為線上服務和批次任務出問題的方式不一樣。若你想觀察 data drift、服務健康度、任務結果,這一章可以當作入門工具箱。
Web monitoring: Prometheus + Evidently + Grafana
Batch monitoring: Prefect + MongoDB + Evidently6. 把工程習慣補齊,系統才撐得久
最後一個核心模組把焦點拉回工程實務,包括 unit test、integration test、linting、formatting、pre-commit hooks、GitHub Actions 的 CI/CD,以及 Terraform 的 infrastructure as code。
如果你已經有模型,卻總覺得交付品質不穩,這一段很值得補。它不是在教你多一個模型技巧,而是在教你怎麼讓流程可審查、可自動化、可重現,這正是 production 團隊最在意的部分。
- 測試:unit 與 integration
- 自動化:pre-commit、GitHub Actions
- 基礎設施:Terraform
怎麼挑,才不會白學
如果你想要的是一條免費、結構清楚、從實驗到部署再到監控的路線,這門課很適合。它特別適合已經會 Python 和 Docker、但還沒把 ML 送進 production 的人。
如果你只想快速補單點技能,像是 MLflow、部署或監控,也可以直接跳到對應模組;但若你想最後拿出一個能展示的系統,跟著 final project 走完整條線會更划算。