[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-four-music-datasets-ai-music-training-zh":3,"article-related-four-music-datasets-ai-music-training-zh":33,"series-industry-d81055cb-e6f4-4deb-862b-8be06436e913":76},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":25,"views":29,"created_at":30,"published_at":31,"topic_cluster_id":32},"d81055cb-e6f4-4deb-862b-8be06436e913","four-music-datasets-ai-music-training-zh","4 個音樂資料集正在改寫 AI 訓練","\u003Cp data-speakable=\"summary\">四個大型音樂資料集正在影響 AI 音樂模型的訓練方式。\u003C\u002Fp>\u003Cp>這份清單看完，你可以快速判斷 4 個資料集各自的規模、來源透明度與法律風險，進而看懂音樂 AI 為何正從「抓資料訓練」走向「談授權合作」。\u003C\u002Fp>\u003Ctable>\u003Cthead>\u003Ctr>\u003Cth>項目\u003C\u002Fth>\u003Cth>曲目數\u003C\u002Fth>\u003Cth>公開來源\u003C\u002Fth>\u003Cth>重點\u003C\u002Fth>\u003C\u002Ftr>\u003C\u002Fthead>\u003Ctbody>\u003Ctr>\u003Ctd>LAION-DISCO-12M\u003C\u002Ftd>\u003Ctd>1200 萬以上\u003C\u002Ftd>\u003Ctd>有\u003C\u002Ftd>\u003Ctd>只提供公開 YouTube 連結與 metadata\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>大型未具名資料集\u003C\u002Ftd>\u003Ctd>約 900 萬\u003C\u002Ftd>\u003Ctd>未在摘要中交代\u003C\u002Ftd>\u003Ctd>兩個最大集合之一\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>\u003Ca href=\"https:\u002F\u002Ffreemusicarchive.org\u002F\">Free Music Archive\u003C\u002Fa>\u003C\u002Ftd>\u003Ctd>10 萬以上\u003C\u002Ftd>\u003Ctd>有\u003C\u002Ftd>\u003Ctd>據報導被 Google、Stability AI 使用\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>另一個未具名小型資料集\u003C\u002Ftd>\u003Ctd>10 萬以上\u003C\u002Ftd>\u003Ctd>未在摘要中交代\u003C\u002Ftd>\u003Ctd>兩個較小集合之一\u003C\u002Ftd>\u003C\u002Ftr>\u003C\u002Ftbody>\u003C\u002Ftable>\u003Ch2>1. LAION-DISCO-12M 先把規模拉到最大\u003C\u002Fh2>\u003Cp>\u003Ca href=\"https:\u002F\u002Flaion.ai\u002F\">LAION\u003C\u002Fa> 的 LAION-DISCO-12M 是報導中最清楚、也最大的公開資料集之一，2024 年 11 月釋出，規模超過 1200 萬首。它的定位不是商業成品資料庫，而是研究用途。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781930866352-k0rw.png\" alt=\"4 個音樂資料集正在改寫 AI 訓練\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>這點很重要，因為它不是\u003Ca href=\"\u002Fnews\u002Frust-books-real-world-skill-zh\">直接\u003C\u002Fa>分發音訊檔，而是提供公開 YouTube 曲目連結與中繼資料。對 AI 開發者來說，這種形\u003Ca href=\"\u002Fnews\u002F2026-msi-daejeon-format-teams-dates-zh\">式更\u003C\u002Fa>容易擴大訓練集；對版權方來說，則更難追蹤實際用了哪些內容。\u003C\u002Fp>\u003Cul>\u003Cli>1200 萬以上曲目\u003C\u002Fli>\u003Cli>2024 年 11 月發布\u003C\u002Fli>\u003Cli>研究用途框架\u003C\u002Fli>\u003Cli>提供連結與 metadata，不直接提供音訊\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>2. 900 萬首的集合最能放大不透明問題\u003C\u002Fh2>\u003Cp>第二個大集合約有 900 萬首，但報導摘要沒有交代公開來源，這種不完整資訊正是音樂產業最在意的地方。當資料集大到這個量級，模型就可能在流派、年代與歌手目錄上都受到影響。\u003C\u002Fp>\u003Cp>報導提到，這 4 個資料集合計超過 2100 萬首，且包含 Bad Bunny、Nirvana、Taylor Swift、Billie Eilish、Pearl Jam 和 The Beatles 等作品。對權利人來說，真正棘手的不只是「有沒有用到」，而是「怎麼用到、誰能查到」。\u003C\u002Fp>\u003Cul>\u003Cli>約 900 萬首\u003C\u002Fli>\u003Cli>來源在摘要中未完整揭露\u003C\u002Fli>\u003Cli>屬於兩個最大集合之一\u003C\u002Fli>\u003Cli>涉及受版權保護的音樂\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>3. Free Music Archive 是最容易追溯的案例\u003C\u002Fh2>\u003Cp>\u003Ca href=\"https:\u002F\u002Ffreemusicarchive.org\u002F\">Free Music Archive\u003C\u002Fa> 最早是 2017 年由學術研究者發布，目的是做 music-information-retrieval，也就是搜尋、分類與分析音樂的研究。它的優勢不是量最大，而是來源最清楚。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781930866240-he3w.png\" alt=\"4 個音樂資料集正在改寫 AI 訓練\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>這個資料庫來自 \u003Ca href=\"https:\u002F\u002Fwfmu.org\u002F\">WFMU\u003C\u002Fa> 的曲庫，許多作品早就以較寬鬆的 Creative Commons 授權公開。這讓它和後來被拿去訓練\u003Ca href=\"\u002Ftag\u002F生成式-ai\">生成式 AI\u003C\u002Fa> 的資料相比，具有更明確的授權脈絡。\u003C\u002Fp>\u003Cul>\u003Cli>10 萬以上曲目\u003C\u002Fli>\u003Cli>2017 年以學術用途發布\u003C\u002Fli>\u003Cli>基於 Creative Commons 授權作品\u003C\u002Fli>\u003Cli>據報導被 Google 與 Stability AI 使用\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>4. 另一個 10 萬級資料集反映審計難度\u003C\u002Fh2>\u003Cp>第四個集合也是約 10 萬首，但報導摘要沒有點名。這種「有規模、沒名字」的狀況，正好說明音樂 AI 訓練資料的審計難題：外界知道它存在，卻不一定知道它怎麼來、怎麼被用。\u003C\u002Fp>\u003Cp>\u003Ca href=\"https:\u002F\u002Fwww.theatlantic.com\u002F\">The Atlantic\u003C\u002Fa> 的報導指出，這 4 個資料集都被下載過好幾千次。當下載次數已經這麼高，卻仍缺少完整公開資訊，版權爭議自然會持續擴大。\u003C\u002Fp>\u003Cul>\u003Cli>10 萬以上曲目\u003C\u002Fli>\u003Cli>在摘要中未命名\u003C\u002Fli>\u003Cli>曾被下載數千次\u003C\u002Fli>\u003Cli>最能代表訓練資料的黑箱問題\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>5. 真正的轉折是授權，不只是資料集\u003C\u002Fh2>\u003Cp>\u003Ca href=\"https:\u002F\u002Fwww.udio.com\u002F\">Udio\u003C\u002Fa> 與 \u003Ca href=\"https:\u002F\u002Fsuno.com\u002F\">Suno\u003C\u002Fa> 正面臨至少 12 起訴訟，但市場走向已經不只是在法院裡拉鋸。\u003Ca href=\"https:\u002F\u002Fwww.universalmusic.com\u002F\">Universal Music Group\u003C\u002Fa> 已在 2025 年 10 月與 Udio 和解，\u003Ca href=\"https:\u002F\u002Fwww.wmg.com\u002F\">Warner Music Group\u003C\u002Fa> 也先後與 Udio、Suno 達成協議。\u003C\u002Fp>\u003Cp>這代表一個明顯訊號：音樂 AI 可能會從開放式抓取訓練，\u003Ca href=\"\u002Fnews\u002Fmidjourney-body-scanner-bad-pivot-ai-brand-zh\">轉向\u003C\u002Fa>授權式系統。\u003Ca href=\"https:\u002F\u002Fwww.sonymusic.com\u002F\">Sony Music\u003C\u002Fa> 仍在訴訟中，獨立音樂人與美國音樂家聯盟也還在追討未授權使用的補償。\u003C\u002Fp>\u003Cul>\u003Cli>Udio 面臨至少 12 起訴訟\u003C\u002Fli>\u003Cli>UMG 已與 Udio 和解\u003C\u002Fli>\u003Cli>Warner 也與 Udio、Suno 達成協議\u003C\u002Fli>\u003Cli>Sony Music 仍在訴訟中\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>怎麼挑，才看得懂這場戰局\u003C\u002Fh2>\u003Cp>如果你重視規模，LAION-DISCO-12M 最值得看；如果你重視來源與授權脈絡，Free Music Archive 最有參考價值；如果你想判斷產業未來走向，Udio 和 Suno 的授權協議比單一資料集更重要。\u003C\u002Fp>\u003Cp>對一般讀者來說，這份清單最重要的結論不是誰收錄最多，而是音樂 AI 的核心競爭已經從「資料量」轉到「資料能不能被查清楚、能不能合法使用」。\u003C\u002Fp>","4 個超過 2100 萬首曲目的音樂資料集，正在推動 AI 訓練與授權談判走向新局。","www.musicbusinessworldwide.com","https:\u002F\u002Fwww.musicbusinessworldwide.com\u002Ffour-music-datasets-holding-millions-of-tracks-are-being-shared-among-ai-developers-the-atlantic-reports\u002F",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781930866352-k0rw.png","industry","zh","55699da8-8f47-4348-81c3-65cd969debd3",[17,18,19,20,21,22,23,24],"AI 音樂","音樂資料集","版權","授權","LAION","Free Music Archive","Udio","Suno",[26,27,28],"LAION-DISCO-12M 是最大且最公開的研究型資料集。","Free Music Archive 的授權來源最清楚，最適合觀察合法訓練路徑。","Udio、Suno 與唱片公司和解，顯示產業正在往授權式 AI 音樂系統移動。",0,"2026-06-20T04:47:22.189311+00:00","2026-06-20T04:47:22.183+00:00","64c683a7-7f01-4cbf-ba81-8377163d5223",{"tags":34,"relatedLang":35,"relatedPosts":39},[],{"id":15,"slug":36,"title":37,"language":38},"four-music-datasets-ai-music-training-en","Four music datasets are shaping AI music training","en",[40,46,52,58,64,70],{"id":41,"slug":42,"title":43,"cover_image":44,"image_url":44,"created_at":45,"category":13},"ff19d422-4694-464f-8184-fff9bfba954a","claude-vs-gpt-vs-gemini-cheng-shi-ma-ji-zhun-dui-jue-zh","Claude vs GPT vs Gemini：程式碼基準對決","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781939879962-8wf9.png","2026-06-20T07:17:34.904794+00:00",{"id":47,"slug":48,"title":49,"cover_image":50,"image_url":50,"created_at":51,"category":13},"ba974156-c051-482e-a173-682115e06871","clip-converter-rivals-faster-safer-2026-zh","4 款 Clip Converter 替代品，格式更廣也更安全","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781935361809-s27m.png","2026-06-20T06:02:18.601585+00:00",{"id":53,"slug":54,"title":55,"cover_image":56,"image_url":56,"created_at":57,"category":13},"487c9b6d-f5b0-4af9-b51d-e768c7b74b08","openai-sora-shutdown-unit-economics-zh","OpenAI 的 Sora 停止服務證明：AI 不是贏在聲量，而是算得過單位經濟","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781933566229-4oaw.png","2026-06-20T05:32:17.291619+00:00",{"id":59,"slug":60,"title":61,"cover_image":62,"image_url":62,"created_at":63,"category":13},"3f6c0c0f-4d9f-4222-96df-307ea939e4cd","anthropics-model-shutdown-safety-can-bite-back-zh","Anthropic 模型下架：安全警告反噬了自己","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781932661694-7w2n.png","2026-06-20T05:17:21.729285+00:00",{"id":65,"slug":66,"title":67,"cover_image":68,"image_url":68,"created_at":69,"category":13},"92a73841-6a48-4701-9def-e02a0181309c","boy-george-ai-vs-taylor-swift-rerecordings-zh","Boy George AI vs Taylor Swift 重新錄製","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781931776334-tz67.png","2026-06-20T05:02:32.727077+00:00",{"id":71,"slug":72,"title":73,"cover_image":74,"image_url":74,"created_at":75,"category":13},"afa97720-04f5-4721-84cc-6d32b1788e0a","rust-books-real-world-skill-zh","5 本 Rust 書，直接對應實戰技能","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1781924566365-ovan.png","2026-06-20T03:02:21.724481+00:00",[77,82,87,92,97,102,107,112,117,122],{"id":78,"slug":79,"title":80,"created_at":81},"ee073da7-28b3-4752-a319-5a501459fb87","ai-in-2026-what-actually-matters-now-zh","2026 AI 真正重要的事","2026-03-26T07:09:12.008134+00:00",{"id":83,"slug":84,"title":85,"created_at":86},"83bd1795-8548-44c9-9a7e-de50a0923f71","trump-ai-framework-power-speech-state-preemption-zh","川普 AI 框架瞄準電力、言論與州權","2026-03-26T07:12:18.695466+00:00",{"id":88,"slug":89,"title":90,"created_at":91},"ea6be18b-c903-4e54-97b7-5f7447a612e0","nvidia-gtc-2026-big-ai-announcements-zh","NVIDIA GTC 2026 重點拆解","2026-03-26T07:14:26.62638+00:00",{"id":93,"slug":94,"title":95,"created_at":96},"4bcec76f-4c36-4daa-909f-54cd702f7c93","claude-users-spreading-out-and-getting-better-zh","Claude 用戶更分散，也更會用","2026-03-26T07:22:52.325888+00:00",{"id":98,"slug":99,"title":100,"created_at":101},"bd903b15-2473-4178-9789-b7557816e535","openclaw-raises-hard-question-for-ai-models-zh","OpenClaw 逼問 AI 模型價值","2026-03-26T07:24:54.707486+00:00",{"id":103,"slug":104,"title":105,"created_at":106},"eeac6b9e-ad9d-4831-8eec-8bba3f9bca6a","gap-google-gemini-checkout-fashion-search-zh","Gap 把結帳搬進 Gemini","2026-03-26T07:28:23.937768+00:00",{"id":108,"slug":109,"title":110,"created_at":111},"0740e53f-605d-4d57-8601-c10beb126f3c","google-pushes-gemini-transition-to-march-2026-zh","Google 把 Gemini 轉換延到 2026 年 3…","2026-03-26T07:30:12.825269+00:00",{"id":113,"slug":114,"title":115,"created_at":116},"e660d801-2421-4529-8fa9-86b82b066990","metas-llama-4-benchmark-scandal-gets-worse-zh","Meta Llama 4 分數風波又擴大","2026-03-26T07:34:21.156421+00:00",{"id":118,"slug":119,"title":120,"created_at":121},"183f9e7c-e143-40bb-a6d5-67ba84a3a8bc","accenture-mistral-ai-sovereign-enterprise-deal-zh","Accenture 攜手 Mistral AI 賣主權 AI","2026-03-26T07:38:14.818906+00:00",{"id":123,"slug":124,"title":125,"created_at":126},"191d9b1b-768a-478c-978c-dd7431a38149","mistral-ai-faces-its-hardest-year-yet-zh","Mistral AI 迎來最硬的一年","2026-03-26T07:40:23.716374+00:00"]