神經元選擇性會隨規模改變

OraCore Editors

返回首頁

[RSCH] 2026年6月3日6 分鐘閱讀OraCore 編輯部

神經元選擇性會隨規模改變

這篇研究指出，Rosetta Neurons 會隨模型變大而變得更選擇性，且共享神經元的增長是次線性的。

Rosetta Neurons selectivity monosemanticity scaling laws interpretability

分享 LinkedIn

這篇研究指出，Rosetta Neurons 會隨模型變大而變得更選擇性，且共享神經元的增長是次線性的。

研究機構：arXiv 摘要未明確標註
核心數據：語言模型最高 30B 參數、視覺模型最高 5B 參數
突破點：量化 Rosetta Neurons 規模律

這篇論文把「模型變大會變強」這句老話，往更細的地方推了一步。它不是只看 loss 或最終表現，而是去看模型裡的單一神經元，尤其是那些在不同獨立訓練模型中都能對應上的 Rosetta Neurons。作者想知道，當模型規模往上加，這些神經元的數量、比例和選擇性，會不會也跟著出現規律。

這個問題對做模型解釋、除錯、資料挑選的人都很實際。因為如果內部表徵真的有規模律，那就代表大模型不是只在外部指標上變化，裡面的功能分工也可能會重新排列。這會影響你怎麼找特徵、怎麼切資料、怎麼理解模型為什麼會做出某種判斷。

這篇在解什麼痛點

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

作者要處理的痛點很直接：規模律研究大多盯著表面結果，像是 loss、準確率、吞吐量這些指標，但很少系統性地看模型內部的神經元結構。問題是，模型的內部組織方式，往往才是理解行為的關鍵。

他們選 Rosetta Neurons 當切入點。這類神經元的特徵是，在不同獨立訓練的模型裡，激活模式很相似。也就是說，它們像是一組跨模型能對得上的共享表徵。這讓它們很適合拿來當探針，看共享結構到底會不會隨規模擴大而增加、碎裂，還是維持穩定。

如果這種共享神經元真的有規律可循，那對做模型檢視、特徵發現、甚至資料篩選的人都很有用。因為你不只是知道模型變大了，還能預測它裡面的表示方式會怎麼變。

方法怎麼做

這篇研究分別分析語言模型和視覺模型中的 Rosetta Neurons。語言模型規模最高到 30B 參數，視覺模型最高到 5B 參數。作者接著比較不同規模下，這群神經元的絕對數量與整體占比如何變化。

這裡有個很重要的觀察角度：絕對數量和相對比例不是同一件事。某個神經元族群即使數量變多，也可能在整個網路裡占更小比例。這篇論文就是抓住這個差異，去看 Rosetta Neurons 是否真的呈現出規模相關的變化。

除了數量，作者也看選擇性、monosemanticity，以及 domain specialization。白話說，就是這些神經元是不是越來越只對單一類特徵或概念有反應，還是仍然混雜在一起。這些指標直接關係到神經元是否容易被人理解，也關係到它們是不是更能代表某個特定領域。

論文還放了一個分析模型。它把 feature utility 和有限的神經元容量放在一起考慮，試著解釋為什麼會出現次線性成長，以及作者觀察到的 polarization effect。也就是說，這不只是描述現象，還想給出一個能說明現象的機制框架。

論文實際證明了什麼

第一個重點結果，是 Rosetta Neurons 呈現次線性成長。模型變大時，這類神經元的絕對數量確實增加，但它們在整體神經元中的占比卻下降。換句話說，大模型裡共有的這種神經元更多了，但它們不是以跟參數量一樣快的速度擴張。

第二個重點，是作者稱為 Neuron Polarization Effect 的現象。隨著規模增加，Rosetta Neurons 變得更選擇性，也更 monosemantic；相對地，另一群非 Rosetta 神經元則維持較低的選擇性。作者把這看成內部表徵開始分化：一部分變得更像可解釋的共享族群，另一部分則保留較不專一的狀態。

第三個結果，是 Rosetta Neurons 會隨規模增加而更具 domain specialization。論文用 continued pretraining 的資料過濾案例來展示這件事，說明這種選擇性不只是理論上的性質，還能被拿來做資料選擇。

不過，摘要沒有公開完整 benchmark 細節。裡面沒有 downstream task 的準確率表，也沒有 loss 改善數字，更沒有完整 ablation。也就是說，從摘要本身只能確認規模趨勢、選擇性變化與案例展示，不能直接把它解讀成某種可量化的任務提升。

這對開發者有什麼影響

如果你在做大模型訓練、微調或分析，這篇論文提醒你一件事：模型變大，不只是能力變強，內部結構也可能重組。這代表你看模型時，不能只盯著輸出結果，還要考慮它裡面的特徵是不是正在變得更集中、更專一。

對做 interpretability 的人來說，這很重要。因為如果少數神經元族群會隨規模累積更多共享、可解釋的結構，那你在追蹤概念、找 feature、或做 neuron tracing 時，可能要把注意力放在更小但更關鍵的區域。反過來說，網路裡其他比較不專一的部分，可能會更難直接拿來當解釋入口。

對資料工程和 continued pretraining 也有啟發。論文提到的資料過濾案例，暗示可以用神經元選擇性來輔助挑資料。這不是說已經有一套通用流程，但至少顯示作者把這個結果往實作方向推，而不是只停在觀察層級。

限制與還沒回答的問題

這篇摘要的限制也很明顯。它沒有說清楚到底分析了多少模型，也沒有交代 Rosetta Neurons 在實作上是怎麼定義、怎麼對齊、怎麼抽取的。對想重現的人來說，這些細節很關鍵，但摘要裡沒有展開。

另外，它只明確提到語言模型和視覺模型兩大族群。摘要沒有說這個規律是否也會出現在其他架構，或是其他種類的神經元族群上。若要把它升級成更一般的規則，這會是下一步必須回答的問題。

分析模型也還有驗證空間。摘要沒有交代它如何排除其他解釋，也沒有說這個模型是否能預測更多細節。換句話說，現階段比較像是「觀察到一個規律，並提出一個合理機制」，還不到完全定論。

最後，這篇研究把選擇性、monosemanticity、專一化都跟規模連起來，但摘要沒有證明這些性質會直接轉化成更好的產品效果、除錯效率或安全性提升。它比較像是在告訴你：模型內部確實有規模現象，而且這個現象值得被當成一個獨立研究對象。

結論

這篇論文的核心訊息很清楚：神經元本身也有規模律。Rosetta Neurons 會隨模型變大而增加，但占比變小，而且會變得更選擇性、更 monosemantic，也更具領域專一性。

對開發者來說，這代表 scale 不只改變模型能做什麼，也改變模型怎麼把功能分配到內部神經元。摘要沒有給完整 benchmark 數字，但它提供了一個很實用的視角：未來談大模型規模，不只要看外部表現，也要看內部結構怎麼跟著長大。

Rosetta Neurons 是這篇研究用來觀察跨模型共享結構的探針。
語言模型最高到 30B 參數，視覺模型最高到 5B 參數。
作者把神經元選擇性、monosemanticity 和規模變化連成一條線。

// 相關文章

神經元選擇性會隨規模改變

這篇在解什麼痛點

訂閱 AI 趨勢週報

方法怎麼做

論文實際證明了什麼

這對開發者有什麼影響

限制與還沒回答的問題

結論

CRDT 讓副本不用鎖也能同步

後決定性分散系：自治基礎設施新框架

用因果法量化任務可學性

RL 先接管再放手

OmniGameArena 讓 VLM 遊戲代理更好比

TurboQuant 在 Google 測試中省下 6x KV 快取