← 術語表

Transformer

模型

定義

2017 年「Attention Is All You Need」論文提出的神經網路架構,取代 recurrent networks 處理序列建模。它完全基於 self-attention 與 feed-forward layers,是幾乎所有現代 LLM 的基礎。