← 術語表

Tokenizer

工具

定義

把原始文字轉換成模型可處理 token ID 的元件。現代 LLM 多使用 BPE 或類似 subword 演算法;token 數會影響成本,也決定能否放進 context window。