標籤
階層式規劃把長時序任務拆成多層決策,常見於世界模型、機器人控制與多模態代理。重點在降低搜尋成本、提升穩定性,並讓模型在複雜環境中更容易做出一致的長期行動。
2 篇文章
MM-WebAgent 用分層規劃與自我反思,讓多模態網頁生成不再像拼貼。它也提出新 benchmark 與多層評估方式,但摘要未公開完整數字。
這篇論文用多時間尺度的潛在世界模型做階層式規劃,目標是讓長時序控制更穩、搜尋成本更低,還能做真實機器人的 zero-shot 控制。