離線 Agent?Windows Aion 1.0 14B 本地雙模型降低 Token 焦慮
智慧代理帳單跟著 Webhook 一起漲?微軟在 Build 2026 的答案很直白:把小模型放到裝置上。在Build 2026上,微軟發布了 Aion 1.0——面向 Windows 11 的兩款端側小語言模型(SLM):Aion 1.0 Instruct(日常文字智慧,現已預覽)與 Aion 1.0 Plan(140 億參數、推理與工具呼叫、32K 上下文,未來數月隨符合條件的裝置內建交付——今天並非 GA)。
這不是「永遠零雲端」。而是對明確層級提供不按 Token 計費的智慧:Instruct 負責摘要、改寫與意圖識別;Plan 在硬體達標時負責本機智慧代理迴圈(工具、檔案、子代理)。對跑多代理編排的獨立開發者來說,雙模型分工很像成熟架構:輕量 SLM 路由,較重模型規劃——不必每一跳都打到前沿 API。
第三方對技術棧的梳理(Windows Agent Framework + DirectML + Aion Plan)見 BuildFastWithAI 2026 年 6 月 3 日 Build 彙總。Edge 預覽步驟以微軟 Edge 端側 AI 部落格為準。
與 Mac 側對比:租用 M4 跑 OpenClaw + Ollama仍是 macOS 閘道路線;若保留雲端回退,請配合限流與預算告警。NVIDIA RTX Spark是 Windows 上 128GB 統一記憶體硬體故事——與 Aion 系統內建 SLM 不是同一條賽道。若交付物必須 macOS,KvmZone 在東京節點也提供 Apple Silicon Mac mini 租用,供 Xcode 與 macOS 版 OpenClaw 使用。
揭露:KvmZone 出租 Apple Silicon Mac mini,用於僅能在 macOS 完成的棧(Xcode、macOS 版 OpenClaw)。本文講 Windows 上的 Aion 1.0;當你的交付物必須 macOS 時,租用 Mac 才有意義,不是因為 Aion 能在 Mac 上跑。
Aion 1.0 Instruct 與 Plan 分別是什麼
| 模型 | 角色(微軟表述) | 可用性(2026 年 6 月) | 硬體暗示 |
|---|---|---|---|
| Aion 1.0 Instruct | 摘要、改寫、意圖、無障礙;Edge + Windows AI API | Edge Insider 預覽;2026 年 7 月 Hugging Face 開放權重 | 支援 CPU 推理——不限 Copilot+ NPU 機型 |
| Aion 1.0 Plan | 推理、工具呼叫、檔案與子代理編排 | 未來數月內建——Build 時尚未 GA | 14B 級——需 GPU/NPU 餘量 |
微軟將 Plan 定位為本機「理解使用者意圖、呼叫工具、管理檔案並編排子代理」——這是代理執行階段的動詞,不是聊天泡泡。
架構:本機代理棧中的雙 SLM
使用者意圖 → 應用 / Windows Agent Framework → Aion 1.0 Instruct(快路由、分類、摘要)
↘ Aion 1.0 Plan(14B,32K)→ 工具呼叫 → 本機檔案 / API → 迴圈
何時呼叫哪個模型
| 代理迴圈步驟 | 模型 | 原因 |
|---|---|---|
| 意圖識別、槽位填充 | Instruct | 低延遲、CPU 友善 |
| 多步規劃 + 工具 JSON | Plan(GA 後) | 推理 + 工具呼叫 |
| 面向使用者的最終潤色 | Instruct 或雲端前沿 | 品質與成本權衡 |
維運要點:記錄每一跳由哪個模型服務——財務會追問 Token 下降是因為 Instruct,還是因為代理完全不再呼叫 GPT。
決策矩陣:Aion 本機 vs 雲端 vs Mac mini
| 若你需要… | 傾向 Windows Aion | 傾向雲端 API | 傾向 Mac mini(買/租) |
|---|---|---|---|
| 路由類任務零按 Token 計費 | Instruct 預覽 | 否 | M4 上 Ollama 回環 |
| 離線代理工具迴圈(未來) | 內建 Plan 後 | 否 | OpenClaw + 本機模型(16GB 現實多為 7B–8B) |
| Xcode / TestFlight | 否 | 否 | 是 |
| 本機 14B + 32K 上下文 | Plan 出貨後 | 按 Token 付費 | 16GB Mac 很難——通常雲端或更小本機模型 |
| 今天就能試、不換硬體 | Edge Canary + Instruct | 是 | 若棧在 macOS,可租 16GB Mac(含東京節點) |
建議路徑:
- 主力 Windows、厭惡 API 表:現在開 Instruct;按 Plan 還要等數月來設計代理,別按分鐘倒數。
- 今天用 macOS OpenClaw:繼續Ollama 耦合;把 Aion 當作 Windows 定價壓力,而非自動會有 Mac 版。
- 雙系統都要:混合——Windows 桌面试 Aion,租用 Mac 做簽名與 macOS CI,見M4 自建 GitHub Actions。
情境 A:獨立開發者削減雲端 Token
你跑代理工作流(爬蟲、摘要、定時「數位員工」),每月在前沿 API 上花 NT$2,500–NT$6,000(約 $80–$200)做 7B 級就能幹的雜活。
現在可做:
- 把摘要/意圖遷到 Instruct(預覽)。
- 前沿模型只留給晉級關卡——與獨立開發微應用批處理同一紀律。
- API 月費與電費記在同一張表——Plan 出貨前,路由類任務目標 ≥40% 降幅。
避免:在尚無能本機可接受延遲跑 14B 的硬體前,就宣稱 Plan 已省錢。
情境 B:安全敏感的離線開發
你要對專有提示詞做100% 本機推理——合規、氣隙實驗室,或「資料不出本機」。
做法:
- 用 Instruct 預覽 Edge 內嵌能力(仍要確認應用程式碼沒有意外雲端回退)。
- 為 Plan GA 規劃架構:磁碟加密、本機工具沙箱、禁止聊天直接開任意 Shell。
- 與專用機自託管 Ollama 對比——Aion 勝在系統整合;Ollama 勝在今天就能用且跨平台。
台灣開發者:離線解決不了 npm/鏡像源;不少人用東京或新加坡建置機拉套件、推理仍本機——入門租用約 NT$3,000/月,對比 24/7 開第二台 Windows PC。
六步手冊:今天在 Edge 試 Aion 1.0 Instruct
微軟透過 Edge Insider 文件化預覽(見Edge 端側 AI 部落格)。
步驟 1 — 安裝 Edge Canary 或 Dev
使用 150.0.4070 或更高版本(社群指南對微軟預覽的歸納)。
步驟 2 — 開啟端側模型 Flag
- 開啟
edge://flags - 搜尋 Enable prerelease on-device language model
- 設為 Enabled → 重新啟動 Edge
步驟 3 — 確認模型下載
- 開啟
edge://on-device-internals - Model Status → 應顯示 Aion-1.0-Instruct(或等效預覽名)
- 首次使用觸發下載——基準測試前等完成
步驟 4 — 用 Prompt / Writing Assistance API 冒煙
使用微軟 Edge AI 文件中的 Prompt API、Writing Assistance 範例。
通過標準:目標筆電 CPU 上,200 token 摘要延遲 <2 秒。
步驟 5 — 與雲端路由器對照基線
| 指標 | 雲端 | Aion Instruct 本機 |
|---|---|---|
| p50 延遲 | ||
| 每 1K 次呼叫成本 | NT$/$ | 邊際 $0 |
| 品質(1–5 分) |
步驟 6 — 接代理路由樁
if task_class in ["summarize", "intent", "rewrite"]:
call_windows_instruct_api()
else:
call_cloud_or_wait_for_plan_ga()
在 Plan GA 前,用功能開關提交該樁。
故障排查
已開 Flag 但模型名仍是 Phi / 為空
現象:edge://on-device-internals 看不到 Aion。
處理:
- 確認是 Canary 渠道,不是穩定版 Edge。
- 硬重啟 Edge;若內部頁提供,清除端側模型快取。
- 核對 Windows 11 版本滿足 Insider 要求。
「本地化」後雲端仍在扣費
現象:Token 儀表板無變化。
處理:
- 在程式碼庫 grep 錯誤時回退
openai.com/anthropic.com。 - 僅 Instruct 級任務走本機——規劃在 Plan 出貨前可能仍打雲端。
- 對剩餘雲端通道加預算告警。
常見問題
今天能離線跑 Aion 1.0 Plan 嗎?
14B Plan 需要多強的「合格裝置」?
Aion 會取代 Mac 上的 OpenClaw 嗎?
2026 年 7 月 Instruct 開放權重有何意義?
這與雲端 Copilot 是一回事嗎?
延伸閱讀
可選:macOS 副機
Aion 在 Windows 上運行。若仍需 Xcode、TestFlight 或 macOS 版 OpenClaw,可對比各地區 Mac mini 月租——非 Edge Instruct 預覽所必需。