AI 自動化

Aion 1.0:Windows ローカル Instruct/Plan SLM 2026

Microsoft Aion 1.0 Windows ローカル 14B Plan エージェント SLM クラウド API コスト比較 2026

エージェントの請求が Webhook と一緒に増えている?Build 2026 で Microsoft の答えは明快:小モデルをデバイス上に置く。Build 2026で Microsoft は Aion 1.0 を発表——Windows 11 向けの 2 つのオンデバイス SLM(小規模言語モデル):Aion 1.0 Instruct(日常テキスト処理、プレビュー提供中)と Aion 1.0 Plan140 億パラメータ、推論・ツール呼び出し、32K コンテキスト、今後数か月で対象デバイスにプリインストール——本日 GA ではない)。

これは「永遠にクラウドゼロ」ではない。明確な階層に対してトークン課金なしの知能を提供する:Instruct は要約・書き換え・意図認識;Plan はハードウェアが条件を満たせばローカルエージェントループ(ツール、ファイル、サブエージェント)を担当。マルチエージェント編成を回す個人開発者にとって、2 モデル分担は成熟アーキテクチャに似ている——軽量 SLM がルーティング、重いモデルが計画——すべてのホップで最先端 API を叩く必要はない。

技術スタックの第三者整理(Windows Agent Framework + DirectML + Aion Plan)は BuildFastWithAI 2026年6月3日 Build まとめ。Edge プレビュー手順は Microsoft Edge オンデバイス AI ブログが正。

Mac 側との比較:M4 レンタルで OpenClaw + Ollamaは引き続き macOS ゲートウェイルート;クラウドフォールバックを残すならレート制限と予算アラートと併用。NVIDIA RTX Sparkは Windows 上の 128GB 統一メモリハードウェアストーリー——Aion のシステム組み込み SLM とは別レーン。macOS 必須の成果物なら、KvmZone の東京ノードでも Apple Silicon Mac mini をレンタル可能(Xcode、macOS 版 OpenClaw 向け)。

開示:KvmZone は macOS 専用スタック(Xcode、macOS 版 OpenClaw)向けに Apple Silicon Mac mini を貸し出している。本文は Windows 上の Aion 1.0 について;成果物が macOS 必須のときだけ Mac レンタルに意味がある。Aion が Mac で動くからではない。

引用可能な結論:Instruct は今日 Edge Canary で試せる;Plan はロードマップ——今日の午後に 14B エージェントをワンクリックでオフライン実行できるわけではない。

Aion 1.0 Instruct と Plan とは

モデル役割(Microsoft 表現)可用性(2026年6月)ハードウェア示唆
Aion 1.0 Instruct要約、書き換え、意図、アクセシビリティ;Edge + Windows AI APIEdge Insider プレビュー2026年7月 Hugging Face オープンウェイトCPU 推論対応——Copilot+ NPU 機種に限定しない
Aion 1.0 Plan推論、ツール呼び出し、ファイル・サブエージェント編成今後数か月プリインストール——Build 時点では GA ではない14B クラス——GPU/NPU 余裕が必要

Microsoft は Plan をローカルで「ユーザー意図を理解し、ツールを呼び、ファイルを管理し、サブエージェントを編成する」と位置づける——これはエージェントランタイムの動詞であり、チャットバブルではない。

アーキテクチャ:ローカルエージェントスタック内の双 SLM

ユーザー意図 → アプリ / Windows Agent Framework → Aion 1.0 Instruct(高速ルート、分類、要約)
                              ↘ Aion 1.0 Plan(14B、32K)→ ツール呼び出し → ローカルファイル / API → ループ

どのモデルをいつ呼ぶか

エージェントループ段階モデル理由
意図認識、スロット埋めInstruct低遅延、CPU フレンドリー
多段計画 + ツール JSONPlan(GA 後)推論 + ツール呼び出し
ユーザー向け最終仕上げInstruct またはクラウド最先端品質とコストのトレードオフ

運用ポイント:各ホップをどのモデルが処理したか記録——財務は Token 減少が Instruct のせいか、エージェントが GPT を完全に呼ばなくなったからかを問う。

意思決定マトリクス:Aion ローカル vs クラウド vs Mac mini

必要なもの…Windows Aion 寄りクラウド API 寄りMac mini(購入/レンタル)寄り
ルーティング系タスクのトークン課金ゼロInstruct プレビューいいえM4 上 Ollama ループバック
オフラインエージェントツールループ(将来)組み込み PlanいいえOpenClaw + ローカルモデル(16GB 現実は 7B–8B)
Xcode / TestFlightいいえいいえはい
ローカル 14B + 32K コンテキストPlan 出荷後トークン課金16GB Mac は困難——通常クラウドかより小さいローカルモデル
今日試せてハードウェア交換不要Edge Canary + Instructはいスタックが macOS なら 16GB Mac をレンタル(東京ノード含む)

推奨パス:

  • Windows メイン、API 表が嫌:Instruct を開始;Plan は数か月待ちでエージェント設計、分単位のカウントダウンは不要。
  • 今日 macOS OpenClaw 使用中:Ollama 連携を継続;Aion は Windows 価格圧力として見る——Mac 版が自動で来るわけではない。
  • 両 OS 必要:ハイブリッド——Windows デスクで Aion を試し、Mac をレンタルして署名と macOS CI、M4 自前 GitHub Actions参照。

シナリオ A:個人開発者がクラウド Token を削減

エージェントワークフロー(クローラー、要約、定時「デジタル従業員」)を回し、7B 級で十分な雑務に毎月最先端 API で ¥12,000–¥28,000(約 $80–$200)使っている。

今できること:

  1. 要約/意図を Instruct(プレビュー)へ移行。
  2. 最先端モデルは昇格ステージのみ——個人開発マイクロアプリバッチ処理と同じ規律。
  3. API 月額と電気代を同じ表に記録——Plan 出荷前、ルーティング系タスク目標 ≥40% 削減。

避けること:ローカルで許容可能な遅延で 14B を回せるハードウェアがないうちに Plan で既に節約したと主張すること。

シナリオ B:セキュリティ重視のオフライン開発

独自プロンプトで100% ローカル推論が必要——コンプライアンス、エアギャップラボ、または「データが端末を出ない」。

アプローチ:

  1. Instruct プレビューで Edge 組み込み能力を使用(アプリコードに意図しないクラウドフォールバックがないか確認)。
  2. Plan GA 向けアーキテクチャ計画:ディスク暗号化、ローカルツールサンドボックス、チャットから任意 Shell を直接開かない。
  3. 専用機の自己ホスト Ollama と比較——Aion はシステム統合で勝つ;Ollama は今日使えることとクロスプラットフォームで勝つ。

日本の開発者:オフラインは npm/ミラー問題を解決しない;東京やシンガポールのビルドマシンでパッケージ取得、推論はローカル——入門レンタル約 ¥15,000/月、24/7 で第 2 台 Windows PC を回すより。

6 ステップ手順:今日 Edge で Aion 1.0 Instruct を試す

Microsoft は Edge Insider 経由でプレビューを文書化(Edge オンデバイス AI ブログ参照)。

ステップ 1 — Edge Canary または Dev をインストール

150.0.4070 以降を使用(コミュニティガイドによる Microsoft プレビューの整理)。

ステップ 2 — オンデバイスモデル Flag を有効化

  1. edge://flags を開く
  2. Enable prerelease on-device language model を検索
  3. Enabled に設定 → Edge を再起動

ステップ 3 — モデルダウンロードを確認

  1. edge://on-device-internals を開く
  2. Model StatusAion-1.0-Instruct(または同等プレビュー名)が表示されるはず
  3. 初回使用でダウンロード開始——ベンチマーク前に完了を待つ

ステップ 4 — Prompt / Writing Assistance API でスモークテスト

Microsoft Edge AI ドキュメントの Prompt API、Writing Assistance サンプルを使用。

合格基準:対象ノート PC CPU で 200 token 要約の遅延 <2 秒

ステップ 5 — クラウドルーターとベースライン比較

指標クラウドAion Instruct ローカル
p50 遅延
1K 回呼び出しあたりコスト¥/$限界 $0
品質(1–5 点)

ステップ 6 — エージェントルーティングスタブを接続

if task_class in ["summarize", "intent", "rewrite"]:
  call_windows_instruct_api()
else:
  call_cloud_or_wait_for_plan_ga()

Plan GA 前に、このスタブを機能フラグでコミット。

トラブルシューティング

Flag 有効だがモデル名が Phi / 空のまま

現象:edge://on-device-internals に Aion が見えない。

対処:

  1. 安定版 Edge ではなく Canary チャネルであることを確認。
  2. Edge をハード再起動;内部ページにあればオンデバイスモデルキャッシュをクリア。
  3. Windows 11 バージョンが Insider 要件を満たすか確認。

「ローカル化」後もクラウド課金が続く

現象:Token ダッシュボードに変化なし。

対処:

  1. コードベースでエラー時フォールバック openai.com / anthropic.com を grep。
  2. Instruct 級タスクのみローカル——計画は Plan 出荷前クラウドの可能性。
  3. 残りのクラウド経路に予算アラートを追加。

よくある質問

今日 Aion 1.0 Plan をオフラインで実行できる?
Microsoft は Plan今後数か月で対象デバイスにプリインストールされると述べる——Build 発表時点では全面 GA ではない。Plan はアーキテクチャ計画として扱い、本番依存にしないこと。
14B Plan に必要な「対象デバイス」のスペックは?
見出し記事に統一 RAM/VRAM 表はない——専用 GPU または強力 NPUクラスのハードウェアが想定される。プレビューバイナリ公開後、自社 SKU で検証。
Aion は Mac 上の OpenClaw を置き換える?
いいえ。macOS 上 OpenClaw は独立スタック。Windows エージェントは Windows AI API + Aion;Mac エージェントはOllama/OpenClawを継続——Microsoft がツールチェーンを移植しない限り。
2026年7月 Instruct オープンウェイトの意味は?
Edge 外で Instruct をファインチューン・自己ホスト可能、他 SLM と同様——カスタム意図ルーティングでトークン課金なし。
これはクラウド Copilot と同じ?
いいえ。Aion SLM はオンデバイスコンポーネント;Copilot の最先端タスクは依然クラウドの可能性。アプリコードパスでラベルを確認すること。

任意:macOS サイドカー

Aion は Windows 上で動作します。Xcode・TestFlight・macOS 版 OpenClaw が必要な場合のみ、各地域の Mac mini 月額を比較してください(Edge Instruct プレビューには不要)。