Aion 1.0: локальные Instruct и Plan 14B в Windows
Счета за агентов растут вместе с webhook'ами? Ответ Microsoft на Build 2026 прост: перенести малые модели на устройство.На Build 2026 Microsoft представила Aion 1.0 — два on-device SLM (малых языковых модели) для Windows 11: Aion 1.0 Instruct (повседневный текст, превью доступно сегодня) и Aion 1.0 Plan (14 млрд параметров, рассуждение и вызов инструментов, контекст 32K, в ближайшие месяцы предустановка на подходящих устройствах — сегодня не GA).
Это не «навсегда ноль облака».Это интеллект без оплаты за токены для чётко определённых уровней: Instruct — резюме, переписывание, распознавание намерений; Plan при подходящем железе — локальный цикл агента (инструменты, файлы, субагенты). Для соло-разработчика с мультиагентной оркестрацией разделение на две модели похоже на зрелую архитектуру: лёгкий SLM маршрутизирует, тяжелее модель планирует — не каждый hop должен бить frontier API.
Разбор стека третьей стороной (Windows Agent Framework + DirectML + Aion Plan): BuildFastWithAI, 3 июня 2026. Шаги Edge-превью — по блогу Edge on-device AI Microsoft.
Сравнение с Mac:аренда M4 для OpenClaw + Ollama остаётся маршрутом macOS; при облачном fallback используйте лимиты и бюджетные алерты. NVIDIA RTX Spark — история про 128 GB unified memory под Windows — другая дорожка, чем системно встроенные SLM Aion.
Раскрытие:KvmZone сдаёт Apple Silicon Mac mini для стеков, доступных только на macOS (Xcode, OpenClaw для macOS). Статья про Aion 1.0 на Windows; аренда Mac имеет смысл, если deliverable требует macOS, а не потому что Aion работает на Mac.
Aion 1.0 Instruct vs Plan: что это
| Модель | Роль (Microsoft) | Доступность (июнь 2026) | Аппаратный намёк |
|---|---|---|---|
| Aion 1.0 Instruct | Резюме, переписывание, intent, доступность; Edge + Windows AI API | Превью Edge Insider; open weights на Hugging Face в июле 2026 | Инференс на CPU — не только Copilot+ NPU |
| Aion 1.0 Plan | Рассуждение, вызов инструментов, оркестрация файлов и субагентов | Ближайшие месяцы предустановка — на Build не GA | Класс 14B — нужен запас GPU/NPU |
Microsoft позиционирует Plan локально как «понимать намерение пользователя, вызывать инструменты, управлять файлами и оркестрировать субагентов» — глаголы agent runtime, а не чат-пузырь.
Архитектура: два SLM в локальном agent stack
Намерение пользователя → App / Windows Agent Framework → Aion 1.0 Instruct (быстрый routing, классификация, резюме)
↘ Aion 1.0 Plan (14B, 32K) → вызов инструментов → локальные файлы / API → цикл
Какую модель когда вызывать
| Шаг agent loop | Модель | Причина |
|---|---|---|
| Распознавание intent, slot filling | Instruct | Низкая задержка, CPU-friendly |
| Многошаговое планирование + tool JSON | Plan (после GA) | Reasoning + tool calling |
| Финальная полировка для пользователя | Instruct или cloud frontier | Компромисс качество/стоимость |
Ops:логируйте, какая модель обслуживает каждый hop — финансы спросят, упали ли токены из-за Instruct или потому что агент перестал вызывать GPT.
Матрица решений: Aion локально vs облако vs Mac mini
| Если нужно… | Скорее Windows Aion | Скорее cloud API | Скорее Mac mini (купить/аренда) |
|---|---|---|---|
| Нулевая оплата токенов за routing | Превью Instruct | Нет | Ollama loopback на M4 |
| Offline agent tool loop (будущее) | После встроенного Plan | Нет | OpenClaw + локальная модель (16 GB реально 7B–8B) |
| Xcode / TestFlight | Нет | Нет | Да |
| Локально 14B + контекст 32K | После выхода Plan | Оплата за токены | 16 GB Mac сложно — обычно облако или меньшая локальная модель |
| Попробовать сегодня без смены железа | Edge Canary + Instruct | Да | Если стек macOS — аренда Mac 16 GB |
Рекомендуемые пути:
- Основная Windows, не любите API-таблицы:запустить Instruct сейчас; проектировать агента с учётом Plan через месяцы, без поминутного countdown.
- Уже macOS OpenClaw:продолжать связку Ollama; Aion — ценовое давление Windows, не автоматическая Mac-версия.
- Оба OS:гибрид — Aion на Windows-десктопе, аренда Mac для подписи и macOS CI, см. self-hosted GitHub Actions на M4.
Сценарий A: сократить cloud-токены (solo dev)
Вы крутите agent workflows (краулеры, резюме, запланированные «цифровые сотрудники») и тратите $80–200/мес на frontier API для задач уровня 7B.
Можно сейчас:
- Перенести резюме/intent на Instruct (превью).
- Frontier только для «повышения» — та же дисциплина, что в solo micro-app batch.
- API и электричество в одной таблице — до выхода Plan цель ≥40 % снижения на routing.
Избегать:утверждать, что Plan уже экономит деньги без железа, способного крутить 14B локально с приемлемой задержкой.
Сценарий B: offline-разработка с упором на безопасность
Нужен 100 % локальный inference для проприетарных промптов — compliance, air-gap lab или «данные не покидают машину».
Подход:
- Проверить встроенные возможности Edge через превью Instruct (убедиться, что код приложения не уходит в облако неожиданно).
- Спланировать архитектуру под GA Plan: шифрование диска, sandbox локальных tools, запрет произвольного shell из чата.
- Сравнить с self-hosted Ollama на выделенной машине — Aion выигрывает в системной интеграции; Ollama — доступен сегодня и кроссплатформенен.
Разработчики в EU: offline не решает npm/зеркала; многие берут пакеты с build-машин в Гонконге/Сингапуре, inference локально — входная аренда ~$100/мес vs второй Windows PC 24/7.
6-шаговый runbook: попробовать Aion 1.0 Instruct в Edge сегодня
Microsoft документирует превью через Edge Insider (см. блог Edge on-device AI).
Шаг 1 — Установить Edge Canary или Dev
Версия 150.0.4070 или выше (сводка community по превью Microsoft).
Шаг 2 — Включить flag on-device модели
- Открыть
edge://flags - Найти Enable prerelease on-device language model
- Установить Enabled → перезапустить Edge
Шаг 3 — Подтвердить загрузку модели
- Открыть
edge://on-device-internals - Model Status → должно быть Aion-1.0-Instruct (или эквивалентное имя превью)
- Первое использование запускает загрузку — дождаться перед benchmark
Шаг 4 — Smoke test через Prompt / Writing Assistance API
Примеры Prompt API и Writing Assistance из документации Microsoft Edge AI.
Критерий прохождения:на CPU целевого ноутбука задержка резюме 200 tokens <2 с.
Шаг 5 — Baseline vs cloud router
| Метрика | Облако | Aion Instruct локально |
|---|---|---|
| p50 latency | ||
| Стоимость на 1K вызовов | $ | $0 marginal |
| Качество (1–5) |
Шаг 6 — Подключить stub маршрутизации агента
if task_class in ["summarize", "intent", "rewrite"]:
call_windows_instruct_api()
else:
call_cloud_or_wait_for_plan_ga()
Закоммитить stub за feature flag до GA Plan.
Устранение неполадок
Flag включён, но имя модели Phi / пусто
Симптом:нет Aion в edge://on-device-internals.
Исправление:
- Убедиться в канале Canary, не stable Edge.
- Жёсткий перезапуск Edge; очистить кэш on-device модели, если internal page позволяет.
- Проверить, что Windows 11 соответствует требованиям Insider.
Облачные списания после «локализации»
Симптом:дашборд токенов без изменений.
Исправление:
- Grep в коде fallback на
openai.com/anthropic.comпри ошибках. - Только задачи уровня Instruct локально — планирование может оставаться в облаке до выхода Plan.
- Добавить бюджетные алерты на оставшиеся cloud-пути.
FAQ
Можно ли сегодня offline запустить Aion 1.0 Plan?
Какое «подходящее устройство» для Plan 14B?
Aion заменит OpenClaw на Mac?
Что значат open weights Instruct в июле 2026?
Это то же самое, что cloud Copilot?
Дополнительно
Опционально: macOS sidecar
Aion работает в Windows. Сравнивайте аренду Mac mini по регионам только если нужны Xcode, TestFlight или OpenClaw на macOS — для Edge Instruct preview не обязательно.