Локальный Ollama без облака — всё равно limits?

Да — ограничьте tools и веб-поиск; loopback не останавливает платные fallback, если настроены.

Автоматизация ИИ 27 мая 2026

2026 Лимиты OpenClaw и бюджетные алерты на арендованном Mac mini M4 16 ГБ: 50 RPM, потолок $10/день, матрица reject/queue, CLI limits, runbook из 8 шагов и smoke из 12 шагов

Q: dailyCostLimit — жёсткая блокировка на каждой версии OpenClaw?

Жёсткий предохранитель только если сборка документирует жёсткую блокировку для полей стоимости; проверьте staging-burst перед продом.

Q: Пилотным хостам — queue или reject?

Reject для любой аренды с webhook; queue только для пилотов DM с людьми и messages.queue.cap.

Q: Это заменяет статьи про бюджет диска?

Нет — runbook диска про APFS; эта статья про расходы API.

Редакция KvmZone · 27 мая 2026 · ~19 мин чтения

Лимиты OpenClaw и бюджетные алерты на арендованном Mac mini M4 16 ГБ

OpenClaw на арендованном Mac mini M4 — это не «бесплатно после установки». Неверно настроенный cron, шторм webhook или цикл skills могут сжечь frontier-токены, пока вы спите. Финансам не нужна ещё одна панель — им нужны жёсткие предохранители (rate limits, которые отклоняют или ставят в очередь) и бюджетные алерты до закрытия счёта. Этот туториал — операторский контракт для хоста KvmZone 16 ГБ: три слоя контроля, матрица решений reject vs queue vs warn, нумерованный runbook с реальными путями (~/.openclaw/openclaw.json), разбор двух сбоев, которые команды видят на практике, и 12-шаговая smoke-лестница для тикета.

С первого упоминания свяжите контракт установки OpenClaw «нулевой час» (порог Node 22+), матрицу doctor после онбординга (дисциплина webhook POP), runbook launchd в steady-state (ротация логов) и гигиену клиента Gemini API, когда облачные модели остаются в цепочке fallback. Допущения по железу — спецификации Mac mini Apple. Сравните регионы на странице цен.

Раскрытие: KvmZone — провайдер аренды Mac, упомянутый в статье. Семантика лимитов OpenClaw следует примерам конфигурации шлюза OpenClaw и community-подсистеме limits / rate-limit; перед продом проверьте установленную версию OpenClaw.

Зачем лимиты и бюджетные алерты на арендованном хосте

Команды арендуют Mac mini M4 с 16 ГБ unified memory, потому что шлюзы OpenClaw, каталоги skills и приёмники webhook работают постоянно — а не чтобы ноутбуки не спали с API-ключами. Уход затрат вверх — проблема шлюза, а не «купить больше RAM»: лимиты нужно применять до dispatch модели, а не после того, как финансы откроют портал вендора.

Стейкхолдер	Без жёстких предохранителей	С предохранителями + алертами
Инженерия	Штормы retry 429 выглядят как «OpenClaw нестабилен»	Лимиты → структурированные события; в логах `onLimitReached`
Финансы	Неожиданные строки API $200+/день	Дневной потолок $10 (пример) отклоняет или ставит в очередь до полуночи
Безопасность	Скомпрометированный webhook заливает токены	RPM по каналам душат злоупотребление

Правило для цитирования: rate limit — формирование трафика; бюджетный алерт — управление расходами — родственные контроли, не дубликаты.

Архитектура: три слоя контроля на одном шлюзе

Контроль затрат OpenClaw складывается в три слоя. Зафиксируйте, какие слои включены на вашей аренде — версии upstream различаются.

Слой 1 — `rateLimit` шлюза (жёсткий предохранитель на краю)

В туториалах сообщества описан блок rateLimit в ~/.openclaw/openclaw.json (JSON5). Типичные поля:

Поле	Пример	Поведение
`enabled`	`true`	Opt-in; лимиты выкл. до включения
`model.rpm`	50	Запросов/минуту на маршрут модели
`model.tpm`	100000	Потолок токенов/минуту
`model.dailyLimit`	2000	Жёсткий дневной счётчик запросов
`model.dailyCostLimit`	10.00	Дневной потолок USD (строка/число по сборке)
`model.onLimitReached`	reject или queue	Жёсткий предохранитель vs backlog

Жёсткий предохранитель — onLimitReached: "reject": шлюз сразу возвращает ошибку; skills не должны крутить retry без backoff.

Мягкий предохранитель — onLimitReached: "queue": сообщения ждут; безопаснее для человеческого чата, опасно для штормов webhook без messages.queue.cap (см. примеры шлюза).

Слой 2 — CLI `limits` / бюджеты токенов (по провайдеру)

Upstream добавил поверхность limits и команды openclaw limits (см. PR #13686): скользящие окна, дневные/месячные бюджеты по токенам, структурированные логи. Этот слой оборачивает внешние вызовы провайдеров — дополняет rateLimit шлюза.

Команды для runbook:

openclaw limits status

openclaw limits reset --provider anthropic --model claude-sonnet-4-6

Прикрепляйте вывод в тикет, когда финансы просят «доказать срабатывание предохранителя».

Слой 3 — Бюджетные алерты (наблюдаемость → действие)

Жёсткие USD-блоки per-agent на шлюзе ещё развиваются в upstream; пока сборка их не включает, операторы делают бюджетные сигналы так:

Cron + scrape стоимости сессий — job по расписанию читает сводки и шлёт в Slack/email при 80 % дневного потолка.
Ключи бюджета прокси — маршрутизация провайдеров через прокси с виртуальными ключами и жёсткими потолками.
openclaw doctor + еженедельный аудит — с runbook steady-state, чтобы алерты не гнили.

Правило для цитирования: Алерты без reject — предупреждения; жёсткий предохранитель требует onLimitReached: "reject" или блок limits upstream с жёсткой блокировкой.

Матрица решений: reject, queue, warn

Профиль	RPM	Дневной $ потолок	onLimitReached	Канал алерта	Когда использовать
Прод webhook	30	$5	reject	Pager + email при 80 %	CI-боты; нельзя вечная очередь
Внутренний DM-ассистент	50	$10	queue	Slack при 90 %	Люди терпят задержку
Пилот / staging	15	$2	reject	Только email	Одноразовая неделя аренды
Локальный Ollama fallback	N/A (loopback)	$0 облако	N/A	Только алерты диска	С связкой OpenClaw + Ollama

Рекомендуемый путь: Если webhook касается хоста — строка Прод webhook. Только DM — Внутренний DM-ассистент. Не запускайте queue на одном хосте 16 ГБ без messages.queue.cap и ротации логов — работа в очереди всё равно ест RAM.

Пошаговый runbook: жёсткие предохранители и алерты

Выполняйте по SSH на арендованном Mac. Суммы в долларах — на согласованные финансами потолки.

Шаг 1 — Снимок базового использования

ssh user@rented-mac 'openclaw limits status 2>/dev/null || openclaw doctor'

ssh user@rented-mac 'df -h / && du -sh ~/.openclaw 2>/dev/null'

Сохраните вывод как вложение A в тикет изменения.

Шаг 2 — Резервная копия конфига

ssh user@rented-mac 'cp ~/.openclaw/openclaw.json ~/.openclaw/openclaw.json.bak.$(date +%Y%m%d)'

Шаг 3 — Включить rateLimit шлюза (пример жёсткого предохранителя)

Отредактируйте ~/.openclaw/openclaw.json (JSON5). Добавьте или слейте:

{ rateLimit: { enabled: true, model: { rpm: 50, tpm: 100000, dailyLimit: 2000, dailyCostLimit: 10.00, onLimitReached: "reject", // hard fuse for webhook hosts }, }, messages: { queue: { mode: "followup", cap: 20, drop: "summarize" }, }, }

Перезагрузите шлюз по runbook (launchctl kickstart или документированный reload — см. статью steady-state).

Шаг 4 — Ужесточить параллелизм per-agent

В том же файле под agents.defaults:

agents: { defaults: { maxConcurrent: 2, // 16GB: avoid 3+ concurrent tool-heavy runs timeoutSeconds: 600, }, },

Шаг 5 — Включить подсистему limits (если сборка поддерживает)

Добавьте блок limits upstream по доке openclaw limits вашей версии — дневной бюджет токенов с жёсткой блокировкой. Запустите:

openclaw limits status

После тестового сообщения счётчики должны быть ненулевыми.

Шаг 6 — Запланировать cron бюджетного алерта

Создайте ~/budget-alert.sh:

#!/bin/bash THRESHOLD_USD=8.00 # Replace with your cost scrape command / log grep for your OpenClaw version COST=$(openclaw limits status 2>/dev/null | awk '/dailyCost/{print $2}') if awk -v c="$COST" -v t="$THRESHOLD_USD" 'BEGIN{exit !(c>t)}'; then echo "OpenClaw spend $COST exceeds warn threshold $THRESHOLD_USD on $(hostname)" | mail -s "OpenClaw budget warn" ops@example.com fi

chmod 700 ~/budget-alert.sh

# launchd or crontab: every 30 minutes

Задокументируйте назначение алерта в runbook — почтовый ящик у финансов.

Шаг 7 — Доказать срабатывание предохранителя

Отправьте синтетический burst (только staging-канал), пока не сработает onLimitReached. Подтвердите:

В логах шлюза есть событие лимита (не тихий сбой)
openclaw limits status показывает увеличенные счётчики
Нет бесконечного retry в логах

Шаг 8 — Заархивировать доказательства

Вложения: diff конфига, limits status после теста, выдержка лога с событием лимита, ID недели счёта.

Устранение неполадок

Шаблон: `429` / `rate_limited` при растущих расходах

Симптомы: Провайдер отдаёт 429; OpenClaw ретраит; дневная стоимость всё равно растёт.

Исправление:

На шлюзе onLimitReached: "reject" — не queue.
Настройте лимиты ротации auth-профилей (auth.cooldowns.rateLimitedProfileRotations по сборке), чтобы ротация не стала бесконечным fallback-расходом.
openclaw limits reset только после исправления корневой причины, не ежедневной привычкой.

Шаблон: лимиты включены, но «нет эффекта»

Симптомы: rateLimit.enabled: true в файле; трафик без ограничений.

Исправление:

Убедитесь, что reload шлюза реально прошёл (launchctl print показывает новый pid).
Убедитесь, что правили файл, который читает демон (~/.openclaw/openclaw.json, не копия из репо).
Запустите openclaw doctor под тем же пользователем, что launchd — несовпадение PATH грузит неверный конфиг (см. контракт нулевого часа).

Сноска POP шести регионов

Узлы KvmZone: Гонконг, Япония (Токио), Корея (Сеул), Сингапур, US East, US West. Лимиты не заменяют выбор региона — webhook из SaaS US-East в Mac APAC всё равно жгут токены на retry. Выбирайте узел ближе к входу callback по матрице POP после онбординга. Сравните на странице цен.

12-шаговая smoke-лестница

Шаг	Gate	Pass
1	SSH	Неинтерактивная shell
2	Бэкап конфига	Есть `.bak.YYYYMMDD`
3	`rateLimit.enabled`	`true` в live-конфиге
4	Жёсткий предохранитель	`onLimitReached` = reject для webhook-профиля
5	RPM	В runbook задокументировано ≤50
6	Дневной $ потолок	Записана сумма, согласованная финансами
7	`openclaw limits status`	Exit 0; счётчики видны
8	Синтетический burst	Предохранитель сработал; расход остановился
9	Cron алерта	Тест email/Slack на пороге 80 %
10	Логи	Сохранена строка события лимита (ротация 512MB по steady-state)
11	Регион	Имя узла в runbook
12	Финансы	Скриншот + неделя счёта в архиве

FAQ

dailyCostLimit — жёсткая блокировка на каждой версии OpenClaw?+

Считайте жёстким предохранителем только если сборка документирует жёсткую блокировку для полей стоимости. Старые сборки могут быть только observability — проверьте staging-burst перед продом.

Пилотным хостам — queue или reject?+

Reject для любой аренды с webhook. Queue только для пилотов DM с людьми и заданным messages.queue.cap.

Это заменяет статьи про «бюджет диска»?+

Нет. Runbook бюджета диска про APFS; эта статья — про расходы API.

Локальный Ollama без облачных расходов — всё равно настраивать limits?+

Да — ограничьте вызовы tools и веб-поиск; loopback-инференс не останавливает платные fallback, если они настроены.

Microsoft Aion 1.0: локальные Instruct и Plan 14B в Windows — on-device SLM vs Mac Ollama
Runbook launchd OpenClaw steady-state
Doctor после онбординга + webhook POP
Связка OpenClaw + Ollama

Сравните регионы перед настройкой лимитов OpenClaw

Сравните шесть регионов на странице цен; зафиксируйте 50 RPM и $10/день, пройдите 12 шагов smoke до продакшен-webhook.

Смотреть цены Подробнее

Зачем лимиты и бюджетные алерты на арендованном хосте

Архитектура: три слоя контроля на одном шлюзе

Слой 1 — rateLimit шлюза (жёсткий предохранитель на краю)

Слой 2 — CLI limits / бюджеты токенов (по провайдеру)

Слой 3 — Бюджетные алерты (наблюдаемость → действие)

Матрица решений: reject, queue, warn

Пошаговый runbook: жёсткие предохранители и алерты

Шаг 1 — Снимок базового использования

Шаг 2 — Резервная копия конфига

Шаг 3 — Включить rateLimit шлюза (пример жёсткого предохранителя)

Шаг 4 — Ужесточить параллелизм per-agent

Шаг 5 — Включить подсистему limits (если сборка поддерживает)

Шаг 6 — Запланировать cron бюджетного алерта

Шаг 7 — Доказать срабатывание предохранителя

Шаг 8 — Заархивировать доказательства

Устранение неполадок

Шаблон: 429 / rate_limited при растущих расходах

Шаблон: лимиты включены, но «нет эффекта»

Сноска POP шести регионов

12-шаговая smoke-лестница

FAQ

Дополнительно

Сравните регионы перед настройкой лимитов OpenClaw

Слой 1 — `rateLimit` шлюза (жёсткий предохранитель на краю)

Слой 2 — CLI `limits` / бюджеты токенов (по провайдеру)

Шаблон: `429` / `rate_limited` при растущих расходах