AGORA — Книга продукта · E disputatione veritas

Глава I

Что такое AGORA

Одна модель ошибается одинаково и молча. Форум разных моделей спорит — и из спора рождается решение, которое можно проверить, улучшить со временем и предъявить регулятору. AGORA превращает это в инфраструктуру.

Боль	Как закрывает AGORA
Одна LLM — слепые зоны, тихие галлюцинации	Форум разно-модельных персон → структурированное несогласие → синтез
Модель пинится вручную, расходы растут	«Умный роутер»: модель выбирается на лету по классу задачи
«Кто решил и почему?» — нечем ответить	Аудируемый эпистемический след каждого решения (Decision Audit Report)
Модель тихо деградирует	Champion/canary-детектор дрифта + алерты ДО инцидента
Учиться не на чем — исход неясен	Обучение ТОЛЬКО на верифицируемых исходах (тест прошёл / PR смержен)

Категория важна: AGORA — не «ещё один роутер». Роутинг сам по себе уже коммодити. AGORA — governance-слой: маршрутизирует, учится и отвечает за результат.

Три вещи, которые делает мозг

1 · Роутит

OpenAI-совместимый эндпоинт. Агент (Cline, Claude Code, Hermes) подключается как к обычному провайдеру — а модель меняется на лету.

2 · Учится

На реальных исходах ваших задач, не на популяционных средних. Приватный feedback-датасет, откалиброванный под вас.

3 · Аудирует

Каждое решение — append-only след: кто участвовал, что возразил диссентер, чем кончилось. Артефакт для SOC2 / EU AI Act.

Глава II

Форум: истина из спора

Ядро — не «голосование моделей», а роль-осведомлённый дебат. Каждая персона = СТАНС на РАЗНОМ семействе моделей (некоррелированные ошибки — в этом ценность).

Мотив → персоны спорят (разные семейства) → фасилитатор синтезирует → всё в неизменяемый ledger

Диссентер (skeptic) держит зарезервированное место и оценивается на «ретроспективной правоте», а не на победах — иначе bandit за 30–50 итераций убил бы диверсити. Это принцип P3. Подробнее о персонах — в обзоре AGORA.

P8: синтез форума — это decision-support, не авторизация. Необратимые действия всегда за детерминированными гейтами и явным «да» человека.

Глава III

Умный роутер и обучающийся мозг

Роутер выбирает модель не случайно и не по прайсу, а по тому, кто выигрывает на ВАШЕМ классе задач — и становится точнее с каждым проверенным исходом.

Подключение — OpenAI-совместимый API. POST /v1/chat/completions + GET /v1/models. Ваш агент (Cline, Claude Code, Aider, Hermes) ставит base_url на AGORA и model: "auto" — модель меняется на лету по классу задачи, переподключать ничего не надо. Подробности — Connect.

Контур: выбор → решение → внешний исход → составная награда → обновление постериора (или shadow-лог), плюс drift-надзор

Почему «составная награда», а не «тест прошёл»

Голый tests_passed ломается законом Гудхарта: модель напишет запутанный код, который формально проходит тесты, или сгенерирует тесты сама себе. Поэтому награда — взвешенная, а компонент тестов считается только от внешних тестов репозитория (модель не оценивает свою же домашку):

reward = 0.4·tests_passed + 0.3·pr_merged_no_revision
       + 0.2·(1−review_rounds) + 0.1·token_efficiency

Обучение включается ПО КЛАССАМ, а не сразу

У кодинг-задач истина быстрая (тест за секунды) — на них можно учиться. У AML/KYC истина зреет 30–90 дней; учиться рано = выучить «groupthink-прокси». Поэтому класс переходит из shadow (логируем, не применяем) в live только когда судья откалиброван: κ≥0.7 при N≥50 и есть независимая человеческая оценка. До тех пор мозг честно говорит: «учусь тихо, в бой не включаю».

Это и есть страховка доверия: клиент видит, что система не применяет обучение, пока не уверена — никакого «само себя сломало».

Глава IV

Закрытый контур: доказательства, деньги, безопасность

«Закрытый контур» — это то, что отличает governance от роутера: каждое утверждение проверяемо, каждый доллар учтён, каждая egress-точка под tripwire.

Проверяемые утверждения

Любое заявление можно превратить в тестируемое предсказание и проверить детерминированно (read-only проба, secret-scrubbed). confirmed=false = коробка сама опровергла заявление — это и есть ценный сигнал.

Client-owned audit — как это работает

«Client-owned» — это threat-model: вы можете доказать целостность аудита, даже не доверяя AGORA. Механизм:

Ключ держите ВЫ (Ed25519): подпись вашим ключом, приватный ключ не покидает ваш контур; публичный — отдаёте регулятору, он верифицирует без доверия к нам.
Hash-chain поверх append-only-лога + внешний якорь (дайджест → ваш S3 Object Lock, daily) — вставка/удаление ломает цепочку; якорь мы переписать не можем.
Открытый agora-verify (отдельный репо) — вы проверяете chain + подписи сами.

Честно о статусе: V1 построен — ваш ключ подписи + hash-chain каждого решения роутинга + open-source верификатор: подделка ловится по ВАШЕМУ публичному ключу, без нашего кода. Аудит обучения и regulator-ready пакет — дальше. Плюс compliance-tripwire (PAN/IBAN): AGORA работает только на токенизированных данных, вне CDE.

Деньги

Per-consumer виртуальные ключи с бюджетами (fail-closed: over-budget = отказ, не тихий даунгрейд). Spend атрибутируется по ключу — основа chargeback-биллинга, отдельного от «полиции людей».

Доступ закрыт по умолчанию: внешняя поверхность за per-key auth (enforce). Никакого keyless-доступа к тратящим бюджет эндпоинтам.

Глава V

Цифры, которые мы показываем

AGORA опирается на телеметрию, а не на обещания. Три доказательства — и все из реальных данных вашего контура, видимые в панели мониторинга.

Честно: метрики ниже наполняются вашим трафиком — это механика, которую система измеряет, а не «наши показатели». До первых реальных исходов цифры в примерах иллюстративны. Мы показываем, ЧТО измеряем, а доказательства приходят с вашими данными.

PP1 · Экономия с доказательством

Сколько $ сэкономлено на токенах, с разбивкой по task_class — видна логика (code_gen→GPT-4o, simple_qa→Haiku). Источник: spend per-model + usage_report.

PP2 · Обучение, которое видно

Не веса и лоссы, а история решений во времени:

[Нед 1]  code_review → GPT-4o    tests_passed ✓  но дорого
[Нед 3]  code_review → Sonnet    tests_passed ✓  −40% стоимость   (роутер сам выбрал)
[Нед 8]  confidence(Sonnet, code_review) κ=0.84 → learning update активирован
→ «Система стала умнее за 8 недель. Без единой строки конфига от вас.»

PP3 · Drift как страховка

Сколько дрифт-событий поймано и сколько потенциальных потерь предотвращено. Резонирует с любой командой, у кого был инцидент с молча деградировавшей моделью.

Как показываем обучение — метафора «турнирная таблица моделей»: лига на каждый класс задач, чемпион 👑 сверху, win_rate-бар + «термометр уверенности» («ещё N оценок до промоушна»). Никаких сырых кривых — читается за 3 секунды.

Глава VI

Бизнес: позиционирование, моат, GTM

Главный принцип: не конкурировать на «дешевле токены» (это коммодити — RouteLLM OSS, Bedrock нативно). Конкурировать на «кто отвечает за то, что ИИ решил, и докажет это».

Моат — три горизонта (честно: что есть / что строится)

Горизонт	Моат	Источник
Сейчас	Архитектурная сложность: роль-осведомлённость × фидбэк-обучение × закрытый контур	6–9 мес конкуренту
6–18 мес	Per-client feedback-data + κ-калибровка	растущий switching cost
18+ мес	Cross-client паттерны + сеть аудит-артефактов	data network effect

Почему RouteLLM и Bedrock структурно не догонят

RouteLLM

Stateless. Без фидбэк-контура, без аудита, без роль-осведомлённости. OSS — нет стимула строить compliance-слой.

Bedrock / Azure

Vendor-lock: хотят вас на СВОИХ моделях. Роутинг через конкурентов — против их бизнеса. Аудит-trail = их данные, не ваши.

Каждый клиент AGORA создаёт приватный feedback-датасет, откалиброванный под свои задачи и роли. Его нельзя передать конкуренту — он живёт в вашем контуре. RouteLLM этого не знает. Bedrock не хочет знать.

Для кого

Команды с ИИ в продакшне, которым важны три вещи разом: контроль расходов, качество решений и аудируемость — финтех и регулируемые отрасли, AI-heavy продукты, компании с несколькими командами на разных моделях.

Как команды внедряют AGORA

Путь — от наблюдения к управлению, без риска на входе:

Тихая установка для наблюдения. Шлюз в вашем контуре только смотрит и считает — собирает картину расходов и решений за пару недель. Вы видите СВОИ цифры на реальных данных.
Адаптивный роутинг. Включаем выбор модели на лету и обучение на ваших исходах — экономия становится измеримой, а не обещанной.
Полный governance. Делиберация + аудит + SLA для команд, где цена ошибки высока.

Принцип: вы сначала видите цифру на своих данных, и только потом принимаете решение. Никаких обещаний вслепую.

Рынок уже движется сюда (проверенные данные индустрии)

Факт	Цифра	Источник
Управление AI-расходами стало нормой	31% → 63% → 98% (2024→2025→2026)	FinOps Foundation, State of FinOps 2026
«FinOps for AI» — приоритет №1 наперёд	33% респондентов	FinOps 2026
Инструмент №1, которого нет на рынке	гранулярный мониторинг AI-расходов (токены/LLM/GPU)	FinOps 2026
Регуляторный драйвер аудита	EU AI Act (high-risk) — 2 авг 2026 · DORA — с 17.01.2025	artificialintelligenceact.eu

Глава VII

Ландшафт: где мы и где они

Роутинг — коммодити, это правда. Но «учиться на ВАШИХ верифицируемых исходах + аудит, принадлежащий клиенту + роль-делиберация» не делает никто. Это проверено по живым продуктам, не на словах.

Игрок	Роутит	Учится на ваших исходах	Client-owned аудит	Роль-делиберация	Self-host
RouteLLM (OSS)	да (binary)	нет (preference-data)	—	нет	да
LiteLLM	да (правила)	нет	req/resp логи	нет	да
OpenRouter	да (Auto)	нет	usage	нет	нет (SaaS)
Bedrock IPR	только within-family	нет (docs: «can't»)	platform-only	нет	нет
Azure Model Router	cross-vendor (в Azure)	нет (pre-trained)	Azure Policy	нет	нет
Portkey / Helicone	да (config-правила)	нет	RBAC/SOC2	нет	да
Credal / Langfuse	—/мульти	нет	сильный (SOC2 II)	нет	да
AGORA	✓	✓ closed-loop	✓ client-owned	✓	✓

Две главные угрозы — и где они слабы

Azure Model Router

Самый кредибельный: единственный cloud, реально cross-vendor + обученный. Слаб: pre-trained и статичен — не учится на ВАШИХ исходах, cloud-locked, нет роль-делиберации, нет client-owned ledger.

Bedrock IPR

Слаб вербатим из AWS-доков: маршрутизирует «within the same model family» (нет cross-competitor), «can't adjust routing based on application-specific performance data», English-only, нет self-host.

Рынок раскалывается надвое: cloud-роутеры (vendor-lock + статичны + без суверенитета) и self-host gateway/governance (роутят по правилам, аудируют, но не учатся). Пересечение AGORA — learning-loop на верифицируемых исходах × self-host × роль × client-audit — пусто. Единственный аналог outcome-роутинга — академический Router-R1 (NeurIPS 2025), не продукт.

* «client-owned аудит»: V1 построен — ваш ключ + RDR hash-chain + open-source верификатор (подделка ловится по публичному ключу); learning-audit + regulator-pack — дальше. Механизм — глава IV.