Книга продукта

AGORA

E disputatione veritas — истина рождается из спора
AI Governance Infrastructure

Self-hosted слой, который роутит запросы к моделям по классу задачи, учится на верифицируемых исходах и аудирует каждое решение — чтобы инженеры выпускали быстрее, а CFO не боялся неконтролируемых расходов на ИИ.

✶ ✶ ✶
Глава I

Что такое AGORA

Одна модель ошибается одинаково и молча. Форум разных моделей спорит — и из спора рождается решение, которое можно проверить, улучшить со временем и предъявить регулятору. AGORA превращает это в инфраструктуру.

БольКак закрывает AGORA
Одна LLM — слепые зоны, тихие галлюцинацииФорум разно-модельных персон → структурированное несогласие → синтез
Модель пинится вручную, расходы растут«Умный роутер»: модель выбирается на лету по классу задачи
«Кто решил и почему?» — нечем ответитьАудируемый эпистемический след каждого решения (Decision Audit Report)
Модель тихо деградируетChampion/canary-детектор дрифта + алерты ДО инцидента
Учиться не на чем — исход неясенОбучение ТОЛЬКО на верифицируемых исходах (тест прошёл / PR смержен)
Категория важна: AGORA — не «ещё один роутер». Роутинг сам по себе уже коммодити. AGORA — governance-слой: маршрутизирует, учится и отвечает за результат.

Три вещи, которые делает мозг

1 · Роутит

OpenAI-совместимый эндпоинт. Агент (Cline, Claude Code, Hermes) подключается как к обычному провайдеру — а модель меняется на лету.

2 · Учится

На реальных исходах ваших задач, не на популяционных средних. Приватный feedback-датасет, откалиброванный под вас.

3 · Аудирует

Каждое решение — append-only след: кто участвовал, что возразил диссентер, чем кончилось. Артефакт для SOC2 / EU AI Act.

Глава II

Форум: истина из спора

Ядро — не «голосование моделей», а роль-осведомлённый дебат. Каждая персона = СТАНС на РАЗНОМ семействе моделей (некоррелированные ошибки — в этом ценность).

Тема (motion) task_class Builder · gpt«как сделать» Skeptic · hermesдиссентер (P3) Architect · claude«что это запирает» Синтез facilitator Ledger append-only
Мотив → персоны спорят (разные семейства) → фасилитатор синтезирует → всё в неизменяемый ledger

Диссентер (skeptic) держит зарезервированное место и оценивается на «ретроспективной правоте», а не на победах — иначе bandit за 30–50 итераций убил бы диверсити. Это принцип P3. Подробнее о персонах — в обзоре AGORA.

P8: синтез форума — это decision-support, не авторизация. Необратимые действия всегда за детерминированными гейтами и явным «да» человека.
Глава III

Умный роутер и обучающийся мозг

Роутер выбирает модель не случайно и не по прайсу, а по тому, кто выигрывает на ВАШЕМ классе задач — и становится точнее с каждым проверенным исходом.

Подключение — OpenAI-совместимый API. POST /v1/chat/completions + GET /v1/models. Ваш агент (Cline, Claude Code, Aider, Hermes) ставит base_url на AGORA и model: "auto" — модель меняется на лету по классу задачи, переподключать ничего не надо. Подробности — Connect.
route_selectThompson/Beta модельрешает исходtests/PR (внешние) composite rewardне голый тест shadow / liveper-class, κ≥0.7 drift / canary−15%/7д → alert
Контур: выбор → решение → внешний исход → составная награда → обновление постериора (или shadow-лог), плюс drift-надзор

Почему «составная награда», а не «тест прошёл»

Голый tests_passed ломается законом Гудхарта: модель напишет запутанный код, который формально проходит тесты, или сгенерирует тесты сама себе. Поэтому награда — взвешенная, а компонент тестов считается только от внешних тестов репозитория (модель не оценивает свою же домашку):

reward = 0.4·tests_passed + 0.3·pr_merged_no_revision
       + 0.2·(1−review_rounds) + 0.1·token_efficiency

Обучение включается ПО КЛАССАМ, а не сразу

У кодинг-задач истина быстрая (тест за секунды) — на них можно учиться. У AML/KYC истина зреет 30–90 дней; учиться рано = выучить «groupthink-прокси». Поэтому класс переходит из shadow (логируем, не применяем) в live только когда судья откалиброван: κ≥0.7 при N≥50 и есть независимая человеческая оценка. До тех пор мозг честно говорит: «учусь тихо, в бой не включаю».

Это и есть страховка доверия: клиент видит, что система не применяет обучение, пока не уверена — никакого «само себя сломало».
Глава IV

Закрытый контур: доказательства, деньги, безопасность

«Закрытый контур» — это то, что отличает governance от роутера: каждое утверждение проверяемо, каждый доллар учтён, каждая egress-точка под tripwire.

Проверяемые утверждения

Любое заявление можно превратить в тестируемое предсказание и проверить детерминированно (read-only проба, secret-scrubbed). confirmed=false = коробка сама опровергла заявление — это и есть ценный сигнал.

Client-owned audit — как это работает

«Client-owned» — это threat-model: вы можете доказать целостность аудита, даже не доверяя AGORA. Механизм:

Честно о статусе: V1 построен — ваш ключ подписи + hash-chain каждого решения роутинга + open-source верификатор: подделка ловится по ВАШЕМУ публичному ключу, без нашего кода. Аудит обучения и regulator-ready пакет — дальше. Плюс compliance-tripwire (PAN/IBAN): AGORA работает только на токенизированных данных, вне CDE.

Деньги

Per-consumer виртуальные ключи с бюджетами (fail-closed: over-budget = отказ, не тихий даунгрейд). Spend атрибутируется по ключу — основа chargeback-биллинга, отдельного от «полиции людей».

Доступ закрыт по умолчанию: внешняя поверхность за per-key auth (enforce). Никакого keyless-доступа к тратящим бюджет эндпоинтам.
Глава V

Цифры, которые мы показываем

AGORA опирается на телеметрию, а не на обещания. Три доказательства — и все из реальных данных вашего контура, видимые в панели мониторинга.

Честно: метрики ниже наполняются вашим трафиком — это механика, которую система измеряет, а не «наши показатели». До первых реальных исходов цифры в примерах иллюстративны. Мы показываем, ЧТО измеряем, а доказательства приходят с вашими данными.

PP1 · Экономия с доказательством

Сколько $ сэкономлено на токенах, с разбивкой по task_class — видна логика (code_gen→GPT-4o, simple_qa→Haiku). Источник: spend per-model + usage_report.

PP2 · Обучение, которое видно

Не веса и лоссы, а история решений во времени:

[Нед 1]  code_review → GPT-4o    tests_passed   но дорого
[Нед 3]  code_review → Sonnet    tests_passed   −40% стоимость   (роутер сам выбрал)
[Нед 8]  confidence(Sonnet, code_review) κ=0.84 → learning update активирован
→ «Система стала умнее за 8 недель. Без единой строки конфига от вас.»

PP3 · Drift как страховка

Сколько дрифт-событий поймано и сколько потенциальных потерь предотвращено. Резонирует с любой командой, у кого был инцидент с молча деградировавшей моделью.

Как показываем обучение — метафора «турнирная таблица моделей»: лига на каждый класс задач, чемпион 👑 сверху, win_rate-бар + «термометр уверенности» («ещё N оценок до промоушна»). Никаких сырых кривых — читается за 3 секунды.
Глава VI

Бизнес: позиционирование, моат, GTM

Главный принцип: не конкурировать на «дешевле токены» (это коммодити — RouteLLM OSS, Bedrock нативно). Конкурировать на «кто отвечает за то, что ИИ решил, и докажет это».

Моат — три горизонта (честно: что есть / что строится)

ГоризонтМоатИсточник
СейчасАрхитектурная сложность: роль-осведомлённость × фидбэк-обучение × закрытый контур6–9 мес конкуренту
6–18 месPer-client feedback-data + κ-калибровкарастущий switching cost
18+ месCross-client паттерны + сеть аудит-артефактовdata network effect

Почему RouteLLM и Bedrock структурно не догонят

RouteLLM

Stateless. Без фидбэк-контура, без аудита, без роль-осведомлённости. OSS — нет стимула строить compliance-слой.

Bedrock / Azure

Vendor-lock: хотят вас на СВОИХ моделях. Роутинг через конкурентов — против их бизнеса. Аудит-trail = их данные, не ваши.

Каждый клиент AGORA создаёт приватный feedback-датасет, откалиброванный под свои задачи и роли. Его нельзя передать конкуренту — он живёт в вашем контуре. RouteLLM этого не знает. Bedrock не хочет знать.

Для кого

Команды с ИИ в продакшне, которым важны три вещи разом: контроль расходов, качество решений и аудируемость — финтех и регулируемые отрасли, AI-heavy продукты, компании с несколькими командами на разных моделях.

Как команды внедряют AGORA

Путь — от наблюдения к управлению, без риска на входе:

  1. Тихая установка для наблюдения. Шлюз в вашем контуре только смотрит и считает — собирает картину расходов и решений за пару недель. Вы видите СВОИ цифры на реальных данных.
  2. Адаптивный роутинг. Включаем выбор модели на лету и обучение на ваших исходах — экономия становится измеримой, а не обещанной.
  3. Полный governance. Делиберация + аудит + SLA для команд, где цена ошибки высока.
Принцип: вы сначала видите цифру на своих данных, и только потом принимаете решение. Никаких обещаний вслепую.

Рынок уже движется сюда (проверенные данные индустрии)

ФактЦифраИсточник
Управление AI-расходами стало нормой31% → 63% → 98% (2024→2025→2026)FinOps Foundation, State of FinOps 2026
«FinOps for AI» — приоритет №1 наперёд33% респондентовFinOps 2026
Инструмент №1, которого нет на рынкегранулярный мониторинг AI-расходов (токены/LLM/GPU)FinOps 2026
Регуляторный драйвер аудитаEU AI Act (high-risk) — 2 авг 2026 · DORA — с 17.01.2025artificialintelligenceact.eu
Глава VII

Ландшафт: где мы и где они

Роутинг — коммодити, это правда. Но «учиться на ВАШИХ верифицируемых исходах + аудит, принадлежащий клиенту + роль-делиберация» не делает никто. Это проверено по живым продуктам, не на словах.

ИгрокРоутитУчится на ваших исходахClient-owned аудитРоль-делиберацияSelf-host
RouteLLM (OSS)да (binary)нет (preference-data)нетда
LiteLLMда (правила)нетreq/resp логинетда
OpenRouterда (Auto)нетusageнетнет (SaaS)
Bedrock IPRтолько within-familyнет (docs: «can't»)platform-onlyнетнет
Azure Model Routercross-vendor (в Azure)нет (pre-trained)Azure Policyнетнет
Portkey / Heliconeда (config-правила)нетRBAC/SOC2нетда
Credal / Langfuse—/мультинетсильный (SOC2 II)нетда
AGORA✓ closed-loop✓ client-owned

Две главные угрозы — и где они слабы

Azure Model Router

Самый кредибельный: единственный cloud, реально cross-vendor + обученный. Слаб: pre-trained и статичен — не учится на ВАШИХ исходах, cloud-locked, нет роль-делиберации, нет client-owned ledger.

Bedrock IPR

Слаб вербатим из AWS-доков: маршрутизирует «within the same model family» (нет cross-competitor), «can't adjust routing based on application-specific performance data», English-only, нет self-host.

Рынок раскалывается надвое: cloud-роутеры (vendor-lock + статичны + без суверенитета) и self-host gateway/governance (роутят по правилам, аудируют, но не учатся). Пересечение AGORA — learning-loop на верифицируемых исходах × self-host × роль × client-audit — пусто. Единственный аналог outcome-роутинга — академический Router-R1 (NeurIPS 2025), не продукт.

* «client-owned аудит»: V1 построен — ваш ключ + RDR hash-chain + open-source верификатор (подделка ловится по публичному ключу); learning-audit + regulator-pack — дальше. Механизм — глава IV.

✶ E DISPUTATIONE VERITAS ✶

Книга продукта AGORA · обновляется исследованиями и периодическими консилиумами · 2026-06-09
Тех-первоисточники: обзор AGORA · деплой · портал.