ПЛАТФОРМА MLSECOPS

Вектор RAG:
скрытая компрометация
корпоративного ИИ

Для взлома AI-ассистента больше не нужен прямой доступ к инфраструктуре. Единственный легитимный документ, загруженный в базу знаний (RAG), способен заставить LLM работать против вашего бизнеса. Cybear Verdict — платформа, которая выявляет отравленные данные и блокирует атаки на ML-модели до их выхода в продакшен.

Архитектура защиты

Запросить цену

RAGVECTOR

СЛЕПАЯ ЗОНА КЛАССИЧЕСКОЙ ИБ

Классические средства защиты (WAF, SIEM, EDR) не предназначены для анализа данных внутри векторных баз. Вредоносный контент в RAG-системе маскируется под легитимный бизнес-текст, обходя сигнатурные фильтры и правила безопасности. Это позволяет злоумышленнику скрытно управлять контекстом корпоративной LLM, масштабируя ущерб на тысячи запросов без срабатывания стандартных алертов.

Prompt Injection Ranking Injection Instruction Injection Context Hijacking LLM и мультимодальные Компьютерное зрение (CV)

Скрытый Prompt Injection через документы

Злоумышленник загружает в корпоративную базу знаний документ со встроенной инструкцией (например, требованием выдать пароли). При индексации триггер сохраняется в векторном хранилище, и LLM начинает воспринимать вредоносную команду как часть доверенного контента.

1 %

Успешность атаки / ASR

1 %

Сигнатурное обнаружение

Ranking Injection: манипуляция выдачей

Вредоносный документ искусственно размечается как «авторитетный источник», вытесняя легитимные бизнес-материалы в топ выдачи ретривера. LLM получает искаженный контекст и выдает дезинформацию с высокой степенью уверенности, ссылаясь на несуществующие правила.

1 %

Успешность атаки / ASR

100 %

Вероятность обхода WAF

Обфусцированный Instruction Injection

Управляющие директивы («измени поведение», «обойди ограничения») внедряются внутрь контента через обфускацию: base64-кодирование, смешение кириллицы и латиницы, HTML-энкодинг. Классические DLP-системы и сканеры абсолютно слепы к таким манипуляциям.

1 %

Успешность атаки / ASR

< 1 %

Видимость для классической ИБ

Перехват и подмена контекста (Hijack)

Полная замена легитимного контекста через внедрение директивы исключительной авторизации. LLM игнорирует настоящие документы, дословно цитирует вредоносный текст и транслирует атакующий нарратив как достоверный факт. Возникает эффект незаметного дрейфа модели.

1 %

Успешность атаки / ASR

1 -нед.

Среднее время обнаружения

Защита LLM от инъекций и обхода ограничений

Выявление специфических уязвимостей на уровне самой языковой модели. Платформа предотвращает атаки класса jailbreak, косвенные инъекции, фишинговые искажения и character-level noise, блокируя утечку чувствительных данных через генеративный вывод.

1 %

Доля в базе угроз Verdict

Классов верифицируемых атак

Аудит систем компьютерного зрения (CV)

Проверка алгоритмов распознавания образов на устойчивость к состязательным атакам (Adversarial Attacks). Тестирование реакций нейросети на Gradient и Edge-атаки, визуальные шумы (Subtle Perturbation) и универсальные паттерны (UAP), искажающие логику принятия решений.

1 %

Доля в базе угроз Verdict

Классов верифицируемых атак

Санация перед индексацией

Verdict анализирует каждый документ до того, как он попадёт в векторную базу. Система выявляет императивные конструкции и обфусцированные инструкции, блокируя их на этапе загрузки.

Обнаружение Hijack-атак

В режиме реального времени анализируются extracted-документы на наличие вредоносных директив. Детализация выдается по каждому скомпрометированному фрагменту.

Контроль целостности баз

Каждый легитимный документ подписывается цифровой подписью. При несанкционированной модификации система моментально фиксирует изменения, формируя основание для инцидента.

Резервные снапшоты

Автоматическое создание слепков коллекции перед каждым изменением. При атаке — восстановление до безопасного состояния в одно действие без потери данных.

Сравнительная оценка ASR

Платформа вычисляет Attack Success Rate для различных сценариев на ваших данных и автоматически очищает базу от зараженных документов за один цикл тестирования.

DREAD-СКОРИНГ

Числовое основание
для каждого решения о релизе

Каждая обнаруженная уязвимость получает балл по пяти критериям методологии DREAD (Damage, Reproducibility, Exploitability, Affected Users, Discoverability). Никакой субъективности и абстрактных метрик — только воспроизводимая математика, которая позволяет системе автоматически блокировать скомпрометированные сборки до их выхода в продакшен

DREAD-скоринг уязвимостей ML-моделей в Cybear Verdict

CI/CD ИНТЕГРАЦИЯ

Три шага от уязвимой модели к защищенному релизу

Verdict нативно встраивается в ML-пайплайн через API. Платформа работает как независимый Gate-контроллер, не требуя изменений в архитектуре ваших нейросетей.

Подключение
без смены стека

On-Premises с поддержкой air-gap для полностью изолированных сред. Ваши обучающие датасеты, веса моделей и RAG-базы никогда не покидают защищенный периметр инфраструктуры.

Автоматический аудит

При каждом коммите в ветку release система сканирует RAG-базу на наличие отравленных документов и проводит тест на устойчивость к инъекциям. Результат формируется за минуты без участия человека.

Числовой вердикт и Gate-решение

Деплой разрешается или блокируется автоматически на основе DREAD-скоринга. 83% релизов проходят без привлечения ИБ-команды, оставляя экспертам только инциденты с подтвержденным риском.

GigaChat

YandexGPT

DeepSeek

РОЛЕВАЯ МОДЕЛЬ

Единая платформа
для трех линий защиты

ML-ИНЖЕНЕРЫ И DEVSECOPS

Внедрение без замедления Time-to-Market

Мгновенная обратная связь прямо в CI/CD-пайплайне. Зеленый свет для безопасных сборок без долгого ручного согласования ИБ-комитета. Разработчики получают детализацию вектора атаки до уровня конкретного метода и воспроизводимого сценария.

1 %

Сохранение скорости CI/CD

100

Изменений в коде моделей

CISO И РУКОВОДСТВО

Директивное управление ML-рисками

Управление уязвимостями ИИ без погружения в технический шум. Платформа переводит угрозы на язык математически обоснованных блокировок, заменяя субъективные догадки строгими метриками DREAD. Формирует структурированные отчеты для регуляторов и аудиторов.

1 %

Рутинных проверок в автоматическом режиме

1 %

Прозрачность метрик

ИБ-СПЕЦИАЛИСТЫ

Фокус на реальных угрозах

Инструмент видит слепые зоны RAG-систем, недоступные классическим сканерам (WAF, SIEM). Вы получаете полный аудиторский след по каждой проверке и актуальную базу атак, синхронизированную с фреймворками MITRE ATLAS и OWASP Top 10 for LLMs.

1 /7

Непрерывный аудит

1 %

Аудиторский след

🚨 ДЕПЛОЙ ЗАБЛОКИРОВАН
Модель: RecSys_v2
Обнаружена уязвимость: Data Poisoning (Критичность: 9.2)
Релиз остановлен Gate-контроллером
Сформирован отчет об инциденте

КОМПЛАЕНС И СТАНДАРТЫ

Российское ПО.
Российские стандарты.

Платформа помогает обеспечить соответствие требованиям национальных и международных регуляторов.

1. ГОСТ Р 56939-2024

Выполнение требований по безопасной разработке программного обеспечения.

2. УБИ ФСТЭК России

Интеграция с национальным реестром угроз безопасности информации.

3. OWASP Top 10 for LLMs

Защита от актуальных угроз для языковых моделей.

4. MITRE ATLAS

Выявление инцидентов согласно глобальной таксономии угроз для AI/ML-систем.

Вектор RAG:
скрытая компрометация
корпоративного ИИ

RAGVECTOR

Скрытый Prompt Injection через документы

Ranking Injection: манипуляция выдачей

Обфусцированный Instruction Injection

Перехват и подмена контекста (Hijack)

Защита LLM от инъекций и обхода ограничений