Как ИИ помогает бизнесу работать с репутацией
Цифровая гигиена: как ИИ фильтрует информационный шум
Медиариски не возникают из ниоткуда. Всегда есть первоисточник и «слабые сигналы» — на вид незначительные упоминания в СМИ. Довольно быстро они могут превратиться в тематические сюжеты, которые накладываются на медийный и социальный контекст. Результат — полноценный кризис. Приведём пример.
Несколько месяцев назад ГК «Солар» отслеживала информационную атаку на своего клиента. Сообщения распространялись стремительно — от хакерских «тизеров» до массового обсуждения в СМИ «Мы видели, как волна разрасталась. С помощью автоматизированного мониторинга мы вылавливали новые сообщения и фильтровали поток — вручную сделать это невозможно. На основе этих данных готовились справки: где и в каком контексте упоминается тема, какие источники самые активные. Это дало возможность сформировать позицию по ситуации и действовать на основе фактов, а не слухов», — рассказала медиааналитик ГК «Солар» Полина Валова.
Это не единственный пример. «Наша отрасль — сплошной риск. Кризис может случиться как с нашей компанией, так и с клиентами, и с партнёрами. Поэтому нам важно оперативно видеть всю релевантную информацию по всем участникам», — отмечает Полина Валова.
Действительно, сегодня любая новость, вырванная из контекста, может за часы стать вирусной и вызвать волну тревожности — особенно если речь идёт о сбоях в работе сервисов или киберинцидентах. Сейчас фейк-ньюс — один из самых распространённых инструментов в информационной войне. Ведь иногда достаточно одного поста — и дальше всё растёт как снежный ком. Но за новостью часто нет фактчекинга, никто не проверяет источник и достоверность информации.
Тогда на помощь приходит автоматизированный мониторинг, который позволяет увидеть, откуда пошла информация, как она распространяется и где искажается, а значит, помогает выстроить корректную коммуникацию, основанную на фактах.
У «Солара» настроены уведомления по разным тематикам и источникам, включая телеграм-каналы хакерских групп и активистов. Если там появляется сообщение с упоминанием клиента или компании, уведомление сразу уходит в телеграм-бот. В результате экспертам компании не нужно отдельно отсматривать каждый канал. Такой подход помогает реагировать на кризис ещё до того, как новость подхватят СМИ. А теперь подробнее о том, как работает такая система и можно ли без неё обойтись.
- Репутационные — распространение ложной информации, скандалы, кризисные ситуации, проблемы с руководством и топ-менеджментом.
- Операционные — упоминания о проблемах с поставщиками, кризисные ситуации у контрагентов, срыв контрактов, аварии на производстве.
- Правовые или регуляторные — публикации, способные инициировать проверки государственных органов, судебные иски и т. д.
- Финансовые — новости, которые напрямую влияют на инвестиционную привлекательность компании, её кредитный рейтинг.
«Как раньше» уже не работает
Количество информации растёт с каждым годом — ежемесячно выходят миллионы публикаций с упоминаниями различных юрлиц. «Классический» подход к оценке медиарисков в таких условиях уже не даст нужный эффект.
Во-первых, свою роль играет человеческий фактор — слишком высока вероятность пропустить важный сигнал из-за большого объёма информации, отмечают в «СКАН-Интерфакс». К тому же, даже если новость была обнаружена, то, скорее всего, несвоевременно, и кризис уже успел набрать обороты. Ещё одна причина — ограниченный охват. Ведь невозможно вручную отслеживать все социальные сети, региональные площадки и отраслевые источники. И самое главное — такой подход делает невозможным прогнозирование рисков.
Полноценный анализ рисков требует учёта всей информационной картины. Качественный мониторинг новостей помогает вовремя реагировать на события, связанные, например, с контрагентами, и формировать целостную картину их благонадёжности и репутации. Это полезно и для пресс-службы: специалисты могут молниеносно среагировать на негативный инфоповод о своей компании и отработать его в публичном поле. И вот здесь необходим ИИ — он улавливает разнообразие контекстов и помогает не пропустить негативные упоминания о компании.
Что умеет ИИ?
Различает контекст и тональность. В новостях содержится огромное количество фактов, которые имеют различную степень важности при анализе рисков. Определить, есть ли в тексте эти факторы, могут ИИ-классификаторы, обученные на больших объёмах тщательно отобранных данных. «Так, СКАН не только фиксирует упоминание ключевых слов и синтаксических конструкций, которые указывают на наличие факта, но и анализирует, произошло ли событие на самом деле», — уточняют в «СКАН-Интерфакс». То есть ИИ умеет отличать реальные инциденты от слухов или гипотетических сценариев и рассуждений. В итоге только реальный негативный инцидент попадает в зону внимания как подтверждённый факт.
Но как быть, если в одном материале упоминается сразу несколько компаний, хотя истинным участником события оказывается лишь одна? Например, сообщение о мошенничестве, где фигурируют жертва и банк: они не виновники происшествия и не должны восприниматься как субъекты рискового события. Здесь снова помогает ИИ-классификатор — только теперь он работает уже на уровне токенов. Это позволяет точно определить роль каждого в тексте, отделить источник негатива от остальных.
Для оценки контекста на предмет риск-факторов или иных упоминаний ИИ-системы могут использовать разный объём текста публикации. Поэтому качественная сегментация материала напрямую влияет на точность работы алгоритмов. Так, чтобы выявить негатив о компании, достаточно одного предложения, где он упоминается.
Негативные факты — это не расплывчатое понятие, которое нужно искать по всей публикации, они красной нитью проходят через каждое предложение текста.
Однако для определения некоторых категорий позитивных или нейтральных фактов может понадобиться больше контекста. В таких публикациях суть события не ограничивается одним предложением. Есть и задачи, где анализ ведётся на уровне абзацев или целых параграфов. Например, при определении жанра отзыва — такие тексты часто пишутся под влиянием эмоций, и без расширенного контекста корректную классификацию провести невозможно.
Кластеризует данные и детектирует смыслы. Публикации об одном и том же громком событии, неважно — рисковом или нет, группируются системой в кластеры — инфоповоды. Этот процесс реализуется с помощью ИИ-алгоритмов. Сначала обученная на большом корпусе текстов модель получает векторное представление каждой публикации. При этом объём текста, используемый для формирования вектора, зависит от ряда факторов, например, типа новости, наличия лида. Затем система ищет близкие по смыслу векторы и объединяет соответствующие публикации в кластеры инфоповодов. Все этапы выполняются параллельно, что позволяет обрабатывать поток в режиме реального времени.
Кластеризует риски. ИИ объединяет упоминания в тематические кластеры. Например, «качество продукции», «условия труда» или «экологические нарушения». Это позволяет понять, какая тема вызывает наибольший негатив.
Выявляет аномалии. ИИ-инструменты обеспечивают обновление данных в реальном времени, а на наглядных графиках легко отслеживать всплески упоминаний.
Определяет связи. Выделение фактов и субъектов в тексте невозможно без точной идентификации компаний, персон и локаций — вплоть до размеров городов. В арсенале СКАН есть ИИ-инструменты, которые решают задачу распознавания этих именованных сущностей. Подход состоит из двух этапов: сначала алгоритм находит в потоке новостей конструкции, которые могут быть сущностями, затем устраняет неоднозначность и уточняет их тип — компания, персона или географический объект.
При этом, идентифицируя сущность, система учитывает множество тонких различий. Иногда это может быть всего один символ. Также система учитывает близлежащий контекст. Например, если название компании не указано, а в контексте присутствует имя её генерального директора, можно с уверенностью сказать, что контекст публикации и выделенные в нём факты относятся именно к этой компании. Когда название компании совпадает с распространённым словом или аббревиатурой, система использует комплексный подход с применением ИИ, чтобы понять, о чём идёт речь. Нейросетевые модели учитывают контекст и прогнозируют, является ли конкретное упоминание названием компании.
Работает с большими объёмами данных. Инструменты на основе ИИ заметно превосходят классические подходы по скорости и точности обработки больших массивов данных. Например, СКАН способен анализировать поток новостных публикаций со скоростью 20 тысяч предложений в минуту. ИИ, как высокотехнологичный «радар», сканирует инфополе, фильтрует данные и предоставляет специалисту структурированную по степени угрозы информацию.
