Аналитика

Как заставить ИИ объяснять свои решения: прорыв в причинно-следственном анализе

Causal AI: как наделить нейросети способностью пояснять свои выводы

Сектор Causal AI демонстрирует стремительное расширение: в 2025 году его оценивают в $63 млн, а к 2035 году ожидается рост до $1,6 млрд — это подразумевает ежегодный прирост на 38% (по данным отчета Roots Analysis за октябрь 2025). Иван Китов, старший специалист по данным в Wolt, углубленно занимается этой темой, анализируя причинно-следственные связи в ИИ. В 2025 году он организовал вебинар по причинному выводу, выпустил три научные публикации в международных изданиях, а среди его ключевых результатов — создание платформы для экспериментов в Wolt и системы A/B-тестирования в Prisma Labs. CNews обсудил с Иваном суть Causal AI, причины, по которым нейросети часто считаются «непрозрачными», как причинный подход меняет проведение экспериментов и возможно ли заранее прогнозировать итоги тестов.

CNews: Иван, вы сейчас углубленно изучаете Causal AI и причинный вывод — анализ причинно-следственных связей в искусственном интеллекте. Как бы вы объяснили эту область и почему она становится всё более востребованной?

Иван Китов: Если говорить кратко, традиционный ИИ и нейросети — это инструменты для выявления статистических закономерностей. Чтобы обучить такую модель, требуется множество примеров, на основе которых она определяет взаимосвязи и строит прогнозы, опираясь на собранную статистику.

Сложность в том, что подобная модель часто функционирует как «чёрный ящик»: она предоставляет результат, но не раскрывает, почему он получился именно таким и какие факторы в действительности сыграли решающую роль.

Causal AI как раз нацелена на решение этой проблемы — она стремится научить алгоритмы распознавать, что именно служит причиной того или иного явления. Это шаг от простого наблюдения к пониманию причин.

Для наглядности рассмотрим обычный житейский случай. Люди, регулярно посещающие тренажерный зал, чаще приобретают протеин. Между этими действиями существует корреляция, однако это не означает, что если начать раздавать протеин всем подряд, они внезапно станут более атлетичными. Статистическая связь присутствует, но причинно-следственной — нет.

В настоящее время область Causal AI развивается благодаря нескольким факторам:

Во-первых, компаниям требуются не столько прогнозы, сколько конкретные инструменты для воздействия. Сам по себе прогноз о «росте на 5%» малоинформативен. Следом неизбежно возникает вопрос: «Почему именно так? И какие шаги предпринять для достижения 10%?». Методы причинно-следственного анализа как раз предоставляют подобные ответы.

Во-вторых, идеальная реальность с непрерывными A/B-тестами — это чаще удел презентаций. На практике проведение экспериментов обходится дорого, занимает много времени и зачастую просто неосуществимо. Causal-подходы позволяют извлечь максимальную пользу из уже имеющихся данных, приближая нас к результатам, которые могли бы дать экспериментальные исследования.

В-третьих, это возрастающая роль ИИ в ответственных областях. Когда алгоритм влияет на выдачу кредитов, медицинские диагнозы или уровень доходов, отговорка «модель просто так решила» становится неприемлемой. Необходима ясность: почему система приняла конкретное решение и что изменится при корректировке правил. Здесь причинно-следственные методы превращаются в насущную необходимость.

CNews: Приведите практический пример, когда неочевидность работы ИИ-модели создала трудности для бизнеса. Встречались ли вы с подобными ситуациями в Wolt, Drops или других компаниях?

Иван Китов: Да, в Drops был весьма характерный эпизод. Мы применяли модель, определявшую, какие упражнения показывать пользователю, чтобы увеличить время его пребывания в приложении. Первоначально всё выглядело безупречно: краткосрочная вовлеченность росла, реже пропускались задания, ключевые показатели были отличными.

Однако у модели обнаружился неочевидный побочный эффект. Поскольку она была настроена на оптимизацию сиюминутных реакций, она постепенно стала вытеснять более сложные упражнения — те, что действительно способствуют прогрессу в изучении языка, но требуют чуть больше усилий.

Логика алгоритма была проста: раз простые задания реже пропускают, значит, их и нужно показывать чаще. Но с точки зрения развития продукта происходило обратное — мы неосознанно тормозили прогресс пользователей.

Именно здесь проявилась проблема «черного ящика». Сложно оспаривать модель, которая демонстрирует рост по основным метрикам. На графиках всё прекрасно, но внутри скрывался дисбаланс, который в долгосрочной перспективе вредил основной цели — обучению.

В результате нам пришлось пересмотреть целевую функцию, добавив причинно-следственные и долгосрочные метрики, чтобы алгоритм учитывал факторы, ведущие к устойчивому прогрессу.

Если говорить в целом, то из-за непрозрачности моделей бизнес часто сталкивается с тремя типами проблем: недоверием, сложностями в управлении рисками и ограничениями в развитии продукта. Всё, что требует понимания внутренней логики, страдает, если она остаётся скрытой.

CNews: Вы специализируетесь на выявлении взаимосвязей без прямого экспериментирования. Возможно ли объяснить причину и следствие, не проводя классический A/B-тест? Как это связано с Causal AI?

Иван Китов: Если кратко — да, это возможно. Но, как и всегда, здесь есть важные детали.

Определять причинно-следственные связи без традиционного A/B-тестирования вполне реально, если придерживаться трёх ключевых принципов:

Во-первых, необходимо открыто озвучивать все принятые допущения. Без этого любое причинное утверждение становится спекуляцией. Важно чётко определить, что мы считаем воздействием, какие переменные контролируем, а какие — остаются вне нашего влияния.

Классическая иллюстрация — взаимосвязь между объёмами продаж мороженого и случаями нападения акул.

На графике зависимость кажется очевидной, но мы осознаём, что запрет на продажу мороженого не сделает пляжи безопаснее. Оба явления просто усиливаются из-за общего фактора — высокой температуры воздуха.

Во-вторых, требуется применять подходящую структуру данных. Это могут быть естественные эксперименты, постепенные релизы функций, географическое сегментирование или ситуации, где изменения затрагивают пользователей не одновременно. Подобные сценарии позволяют фактически «смоделировать» эксперимент, даже если он изначально не планировался.

И, в-третьих, важно проверять полученные выводы в условиях, где проведение эксперимента всё же осуществимо. A/B-тестирование остаётся эталонным методом, но причинно-следственные подходы значительно расширяют круг вопросов, доступных для изучения.

Именно здесь раскрывается роль Causal AI. Два компонента работают в связке:

  • AI-компонент создаёт точные прогнозы и контрфактические сценарии — помогает представить, что случилось бы при отсутствии изменений.
  • Causal-компонент устанавливает правила, определяет вмешательства, фиксирует допущения и ограничивает сравнения, способные привести к неверным умозаключениям.

Вместе они дают возможность получать достоверные причинные оценки даже там, где классический эксперимент провести невозможно.

CNews: Как методы Causal Inference можно использовать в практических бизнес-задачах? Например, в системе оплаты труда курьеров или монетизации обучающих приложений?

Иван Китов: Сфера их применения обширнее, чем может показаться — они эффективны в ситуациях, где классический эксперимент либо невыполним, либо требует чрезмерных затрат.

В сфере доставки, к примеру, почти нереально запустить чистый A/B-тест: любая корректировка мгновенно влияет на весь регион, а сама система обладает высокой степенью взаимосвязей. Causal Inference позволяет анализировать такие «зашумлённые» данные и всё равно извлекать из них содержательные причинные выводы.

CNews: В Prisma Labs вы разработали систему прогнозирования LTV для маркетингового трафика, а в Drops — систему A/B-тестирования. Как Causal AI мог бы усовершенствовать эти системы? Какие новые перспективы он предлагает?

Иван Китов: В Prisma Labs моей задачей была разработка модели прогнозирования пожизненной ценности клиента (LTV) для маркетинговых каналов. Созданная мной классическая модель эффективно справлялась с ранней оценкой будущей выручки, однако имела ключевое упущение: она не разделяла вклад естественного поведения пользователя и влияние наших маркетинговых активностей. Эта модель на основе градиентного бустинга была сильным базовым решением для своего времени и успешно решала основную задачу — отсеивала неэффективные источники трафика.

Если рассматривать эту систему с точки зрения причинно-следственного анализа (Causal AI), я бы дополнил существующую модель каузальным слоем и перешёл к оценке инкрементального LTV. Практически это означало бы формализацию причинно-следственного графа (реклама -> активация -> платежи) с учётом органического трафика, ретаргетинга и прочих каналов.

Далее я бы спланировал и провёл серию контролируемых экспериментов, включая географические тесты, для калибровки uplift- или ITE-моделей. Затем интегрировал бы метрику инкрементального LTV непосредственно в процесс закупки рекламного трафика.

По своей сути, это преобразует задачу из простого прогнозирования в оценку эффекта от наших действий, позволяя принимать обоснованные продуктовые и маркетинговые решения: какие кампании расширять, какие остановить, а какие сегменты почти не задействовать, поскольку они и так демонстрируют органический рост.

В компании Drops я занимался созданием платформы для A/B-тестирования, которая уже на этапе внедрения сократила длительность экспериментов благодаря улучшенному дизайну и автоматизации анализа. Моя роль включала руководство внедрением методов CUPED, стратификации, а также автоматизацией этапов — от формулировки гипотез и дизайна экспериментов до подведения итогов. Это был сквозной проект, охватывающий все стадии обработки данных и принятия решений.

Сегодня, добавляя более глубокий аналитический слой, я бы внедрил анализ гетерогенных причинно-следственных эффектов для повышения детализации выводов. Также было бы целесообразно систематически использовать пользовательские ковариаты (история поведения, платежи, тип устройства и т.д.) для снижения дисперсии в оценках эффекта и дальнейшего сокращения времени проведения тестов. Следующим шагом развития могло бы стать внедрение контрафактивных оценок (off-policy), позволяющих принимать часть продуктовых решений на основе каузальных моделей, обученных на исторических данных экспериментов.

CNews: Классические A/B-тесты требуют значительного времени, трафика и ресурсов. Способен ли причинно-следственный анализ (Causal Inference) заменить часть экспериментов или сделать их менее затратными и более быстрыми?

Иван Китов: Если говорить откровенно, в иерархии исследовательских методов A/B-тестирование остаётся наиболее надёжным подходом. Более высокий уровень достоверности обеспечивают лишь мета-анализы, обобщающие результаты множества проведённых экспериментов.

Однако существует важный нюанс: в реальной бизнес-среде часто возникают вопросы, на которые поставить чистый A/B-тест невозможно. Именно в таких ситуациях методы причинно-следственного анализа приносят наибольшую пользу.

Яркой иллюстрацией служит Нобелевская премия по экономике 2021 года. Её обладатели создали подходы, которые помогают обнаруживать причинно-следственные связи без проведения реальных экспериментов.

Так, их исследования продемонстрировали, что каждый дополнительный год обучения повышает будущий доход примерно на 9%. Это как раз та ситуация, где проведение A/B-теста в принципе нереализуемо. Ведь невозможно ради эксперимента лишить половину детей возможности ходить в школу.

CNews: С какими техническими трудностями сталкиваются компании при внедрении методов причинного вывода в рабочие процессы? Почему эти методы, при всей их эффективности, пока не получили повсеместного распространения?

Иван Китов: Главный и неочевидный барьер связан даже не с алгоритмами, а с качеством данных. Для причинного анализа критически важна системность: необходим строгий учёт, каждая переменная должна быть описана, а все изменения — зафиксированы вместе с контекстом.

Если исходная информация неупорядочена, то и выводы будут ненадёжными. Классический принцип «мусор на входе — мусор на выходе» здесь проявляется в полной мере.

Отсюда возникает угроза излишней бюрократизации: для успешной работы с причинным анализом команда должна педантично документировать всё, что может воздействовать на модель. Такая «культура данных» часто встречает сопротивление, поскольку требует дополнительных усилий.

Вторая проблема — дефицит квалифицированных кадров. Эта область лежит на пересечении машинного обучения, аналитики, экономики и продуктового менеджмента. Подобных специалистов немного, и многие приходят из науки, где изучение инструментов и логики причинного анализа занимает долгие годы.

Наконец, не для всех задач это необходимо. Если продукт несложный, метрики очевидны, а изменений происходит мало, то углублённые причинные методы могут оказаться излишними. Во множестве ситуаций достаточно стандартных A/B-тестов и качественной аналитики.

CNews: Вы имели опыт работы в различных сферах: от маркетинга и образовательных технологий до сервисов доставки и геоданных. Где методы причинного искусственного интеллекта наиболее актуальны? В каких областях они способны принести максимальную пользу?

Иван Китов: Causal AI наиболее эффективен в тех системах, где изменения в одном элементе быстро сказываются на остальных, и требуется точно определить взаимное влияние разных частей.

  • Сервисы доставки — это типичная трёхсторонняя платформа: клиенты, рестораны и доставщики. Любое изменение в одном звене неизбежно затрагивает остальные.
  • В EdTech ситуация схожа. Корректировки в учебных курсах дают результат не мгновенно — их нужно отслеживать продолжительное время. Проводить эксперименты на каждом этапе почти нереально, поэтому причинно-следственный анализ становится неотъемлемой частью создания эффективного образовательного продукта.
  • Маркетинг — ещё одна важная сфера применения. Здесь causal-методы позволяют найти ответ на ключевой вопрос: какую реальную отдачу принёс наш бюджет? Мы отлично видим ситуацию «до» и «после», но не можем знать, что было бы, если бы мы не действовали. Именно эту «альтернативную реальность» causal-подходы помогают оценить наиболее точно.

CNews: Вы выступали на World Data Summit в Амстердаме в 2025 году. Какие тенденции в сфере Data Science и ИИ вы там отметили? О чём чаще всего говорили специалисты?

Иван Китов: Основное впечатление — рынок становится более зрелым. Компании перестают воспринимать ИИ как волшебное решение и начинают задаваться вопросом: какую конкретную пользу это нам приносит?

Я как раз представлял своего рода «вводный курс» по причинно-следственному анализу и вёл практический семинар. Мы разбирали наиболее показательные примеры, где causal-методы помогают выявить, что на самом деле влияет на итог, и каких эффектов бизнес вправе ожидать.

Вторая заметная тенденция — сдвиг от отдельных моделей к целостным системам поддержки решений. Речь уже не о том, «чтобы нам обучили модель», а о том, как интегрировать её в реальные бизнес-процессы: ценообразование, логистику, маркетинг, развитие продукта. И как добиться, чтобы бизнес понимал, почему система принимает те или иные решения.

Разумеется, главной темой оставался GenAI. Обсуждали инфраструктуру, построение RAG-систем, оценку качества ответов и обеспечение безопасности.

Также значительная часть выступлений была посвящена данным как продукту. Вопросы качества, управления данными (governance), наблюдаемости (observability) — всё, что делает систему устойчивой и надёжной. Это очень техническая сторона, но без неё ни ИИ, ни машинное обучение не смогут работать полноценно.

CNews: Какой совет вы дали бы компаниям, которые планируют начать применять методы Causal Inference? С чего им стоит начать, какие первые шаги предпринять?

Иван Китов: В первую очередь важно осознавать, что Causal Inference — это не панацея, а набор инструментов, помогающих снизить неопределённость при принятии решений.

Внедрять их стоит поэтапно, не стремясь сразу создать идеальную систему.

  1. Порядок в информации. Любые корректировки, предположения и итоги необходимо документировать. Без этого исчезает понимание ситуации, и любой анализ станет беспорядочным. Начать можно с формирования грамотной практики проведения A/B-экспериментов.
  2. Единая картина происходящего. Объедините специалистов по данным, продуктовых менеджеров и представителей маркетинга или операционных подразделений. Зафиксируйте все факторы, воздействующие на итог, и связи между ними. Причинно-следственный анализ эффективен лишь при ясном представлении о том, что действительно определяет успех бизнеса.
  3. Двигайтесь постепенно. Не стоит сразу создавать безупречную систему со всеми актуальными методиками. Определите одну-две конкретные проблемы, используйте простые инструменты, проанализируйте полученное и продолжайте развиваться шаг за шагом.
  4. Определите кураторов. Целесообразно, чтобы причинно-следственным анализом занимался выделенный специалист или группа. Иначе знания становятся поверхностными, а различные департаменты могут действовать на основе конфликтующих идей.
  5. Связывайте итоги с действиями. Если на основе исследований не принимаются бизнес-решения, вся работа сводится к простому описанию цифр. Четкая связь между результатами анализа и практическими шагами укрепляет доверие и формирует культуру системного подхода.

CNews: Каковы ваши ближайшие планы в сфере Causal AI?

Иван Китов: В настоящее время я концентрируюсь на Causal AI в рамках продуктовой аналитики, а также в сегменте маркетплейсов и сервисов доставки по запросу.

Моя излюбленная и пока не до конца решенная задача — определение разнородных эффектов от экспериментов и решений, которые мы реализуем в Wolt. Сейчас активно изучаются методы Double ML, ключевое преимущество которых как раз в эффективном выявлении дифференцированных воздействий по сегментам. Это позволяет делать выводы даже в ситуациях, когда общий средний эффект от изменения неочевиден.

Параллельно я веду работу над изучением инкрементального LTV (пожизненной ценности клиента). Этот подход традиционно связан с маркетингом, но в контексте маркетплейсов и доставки он также представляет интерес из-за выраженных пиков, таких как обеденное и вечернее время, а также сильной недельной и годовой сезонности. В итоге, определение инкрементального LTV от изменений — это задача, находящаяся на пересечении прогнозирования временных рядов и Causal AI.

В планах на следующий год также — участие в конференциях: PyData Berlin, World Data Summit и EuroCIM. Первые две имеют более прикладную, индустриальную направленность, там я планирую делиться опытом внедрения причинно-следственных подходов в наших командах, рассказывать о наиболее и наименее эффективных методах. EuroCIM же ориентирован на академическую аудиторию, и там тоже есть чем поделиться с сообществом; особенно ценной будет возможность обмена опытом и идеями с представителями университетов и научных центров.

CNews: Каким вы видите будущее анализа данных? Какую роль, на ваш взгляд, будет играть Causal AI через 5–10 лет?

Иван Китов: Предприятиям требуется не просто прогнозирование, но и ясное представление о том, как изменится итог, если мы решимся пересмотреть сами принципы работы?

Уже сегодня такие гиганты, как Doordash, Uber и Amazon, создают виртуальные модели: платформы, которые дают возможность проигрывать различные сценарии, оценивать их эффект и выбирать стратегии, а затем подтверждать их на практике. Эта тенденция будет только нарастать.

В настоящий момент Causal AI — по большей части, инструмент для обладающих достаточными средствами и знаниями. Спустя 5–10 лет это превратится в обыденный стандарт. Она станет неотъемлемой частью базовой инфраструктуры, подобно тому, как сегодня никого не удивляют A/B-тесты или системы отслеживания показателей.

Иван Петров

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории