Человек в паре с ИИ: как компании не получить дорогого оператора кнопки «принять»

Компания подключила ИИ к потоку документов. Первую неделю сотрудник внимательно читает каждый ответ, правит, иногда возвращает на переделку. Через месяц он принимает почти всё подряд, не глядя, потому что ИИ обычно прав. На бумаге контроль есть: человек на месте, поток идёт, ошибок не видно. На деле контроль умер, просто этого ещё никто не заметил. Заметят, когда первая ошибка уйдёт наружу и выяснится, что последние недели её никто и не мог поймать.

Это не страшилка, а один из самых тихих способов потерять смысл связки человек+ИИ. Дальше разберём, какие пары вообще бывают, какие задачи стоит отдавать ИИ, где именно ломается человеческая проверка и почему без цифрового следа этот контроль нельзя ни доказать, ни починить. А к нашему отделу с умершей проверкой ещё вернёмся.

О чём это и о чём это не

Сразу разведу три ситуации, которые постоянно валят в одну кучу.

Личное использование. Сотрудник сам себе помогает: попросил ИИ накидать черновик, расшифровать звонок, найти формулу. Полезно и массово. Но для компании это ещё не управляемый процесс, а частная инициатива человека.

Теневое использование. То же самое, только массово и незаметно для компании. Люди уже носят рабочие задачи в ChatGPT, YandexGPT, расшифровщики звонков и расширения браузера, а компания этого не видит. И вот это важно: пока ИИ работает в тени, компания не видит ни данных, ни качества, ни ошибок. Это, по сути, первая форма отсутствия следа — работа уже идёт через ИИ, но её никак не видно. Для многих это и есть реальная стартовая точка: вопрос не «внедрять ли ИИ», а «что у нас уже происходит вслепую и где это создаёт риск». Запрещать с порога обычно бесполезно. Разумнее понять, где это уже помогает, а где опасно, и постепенно вывести полезное из тени в нормальные правила.

Организованная пара. Компания сознательно встроила ИИ в рабочий процесс. ИИ делает часть работы, человек отвечает за результат, который уходит клиенту, в документ, в систему. Вот здесь все деньги и все грабли. Эта статья в основном про неё.

Разница принципиальная. В личной работе ошибка чаще остаётся внутри: человек сам решает, доверять черновику или переписать, и сам несёт последствия. В организованной паре ошибка ИИ может уйти наружу, и вопрос «кто это пропустил» слишком часто остаётся без ответа. Потому что пару собрали, а кто в ней за что отвечает — не договорились.

Почему экономия утекает в проверку

На уровне ощущения ИИ часто даёт резкий выигрыш: черновик появился за минуту, документ разобран, письмо собрано. Но в рабочем процессе экономия считается не по моменту генерации, а по готовому результату, который не стыдно выпустить. А между черновиком и результатом стоит проверка. Именно туда выигрыш и утекает.

Замеры это подтверждают, хотя к цифрам стоит относиться как к ориентиру — у каждого исследования своя выборка.

Во-первых, люди плохо оценивают собственный выигрыш. METR в 2026 году отдельно предупреждает, что самооценки могут заметно завышать эффект. Когда тот же эффект меряют со стороны, цифры скромнее: в исследовании St. Louis Fed пользователи генеративного ИИ сообщали об экономии порядка 5% рабочего времени. Между «мне кажется, я ускорился вдвое» и реальной экономией — большой зазор.

Во-вторых, проверка съедает значительную часть выигрыша напрямую. В исследовании Foxit и Sapio по работе с документами (США и Великобритания) время на проверку почти обнуляет заявленную экономию: руководители получают в среднем около 16 минут чистого выигрыша в неделю, а сотрудники и вовсе уходят в минус. Время, сэкономленное на «сделать», утекает в «проверить за ИИ».

Вывод не «ИИ не работает». Вывод: связка человек+ИИ даёт результат не сама по себе, а только если правильно устроена. Иначе вы платите дважды — за ИИ и за человека, который теперь разгребает за ИИ.

Какую пару вы строите

Прежде чем считать экономию, надо понять, какую именно связку вы строите. «Человек работает с ИИ» — это не один сценарий, а минимум три. Их путают, а загрузка человека и риски в них совершенно разные.

Режим 1. ИИ-ассистент: человек ведёт. Человек делает работу, ИИ подсказывает — черновик, формулировка, идея, проверка варианта. Решение и итог на человеке. Загрузка примерно прежняя, просто быстрее на отдельных шагах. Когда брать: на старте, на нетиповых и творческих задачах, где важно суждение. Риск низкий.

Режим 2. ИИ делает — человек проверяет. ИИ делает первый проход по потоку, человек проверяет, правит, принимает. Самый частый рабочий режим в бизнесе и самый коварный: именно здесь живёт большинство ловушек. Загрузка смещается с производства на проверку — это другая работа и другая усталость. Когда брать: на повторяемом потоке средней цены ошибки. Риск средний и выше, всё упирается в то, реально ли человек проверяет.

Режим 3. ИИ-автопилот, человек на исключениях. ИИ закрывает поток сам, человек разбирает только то, что система пометила как сомнительное, плюс выборочно проверяет остальное. Человек работает не со всем потоком, а с его трудным хвостом. Когда брать: на больших объёмах однотипных задач с понятной ценой ошибки, и только после того как режим 2 показал стабильное качество. Прыгать сюда сразу — почти гарантированно пропускать ошибки. Риск высокий, если плохо настроено, когда звать человека.

Пример из нашего. Тендерный агент Torgi (у нас пока пилот) устроен как режим 2–3: ИИ проходит весь первый круг — находит закупки, разбирает документы, собирает досье на заказчика и по каждой выдаёт вердикт «брать / посмотреть / пропустить» с обоснованием, рисками и тем, каких данных не хватает. Заявки он не подаёт и ничего не подписывает, это сознательное ограничение. Финальное решение и ответственность остаются на человеке, а ИИ снимает с него первичную рутину, а не право решать.

Вы выбираете не «внедрить ИИ», а в каком режиме работает конкретная пара на конкретном процессе. И режим должен соответствовать цене ошибки и объёму, а не моде.

Что отдавать в пару

Режим выбран — теперь вопрос, какую задачу в него вообще класть. Не всякую стоит, даже если технически можно.

Сравните два случая. Черновик ответа клиенту проверить легко, ошибка обычно заметна и поправима. Юридическую формулировку проверить трудно, а ошибка может всплыть через месяцы и дорого. Это разные классы задач, хотя обе можно отправить в ИИ. Отсюда два вопроса: дорого ли сделать против того, дорого ли проверить, и заметна ли ошибка.

Первый критерий: отдавайте в пару то, где проверить дёшево, а сделать дорого. Если результат ИИ человек может быстро оценить взглядом, а сделать с нуля долго — связка выигрывает. Если же, чтобы убедиться в правильности, надо фактически проделать работу заново — пара не ускоряет, а замедляет. Это и есть та ситуация, где выигрыш съедается проверкой.

Второй критерий: заметна ли ошибка. Дешёвая проверка при незаметной и дорогой ошибке — ловушка: человек думает, что глянул, а на деле пропустил.

Проверить	Цена ошибки	Что делать
Дёшево	Низкая	Хороший кандидат на старт
Дёшево	Высокая	Можно, но с жёстким контролем и сплошной проверкой
Дорого	Низкая	Чаще всего не окупается
Дорого	Высокая	На старте не брать

Признак, что задача выбрана неудачно: люди говорят «легче самому, чем за ним проверять». Это обычно не лень, а правда — сигнал, что либо задача не та, либо режим выбран неверно.

Пример из нашего. Платформа для исполнительной документации в стройке (ПТО — этот агент уже передан клиенту и работает на реальных объектах): ИИ готовит акты и реестры, ищет и подбирает документы качества, проверяет комплектность. Инженер проверяет и подписывает. Цена ошибки понятная и заметная: стройконтроль вернёт некомплектный пакет на доработку, объект встанет, оплата сдвинется. Поэтому проверка человеком тут не формальность, а часть работы, ради которой всё и затевалось.

Отдельно: задачи, где ошибка дорогая и незаметная одновременно (финальная отчётность, юридические формулировки, медицинские решения), на старте в пару лучше не брать вообще. Не потому что ИИ туда не сможет, а потому что цена пропущенной ошибки выше всей экономии.

Где ломается проверка

Допустим, режим выбран верно и задача подходящая. Проверка человеком всё равно ломается, и не потому что люди плохие, а по понятным механическим причинам. Тот самый отдел из начала статьи сломался не от лени. Разберу по контурам, на которых вижу поломку чаще всего.

Внимание притупляется. Если ИИ почти всегда прав, человек перестаёт читать и начинает механически принимать. Это и есть оператор кнопки «принять». Диагностический признак простой: доля правок стремится к нулю. Месяц подряд всё принимается без единого изменения — это почти никогда не значит, что ИИ идеален. Это значит, что проверка умерла.

Интерфейс подталкивает принимать. Качество проверки сильно зависит от того, как устроен экран. Если «принять» жмётся одной кнопкой, а чтобы исправить, надо переписывать всё вручную — люди будут принимать. Это не слабость характера, а нормальное поведение в плохо спроектированной системе. Что помогает: показывать источник рядом с ответом ИИ, давать быстрый способ поправить, а не переписать с нуля, показывать, что именно изменил человек, делать отказ от ответа ИИ обычным действием, а не подвигом, и не прятать «я не уверен» в мелкий серый шрифт.

Доверие сбито. Человеку нужно знать, где ИИ силён, а где регулярно врёт. Оба перекоса вредны. Слишком мало доверия — человек перепроверяет всё с нуля, включая то, что ИИ делает надёжно, и пара теряет смысл. Слишком много — человек верит ИИ даже там, где тот ошибается, особенно под нагрузкой и в спешке. А спешка и нагрузка — это как раз когда ошибки вероятнее всего.

Проверяющего перегрузили. ИИ выдаёт в пять раз больше, а проверять должен тот же человек в прежнем темпе. Сначала он старается, потом проверяет поверхностно, потом выгорает. Нельзя увеличить поток на входе и не пересчитать, сколько человек физически может проверить на выходе.

У проверяющего нет полномочий. Самая недооценённая поломка, и она не про человека, а про организацию. Человек видит проблему, но ничего не может сделать: KPI требует закрыть сто заявок в день, кнопки «вернуть ИИ на доработку» нет, а руководитель ругает за задержку, но не за пропущенную ошибку. В такой системе человек быстро понимает, что выгоднее принимать. Проверяющий должен иметь право остановить результат, вернуть его на доработку, запросить источник или сменить маршрут задачи. Если он отвечает за ошибку, но не может остановить выпуск, это не контроль, а назначенный крайний.

Сумма всех этих контуров — иллюзия продуктивности. ИИ позволяет быстро произвести много. Но десять непроверённых черновиков — это не больше работы, это больше необработанного материала. Скорость генерации без скорости проверки даёт не продуктивность, а завал. Тот самый разрыв «кажется много, а до результата дошло мало».

И главное: все эти поломки происходят незаметно. Снаружи всё выглядит рабочим — до первой вылетевшей ошибки. Чтобы увидеть поломку раньше, чем она дойдёт до клиента, проверку надо сделать видимой.

Если проверку не видно, её нет

Тут разворачивается вся статья.

В паре с ИИ работа человека всё меньше про «сделать» и всё больше про «проверить и поручиться». Генерацию забирает ИИ, ценность и ответственность человека смещаются в проверку. И если эту проверку никак не зафиксировать, то с точки зрения компании её как будто и не было — ровно как в теневом использовании, с которого мы начали.

Проверка — это работа, а не «ну он глянул». Её надо сделать видимой и нормируемой, как любую другую. Это значит договориться: что именно проверяем (по каким признакам результат годен), насколько глубоко (черновик внутреннего письма — беглый взгляд, договор — построчно, это разные регламенты) и сплошь или выборочно (на потоке часто разумна выборочная проверка плюс полная проверка всего, что система пометила сомнительным). Если про задачу нельзя сказать, как её проверять, — её рано отдавать в пару.

И ещё: в системе должны быть правила, когда результат нельзя выпускать автоматически — низкая уверенность модели, конфликт источников, нет данных, дорогая ошибка. Не «ИИ сам честно скажет, что не уверен» (он ничего не должен сам), а заданные пороги и правила эскалации на человека.

Цифровой след — это запись того, как результат появился. По-человечески: что выдал ИИ, что человек поправил, кто поставил финальную подпись, когда. Не обязательно сразу система с хешами и неизменяемыми логами (в регулируемых отраслях дойдёт и до этого), на старте достаточно честного лога, кто что сделал.

Зачем это компании:

Ответственность становится настоящей. Есть конкретный человек, который принял результат. Не «команда», не «ИИ», а Иванов в такой-то день. Это лечит размытую ответственность, когда виноватого не найти.
Разбор ошибок становится возможным. Когда ошибка прошла наружу, видно, на каком шаге. ИИ так выдал и человек принял не глядя? Или поправил, но неудачно? Без следа это гадание, с ним — конкретный вывод и конкретная починка.
Виден оператор кнопки. По следу сразу понятно, реально ли человек проверяет: доля и глубина правок. Схлопнулись в ноль — пара превратилась в фикцию, пора вмешаться. Без следа вы это заметите только по вылетевшей наружу ошибке.
Защита компании. Перед клиентом, в споре, перед проверяющим можно показать, что человеческий контроль был не на словах. В Европе это движется из «хорошей практики» в требование: для рискованных ИИ-систем закон уже прямо требует и логирование, и человеческий надзор (EU AI Act; сроки применения зависят от типа системы, так что одной датой это лучше не подавать). Даже если вас это напрямую не касается, направление понятное.

Отрезвляющая деталь: по оценкам 2026 года активно контролируется и защищается меньше половины ИИ-агентов в компаниях. Это не значит, что у всех остальных нет вообще никаких логов, но масштаб проблемы с видимостью понятен. Кто наведёт тут порядок раньше, получит преимущество не на хайпе, а на управляемости.

Пример из нашего. В Torgi решения агента и реакции человека пишутся в общее хранилище, а профиль компании (по которому агент отбирает тендеры) меняется только через цепочку «сигнал — предложение — показать разницу — подтверждение человеком — применить — запись». Агент не правит правила сам, у каждого изменения есть автор и история. Это и есть цифровой след в рабочем виде: видно, кто что решил и почему.

Не переборщить. След — это не повод обвесить людей слежкой и протоколами в трёх системах. Тогда люди или перестанут пользоваться ИИ, или начнут халтурить с записями. Принцип: глубина следа под цену ошибки. Где дёшево — минимум, где дорого — подробно. Лучше простой рабочий лог, чем красивая система, которую все саботируют.

Что будет с навыком людей

След нужен не только для ответственности. Он же показывает, чему учить людей и где они перестают понимать работу. А это отдельная проблема, которую замечают поздно, потому что она копится годами.

Если ИИ всегда делает первый проход, через год опытный сотрудник начинает разучиваться делать сам. Это уже не теория: эрозию навыка от чрезмерной опоры на ИИ называют среди главных рисков в исследованиях 2025–2026 годов. Для бизнеса это конкретная потеря: экспертиза, которая жила в людях, уходит, а проверять ИИ в нестандартных случаях становится некому.

Для младших ещё хуже. Опытный хотя бы разучивается — у него был навык. Новичок, который сразу садится на готовый первый проход от ИИ, навык вообще не нарабатывает. Он не проходит нормальную траекторию ошибок, не учится отличать хороший результат от плохого, потому что никогда не видел, как результат собирается руками. Через пару лет это человек, который умеет нажимать «принять», но не умеет понять, что принимает.

Лекарство неприятное, но рабочее: сознательно держать часть работы в ручном режиме, разбирать ошибки, учить на правках, ставить новичка в пару с наставником, а не только с ИИ. И тот самый цифровой след использовать не для наказания, а для обучения: на сохранённых правках видно, что чаще всего идёт не так и где человек теряет понимание.

Что меняется для управления

Если собрать всё вместе, меняется не объём работы человека, а её содержание. И старые способы мерить и нагружать ломаются.

Роль смещается с исполнителя на редактора и решающего. Человек меньше производит и больше проверяет, правит, решает по сложным случаям. Это другая работа и другая усталость: час плотной проверки с постоянным принятием решений выматывает сильнее часа привычного производства. Не заложите это в нагрузку — люди выгорят, а вы не поймёте почему. И честно: это не всегда повышение. Хорошо спроектированная пара делает работу экспертнее, плохо спроектированная — превращает специалиста в дорогую прокладку между ИИ и кнопкой «отправить».

Старые нормы выработки врут. «Менеджер обрабатывает N заявок в день» — это про мир, где он делал их сам. В паре надо заново определить, что считается единицей его работы и сколько он реально может проверить, не скатываясь в кнопку «принять».

Мерить надо исход, а не активность. Не «сколько ответов сгенерировал ИИ» и не «сколько сотрудников имеет доступ», а сколько работы прошло через связку и дало пригодный результат: сколько дошло до клиента без ошибки, сколько принято с правками, сколько вернулось на переделку, сколько спорных случаев ушло человеку.

Нужен хозяин результата и хозяин метрик. Кто-то один отвечает за итог пары, кто-то один следит, что замеры собираются. Без этих двух ролей всё расплывается.

И вопрос, на который надо ответить честно ещё до запуска: куда пойдёт освободившееся время людей. Вариантов по сути четыре — больший объём той же работы, новая работа, повышение качества, или пересмотр штатной модели. Если решения нет, экономия просто растворится в оплачиваемом простое.

С чего начать пробовать

Возьмите один процесс, где проверить дёшево, а сделать дорого, и ошибка заметна. Не самый важный — самый понятный и повторяемый.
Выберите режим осознанно. Почти всегда начинать стоит с режима 2: ИИ делает, человек проверяет всё. Автопилот — потом, когда качество доказано.
Опишите, что такое правильный результат и как его проверять. Не получается — сначала это.
Назначьте хозяина результата и хозяина метрик и дайте проверяющему право останавливать выпуск. Можно одного человека, но явно.
Заведите простой цифровой след с первого дня. Хоть таблицу: что выдал ИИ, что поправили, кто принял.

Что замерять (минимум, всё вытекает из следа):

Доля и глубина правок. Ноль — проверка умерла. Почти всё переписывают — ИИ не справляется с задачей.
Время на проверку одной единицы против времени сделать с нуля. Близко — пара не ускоряет, меняйте режим или задачу.
Качество на выходе: сколько ошибок дошло до клиента по сравнению с тем, как было до ИИ.
Реальное использование: какая доля потока прошла через пару, а не какой процент людей «имеет доступ».

Три месяца такого замера дадут честный ответ, работает связка или её надо перестроить. И, в отличие от красивых презентаций, ответ будет ваш, на ваших данных.

Вместо итога

Вернёмся к отделу из начала, где контроль тихо умер. Там не было ни одного злого умысла: человека посадили в контур, поток шёл, все были заняты. Не было только одного — условий, при которых проверка вообще могла работать.

Их, по сути, четыре. Время, чтобы проверять, а не штамповать. Интерфейс, в котором исправить так же легко, как принять. Полномочия, чтобы остановить выпуск, а не молча пропустить. И след, по которому видно, что проверка реально была.

Уберите хоть одно — и человек в контуре перестаёт быть контролем. Он становится алиби. И стоит при этом как контроль.

Документ подготовлен 5 июня 2026 года.