ИИ становится дорогой инфраструктурой: куда ведут новые тарифы нейросетей

Мы используем разных провайдеров одновременно: ChatGPT, Claude, китайские модели, локальные модели на своём железе. Не потому что хочется всего и сразу, а потому что под разные задачи нужны разные инструменты. И последние месяцы картина меняется быстрее, чем обновляются тарифные страницы.

На этой неделе Anthropic выпустила Claude Fable 5, свою самую сильную модель. На тарифах Pro, Max и Team её открыли бесплатно, но только до 22 июня. С 23-го доступ в подписке переводят на платные кредиты. Обещают вернуть в обычные лимиты, когда хватит мощностей, но даты нет, а обещать можно что угодно.

Сам по себе один тариф — мелочь. Но это не первый такой сигнал, и за ним видно общее движение, которое мы наблюдаем уже не первый месяц: за серьёзную работу с лучшими моделями всё чаще нужно платить отдельно.

Для нас это не жалоба на жадность вендоров и не повод для паники. Это нормальный этап развития рынка. Венчурная модель «сначала субсидируем ради охвата, потом монетизируем» работает ровно так, как и должна. Просто часть людей думали, что всё будет бесплатно ещё долго, а скорее всего, это не так. Дальше разберём, что изменилось за полгода, почему это не случайность, а смена модели, и что мы сами с этим делаем.

Полгода назад и сейчас

Ещё три-четыре месяца назад подписки за 20 долларов хватало на реальную работу: писать, кодить, проверять идеи. Мы на этом тарифе спокойно закрывали daily-задачи. Тариф за 100 долларов давал такие лимиты, что упереться в них было сложно. Бесплатный уровень позволял зайти набросать пару писем или проверить мысль. Доступ к сильному ИИ был дёшев и почти не требовал считать запросы.

Сейчас мы видим другую картину, и не только у западных компаний. За 20 долларов топовую модель можно пощупать: зайти, посмотреть, исчерпать окно. Для потока OpenAI подводит к тарифам за 100 и 200 долларов, и даже там лимиты чувствуются. Бесплатный уровень у большинства стал демо, где счётчик кончается на первой тяжёлой задаче.

Отдельно видно, как меняется ChatGPT. Ещё пару месяцев назад можно было легко взять стартовые месяцы со льготными условиями. Сейчас OpenAI серьёзно ужесточила доступ: верификация через номер телефона, привязка аккаунта, новые правила получения пробного периода. Это не случайная придирчивость, а последовательное закрытие бесплатного входа.

У китайских сервисов вроде GLM ещё недавно лимиты было трудно вычерпать, а сейчас цены выросли, и пятичасовые окна запросов заметно сжались.

На этом фоне относительно уникальным и дешёвым вариантом остаётся DeepSeek: он продаёт не подписку, а доступ по токенам, и цена за токен очень низкая. Сама ситуация показательна. Ещё полгода назад платить за токены казалось бессмысленным, а сейчас народ радуется дешёвым токенам. Это и есть смена парадигмы в действии.

Можно списать на жадность вендоров или временный дефицит мощностей. Но мы смотрим на это иначе: меняется не щедрость компаний, а экономика всей индустрии. Период, когда лучшие модели раздавали почти бесплатно ради охвата и сбора данных, заканчивается. Теперь каждый запрос должен окупать серверные мощности, и это закладывают в цену.

В чём настоящий сдвиг

Модели становятся умнее, а собирать на них продукты — дороже. Раньше экспериментировать без оглядки на счёт мог почти любой: отправить задачу в нейросеть просто посмотреть, что выйдет, ничего не стоило. Сейчас каждый запрос к флагманской модели в API стоит ощутимых денег, а в подписке упирается в лимит.

Для нас как для команды, которая строит AI-продукты, это значит простую вещь: дешёвый доступ к верхнему уровню закрывается. Без вложений, пусть небольших, бесконечно кодить или крутить задачи на сильнейших моделях уже не получится. Меняются не лимиты, меняется сама экономика работы с ИИ.

При этом цена токена как таковая падает. По данным на начало 2026 года, blended-цена за миллион токенов упала примерно на две трети за год. Но общий счёт растёт, потому что потребление растёт быстрее. Это классический эффект Джевонса: ресурс дешевеет, используют больше, совокупные расходы растут. ИИ не становится дороже за единицу, он становится дороже в эксплуатации.

Почему это не случайность

Если смотреть не на один тариф Anthropic, а на совокупность факторов, становится понятно: это не заговор вендоров и не временный дефицит. Это несколько тектонических сдвигов, которые сошлись в одной точке.

Железо стоит денег. Инференс на масштабе требует чипов, дата-центров, энергии, охлаждения. Гиперскейлеры в 2026 году вкладывают в инфраструктуру сотни миллиардов долларов. Эти вложения кто-то должен окупать, и счёт в конечном итоге приходит пользователю.

Обучение новых моделей дорожает. Новых качественных данных для тренировки всё меньше, а каждое следующее поколение моделей требует на порядок больше ресурсов, чем предыдущее. Бесплатно раздавать результат такой работы становится экономически неразумно.

Растут зарплаты AI-специалистов. Спрос на людей, которые умеют обучать и обслуживать модели, опережает предложение. Это закладывается в стоимость продукта.

Спрос превышает мощности. Пользователей и запросов больше, чем серверов. Когда ресурс дефицитен, он дорожает, и это работает в любой индустрии.

Венчурная модель выходит на окупаемость. ChatGPT, Claude и подобные проекты с первого дня работали по классической венчурной схеме: первые годы субсидируют доступ ради охвата и сбора данных, затем постепенно включают монетизацию. То, что мы видим сейчас, не поломка, а переход ко второй фазе. Для нас это было ожидаемо.

Сумма этих факторов означает, что тренд не развернётся через месяц. Это не временное ужесточение, а вход в другую экономическую модель индустрии.

Куда это идёт

Если смотреть на движение в целом, а не на отдельные тарифы, вырисовываются несколько линий.

Бесплатное окно стало пробником. Время, когда компании раздавали дешёвый доступ ради охвата, заканчивается. Дальше каждый запрос к сильной модели будет влиять на чей-то счёт: либо пользователя, либо провайдера, который заложит это в цену подписки.

Доступ расслаивается по деньгам. Базовые и прошлогодние модели остаются в дешёвых тарифах как удобные помощники. Лучший уровень всё чаще доступен только за отдельную плату: кредиты, дорогие тарифы, API. Это не временное неудобство, а формирование двухъярусного рынка: массовый ИИ и профессиональный ИИ с разной экономикой.

Случайный промпт стал стоить денег. Стратегия «закину задачу, вдруг сработает» на флагманских моделях становится невыгодной. Инструмент перестаёт быть полигоном для бесплатных проб. Это меняет поведение: считать, на что идёт запрос, приходится заранее.

Оркестрирование моделей становится навыком. Когда верхний уровень стоит денег, а базовые модели дёшевы, умение понимать, какую модель для чего использовать, перестаёт быть технической деталью и становится прямым конкурентным преимуществом. Не забивать гвоздь микроскопом: рутину закрывает дешёвая базовая модель, сильная подключается только там, где она действительно нужна. Это не экономия ради экономии, а грамотное управление ресурсом.

Доступ к лучшим моделям превращается в статью расходов. Дальше выигрывает не тот, у кого открыта самая сильная модель, а тот, кто понимает, где она действительно нужна, а где рутину закроет дешёвая базовая.

Что мы с этим делаем

Для нас это не теория. Часть наших проектов сознательно идёт на локальные модели и on-prem, и не потому что мы против облака, а потому что на объёме предсказуемая стоимость важнее доступа к самой сильной модели.

Paker, наша локальная база знаний для сотрудников, и Rubi, AI-решения для производственных компаний, работают на своём железе клиента. Данные не покидают контур компании, и нет счёта за токены, который растёт с каждым запросом. Это архитектурное решение, принятое с оглядкой на тот самый тренд: стоимость инференса на потоке съедает экономию, если не закладывать её в архитектуру с первого дня.

В других проектах мы считаем стоимость операции, а не подписки. Сколько стоит один разобранный тендер (Torgi). Один подготовленный комплект документов (ПТО). Одна обработанная визуализация (Charmonye). И что происходит с этой стоимостью, когда поток растёт. Без такой арифметики легко попасть в ситуацию, где прототип дёшев, демо впечатляет, а эксплуатация на объёме съедает всю экономию. Мы про это уже писали отдельно.

Вывод не в том, что ИИ стал слишком дорогим. Он стал по-другому дорогим. Раньше дорого было войти и попробовать. Теперь дёшево попробовать, но дорого работать на потоке. Кто считает стоимость операции, а не стоимость подписки, видит это раньше и закладывает в архитектуру, а не в экстренный бюджет.

Вместо итога

Когда мы только начинали плотно работать с ИИ, вопрос был «какую модель взять». Сейчас вопрос сменился: «сколько будет стоить одна операция на объёме, и какая модель для неё достаточна». Это не временный перекос тарифов и не повод для паники. Это нормальный вход индустрии в другую экономическую модель. Считать её приходится заранее, и это уже часть работы, а не фон.