Минимальные потери в переходе на открытые модели

Andrew Marble размышляет о начале своей миграции с закрытых моделей (Claude, GPT) на открытые LLM из-за расширения требований к ID-верификации в Claude. Он проводит параллель с переходом на Linux в начале 2000-х, когда это казалось риском из-за несовместимости и худшей экосистемы. Тогда это было настоящей жертвой, но сейчас Linux и открытое ПО конкурируют, а разрыв сократился. С LLM-моделями ситуация похожа: открытые модели отстают от закрытых на несколько месяцев, а не на годы, как раньше. Claude и GPT ещё впереди на лидербордах, но открытые модели (особенно MIT-лицензированные, как текущие лидеры) становятся всё ближе.

Нас мешает приватность и доверие. Claude Code работает из коробки, API OpenAI и Anthropic считаются надёжными. Открытые модели либо надо запускать локально (дорого и сложно), либо использовать через third-party сервисы вроде OpenRouter, которых Marble не доверяет с конфиденциальными данными клиентов. Но в технической работе, если нужна общая продуктивность с Office и ассоциированными инструментами, потеря в скорости может быть незначительна. Это не то же самое как переход от Matlab на GNU Octave в исследовании, который был шокирующим. Marble полагает, что начало пробовать.

Ключевые факты

  • Разрыв между открытыми моделями и фронтьерными (Claude, GPT) за последние месяцы сократился с годов до нескольких месяцев отставания.
  • Закрытые модели остаются впереди на лидербордах на 21 июня 2026, но открытые модели в MIT-лицензии (Llama, Mistral и другие) становятся убедительнее.
  • Главная проблема не в производительности, а в приватности и экосистеме: Claude/GPT предоставляют удобные API и кажутся надёжными, открытые требуют либо локального хостинга (дорого), либо third-party сервисов (рисков с конфиденциальными данными).
  • ID-верификация в Claude и новые «safeguards» мотивируют разработчиков искать альтернативы, даже если они немного медленнее.
  • Экосистема открытых моделей стала зрелее: есть инструменты, есть харнессы, наконец есть weight выпуски лицензированные permissively (MIT вместо NC).

Ред. Триггером миграции стала не производительность, а просьба показать паспорт. Разрыв в качестве сжался до месяцев как раз вовремя, чтобы это стало уважительной причиной уйти.

Почему это важно

Это переломный момент для индустрии. Если топовый инженер-разработчик выбирает открытые модели вопреки удобству, это сигнал, что ставки доверия и контроля перевешивают производительность. Это означает, что граница между фронтьерными и открытыми моделями может стать политической, а не технической: компании, которые требуют верификацию или больше контроля, рискуют потерять пользователей, которым нужна приватность или независимость. Для разработчиков это означает, что пробовать открытые модели больше не авантюра, а разумный выбор.

Ред. Если граница между открытыми и закрытыми моделями становится политической, а не технической, проигрывает не та модель, что слабее, а та, что требует больше документов на входе.

Кому это важно

Инженерам, которые работают с конфиденциальными корпоративными данными и не могут отправлять их в закрытые API-сервисы. Компаниям, которые боятся lock-in на одного провайдера. Разработчикам в странах с строгой регуляцией на приватность данных (ЕС, Россия и т.д.). Стартапам, которые строят приватные LLM-приложения и не хотят зависимость от API. Также людям, которые принципиально против требований ID-верификации.

Ред. Тем, кто не может выгрузить данные клиента в чужой API, и тем, кого бесит верификация по ID. Иронично, что бегство от слежки часто ведёт прямиком в third-party вроде OpenRouter.

Как это применить

Первый шаг: оценить, какие именно задачи требуют абсолютно топовых моделей, а какие могут работать на открытых вроде Mistral или Llama. Часто это классификация, извлечение информации, код, открытые модели справляются хорошо. Для сложных аналитических задач может потребоваться топ-модель, но часто можно улучшить промпт или использовать режим со многими вызовами вместо одного идеального. Локальный хостинг дорогой, но есть облачные опции вроде Together AI или других, которые дешевле своих закрытых конкурентов.

Ред. Совет «оцените, где реально нужна топ-модель» здравый, но именно этой оценкой большинство и не занимается, пока подписка работает из коробки. Локальный хостинг по-прежнему дорог.

Можно ли доверять

Andrew Marble, разработчик с опытом (он использовал LLM-модели с самых первых дней, ещё со времени Llama leak). Его аргумент консервативен: он не утверждает, что открытые модели лучше, только что разрыв перестал быть трагичным. Параллель с Linux исторически верна. Однако это личный опыт одного человека, а не собранная статистика по использованию моделей.

Ред. Это один инженер с честным тезисом «не лучше, просто разрыв перестал быть трагедией», а не статистика. Аналогия с Linux красива, но Linux побеждал десятилетиями, а тут обещают «несколько месяцев».

Риски и подводные камни

Открытые модели все ещё требуют либо локального хостинга (медленнее, дороже при масштабировании), либо third-party API с неизвестным уровнем приватности. Никакой гарантии, что данные не будут сохранены или проанализированы компанией-хостером. Локальный хостинг может быть недостаточно быстрым для интерактивных приложений. Также нужно помнить, что Marble говорит о tech job с общей работой, но специфичные задачи могут требовать лучших моделей.

Ред. Меняешь одно доверие на другое: вместо «Anthropic хранит мой запрос» получаешь «а что хранит хостер OpenRouter». Приватность тут не достигается, а перекладывается на менее известного посредника.

«Это не отступление как Linux vs Windows 2008 года, это намного ближе. Я жду, что продуктивность упадёт немного, но не думаю это будет deal-breaker»

— Andrew Marble, 'There is minimal downside to switching to open models'