RAG в offshore-индустрии: 1 ТБ данных, 4 провала и 184 евро аренды GPU

Инженер Andros Fenollosa опубликовал подробный разбор построения внутреннего RAG-сервиса для компании из offshore-индустрии. Внутри: локальная LLM, база...

Дата загрузки:02.06.2026 11:09:38

RAG в offshore-индустрии: 1 ТБ данных, 4 провала и 184 евро аренды GPU

02.06.2026
RAG в offshore-индустрии: 1 ТБ данных, 4 провала и 184 евро аренды GPU

Инженер Andros Fenollosa опубликовал подробный разбор построения внутреннего RAG-сервиса для компании из offshore-индустрии. Внутри: локальная LLM, база технической документации и проектов почти за десять лет, требование давать ответы со ссылками на первоисточники.

Кейс интересен не тем, что RAG собрали, а тем, на каких этапах система ломалась и во что в итоге превратилась архитектура.

Старт: стандартная связка

Начальная связка выглядела стандартно: Локальная модель — Ollama Эмбеддинги — nomic-embed-text Оркестратор — LlamaIndex Язык — Python

На прототипе из небольшого набора документов все работало за пару недель. Проблемы начались при столкновении с реальными данными — 1 ТБ разнородного контента без структуры: технические отчеты, регламенты, CSV, видео, симуляции, бэкапы, архивы.

Провал 1: память

 Проблема: LlamaIndex пытался обрабатывать все подряд, включая многогигабайтные видео и файлы симуляций, загружая их в RAM как текст.

 Решение: агрессивный фильтр на уровне пайплайна:

исключение по расширениям и паттернам имён (видео, исполняемые файлы, архивы, бэкапы, временные файлы, почтовые архивы), отказ от индексации CSV и JSON

Результат: сокращение набора на 54% и стабильная обработка без переполнения памяти.

Провал 2: масштаб индексации

Проблема: дефолтное хранение индекса в JSON-файле на диске не выдерживало сотен гигабайт. Любой перезапуск означал переиндексацию с нуля, checkpoint-механика давала повреждённые данные.

Решение: переход на выделенную векторную БД — ChromaDB поверх SQLite. Индексация превратилась из монолитного процесса в пакетный пайплайн по 150 файлов, с чекпоинтами и устойчивостью к сбоям.

Результат: 738 470 векторов, 54 ГБ индекса из исходных 451 ГБ документов.

Провал 3: железо

Проблема: на интегрированной графике обработка 500 МБ занимала 4–5 часов.

Решение: аренда виртуальной машины с NVIDIA RTX 4000 SFF Ada на 20 ГБ VRAM.

Результат: полная индексация заняла от 2 до 3 недель, счет за аренду — 184 евро, после этого SQLite-файл ChromaDB просто скопировали на production-сервер.

Провал 4: хранение

Проблема: production-VM имела 100 ГБ диска, тогда как исходные документы занимали около 500 ГБ.

Решение: оригиналы оставили в Azure Blob Storage, ссылки в ответах LLM формируются через SAS-токены для прямой загрузки пользователем из облака на локальном диске остались только индекс (54 ГБ), сама модель (10 ГБ) и легкие бэкенд и фронтенд на Flask и Streamlit

Ключевой вывод автора

Если исходные данные недостаточно качественные, никакая LLM не компенсирует этого в ответах.

Этот тезис хорошо согласуется с практикой: в production-RAG основная инженерная работа приходится не на выбор модели или фреймворка, а на: фильтрацию источников, нормализацию форматов, устойчивый пайплайн индексации, разделение слоев хранения (векторный индекс vs оригинальные документы).

Архитектурные решения здесь диктуются не возможностями LLM, а ограничениями памяти, диска, GPU и экономикой облачной аренды.

Что важно вынести из кейса

Кейс полезен тем, что показывает реальную дистанцию между демо-RAG на ноутбуке и сервисом, с которым ежедневно работают инженеры.

Эта дистанция измеряется не качеством модели, а дисциплиной работы с данными и инфраструктурой.


По материалам телеграм-канала

Новости госзаказа

02.06.2026
Решением Совета ЕЭК от 27.04.2026 55 внесены изменения в Правила определения страны происхождения отдельных видов товаров для целей государственных и муниципальных закупок.Ключевые изменения коснулись волоконно-оптических кабелей (ТН ВЭД ЕАЭС 8544 70 000 0). Для признания такой продукции происходящей из государства — члена ЕАЭС установлены дополнительные требования к локализации производства.В частности, производитель должен иметь права на техническую документацию сроком не менее пяти лет. Также...
02.06.2026
Требования медосмотра внешних пилотов БВС изменили.
Минтранс утвердил изменения в правила медосмотра внешних пилотов БВС, они вступят в силу уже 1 сентября 2026 года. И ключевым нововведением станет смягчение требований к состоянию здоровья специалистов, что должно помочь ветеранам СВО получить новую работу. В Росавиации говорят, что новые правила исключают ряд обязательных медицинских обследований для внешних пилотов, упрощают процедуру получения допуска к работе, а также увеличивают срок действия медицинского заключения 3 класса до 60 месяцев...
02.06.2026
Потребители перешли в режим экономии.
В Москве розничный товарооборот (РТО) в I кв. 2026 года, год к году, в реальных ценах уменьшил долю на 1 п.п. В других крупных и «денежных» (с доходами выше среднего по стране) просадка ещё не так сильно выражена, как в Москве, но уже заметна. «Потребители наращивают сбережения, тратят неохотно», - резюмируют авторы исследования. (данные – «Тенденции и вызовы ритейла», InfoLine, май 2026)
02.06.2026
Первую на материковой части России роботизированную буровую запустила «Газпром нефть» на Чонской группе месторождений в Восточной Сибири
Роботизированный комплекс в составе буровой установки проводит сборку, разборку, спуск и подъем бурильных и обсадных колонн без участия человека. Внедрение этой технологии ускоряет строительство скважин на треть, исключает тяжёлый ручной труд и повышает уровень промышленной безопасности.Как отметил Владимир Крупеников, гендиректор «Газпромнефть-Заполярья», роботизация строительства скважин – это часть масштабной программы «Газпром нефти» по цифровизации производственных процессов. «Она поможет повысить...
02.06.2026
Секретная технология
Возможность лазерного излучения была предсказана Альбертом Эйнштейном ещё в 1916 году, но физикам всего мира понадобилось почти полвека, чтобы воплотить теоретические озарения гения в реально работающие устройства.Первый в СССР рубиновый лазер построили в ленинградском Государственном оптическом институте им. С.И. Вавилова Министерства оборонной промышленности. Отчёты о работе «оптического квантового генератора», как называли это устройство в официальных документах, скрупулёзно зафиксировали все...
02.06.2026
Турция начала переговоры с Россией о поставках газа после 2026 года
Турция и Россия обсуждают продление соглашений о поставках природного газа после 2026 года, поскольку срок действия текущих соглашений истекает в конце года.Турецкая госкомпания Botas ведет переговоры с ПАО «Газпром» о продлении импортных контрактов, сообщил министр энергетики Турции Алпарслан Байрактар. По его словам, потенциальные объемы и сроки еще не согласованы.В декабре Анкара продлила два контракта с «Газпромом» на получение газа по газопроводам «Турецкий поток» и «Голубой поток». Турция...
02.06.2026
Итоги мониторинга закупок Челябинской области за 2025 год
Министерством имущества Челябинской области проведен мониторинг региональных закупок за 2025 год и подготовлен сводный аналитический отчет Закупки для обеспечения государственных нужд осуществляли - 399 заказчиков (из них исполнительных органов – 36, подведомственных организаций – 363).Закупки для обеспечения муниципальных нужд осуществляли - 3 326 заказчиков.В 2025 году объем конкурентных закупок в регионе составил более 151 млрд рублей.Опубликовано 52 160 извещений о закупке (в 2024 - 60 812...
02.06.2026
«Золотой кинжал Аанепадды, царя Первой династии Ура и царя Киша, найденный в его гробнице в царском некрополе Ура, ок. 2350 г. до н.э.»
Увидел в сети не слишком качественное музейное фото этого артефакта с такой подписью. Первое впечатление: невероятная сохранность кинжала из чистого золота с рукоятью из лазурита — почти 4,5 тысячи лет, да ещё и привязка к конкретному царю: найден в его гробнице! Чуть покопавшись, нашёл более качественные снимки (приведённые мной) и заодно разузнал подробности об артефакте. Увы, это лишь реплика — оригинал хранится в Национальном музее Ирака в Багдаде. В оправдание добавлю: это очень качественная...
02.06.2026
В Британии провалилась железнодорожная реформа и передача бизнеса частным компаниям, которую провела "железная" Маргарет Тэтчер
Теперь компании национализируют и строят свой РЖД. В воскресенье GTR стала пятым оператором, перешедшим в государственную собственность при правительстве, вслед за c2c, Greater Anglia, South Western Railway и West Midlands TrainsКомпании LNER, Northern, Southeastern и TransPennine Express уже были национализированы, когда к власти пришла лейбористская партия. Она в своей предвыборной программе 2024 года пообещала передать все пассажирские перевозки под государственный контроль.Следующими компаниями...

Смотрите, читайте, критикуйте