RAG в offshore-индустрии: 1 ТБ данных, 4 провала и 184 евро аренды GPU

Инженер Andros Fenollosa опубликовал подробный разбор построения внутреннего RAG-сервиса для компании из offshore-индустрии. Внутри: локальная LLM, база...

Дата загрузки:02.06.2026 11:09:38

02.06.2026

Инженер Andros Fenollosa опубликовал подробный разбор построения внутреннего RAG-сервиса для компании из offshore-индустрии. Внутри: локальная LLM, база технической документации и проектов почти за десять лет, требование давать ответы со ссылками на первоисточники.

Кейс интересен не тем, что RAG собрали, а тем, на каких этапах система ломалась и во что в итоге превратилась архитектура.

Старт: стандартная связка

Начальная связка выглядела стандартно: Локальная модель — Ollama Эмбеддинги — nomic-embed-text Оркестратор — LlamaIndex Язык — Python

На прототипе из небольшого набора документов все работало за пару недель. Проблемы начались при столкновении с реальными данными — 1 ТБ разнородного контента без структуры: технические отчеты, регламенты, CSV, видео, симуляции, бэкапы, архивы.

Провал 1: память

Проблема: LlamaIndex пытался обрабатывать все подряд, включая многогигабайтные видео и файлы симуляций, загружая их в RAM как текст.

Решение: агрессивный фильтр на уровне пайплайна:

исключение по расширениям и паттернам имён (видео, исполняемые файлы, архивы, бэкапы, временные файлы, почтовые архивы), отказ от индексации CSV и JSON

Результат: сокращение набора на 54% и стабильная обработка без переполнения памяти.

Провал 2: масштаб индексации

Проблема: дефолтное хранение индекса в JSON-файле на диске не выдерживало сотен гигабайт. Любой перезапуск означал переиндексацию с нуля, checkpoint-механика давала повреждённые данные.

Решение: переход на выделенную векторную БД — ChromaDB поверх SQLite. Индексация превратилась из монолитного процесса в пакетный пайплайн по 150 файлов, с чекпоинтами и устойчивостью к сбоям.

Результат: 738 470 векторов, 54 ГБ индекса из исходных 451 ГБ документов.

Провал 3: железо

Проблема: на интегрированной графике обработка 500 МБ занимала 4–5 часов.

Решение: аренда виртуальной машины с NVIDIA RTX 4000 SFF Ada на 20 ГБ VRAM.

Результат: полная индексация заняла от 2 до 3 недель, счет за аренду — 184 евро, после этого SQLite-файл ChromaDB просто скопировали на production-сервер.

Провал 4: хранение

Проблема: production-VM имела 100 ГБ диска, тогда как исходные документы занимали около 500 ГБ.

Решение: оригиналы оставили в Azure Blob Storage, ссылки в ответах LLM формируются через SAS-токены для прямой загрузки пользователем из облака на локальном диске остались только индекс (54 ГБ), сама модель (10 ГБ) и легкие бэкенд и фронтенд на Flask и Streamlit

Ключевой вывод автора

Если исходные данные недостаточно качественные, никакая LLM не компенсирует этого в ответах.

Этот тезис хорошо согласуется с практикой: в production-RAG основная инженерная работа приходится не на выбор модели или фреймворка, а на: фильтрацию источников, нормализацию форматов, устойчивый пайплайн индексации, разделение слоев хранения (векторный индекс vs оригинальные документы).

Архитектурные решения здесь диктуются не возможностями LLM, а ограничениями памяти, диска, GPU и экономикой облачной аренды.

Что важно вынести из кейса

Кейс полезен тем, что показывает реальную дистанцию между демо-RAG на ноутбуке и сервисом, с которым ежедневно работают инженеры.

Эта дистанция измеряется не качеством модели, а дисциплиной работы с данными и инфраструктурой.

Источник телеграм канала

Новости госзаказа

Красноярское УФАС включило ООО «ТК Олмал» в реестр недобросовестных поставщиков за непоставку ГСМ

21.07.2026

Комиссия Красноярского УФАС России приняла решение включить ООО «ТК Олмал» и его директора в реестр недобросовестных поставщиков сроком на два года.Основанием стало обращение МКУ «Служба заказчика» Назаровского муниципального округа: ООО «ТК Олмал» в одностороннем порядке отказалось от исполнения контракта на поставку горюче‑смазочных материалов через АЗС по талонам и топливным картам в 2026 году. С 5 июня 2026 года компания прекратила отпуск оплаченного топлива — из заранее оплаченного топлива...

Стратегический нефтяной резерв США сейчас находится на самом низком уровне с апреля 1983 года. За последние 5 лет объем резерва сократился на 305 миллионов баррелей (снижение на 49%)

21.07.2026

Шринкфляция добралась и до премиум класса - за 10 лет, новостройки "потеряли" одну комнату.

21.07.2026

Шринкфляция добралась и до премиум класса - за 10 лет, новостройки "потеряли" одну комнату.Средняя площадь квартир в бизнес- и премиум- классе за 10 лет сократилась с 82,7 до 61,8 квадратных метра. Застройщики объясняют это ростом себестоимости работ.По оценке аналитиков, при сохранении текущего тренда, многокомнатные квартиры, которые уже покинули эконом сегмент, окончательно пропадут даже из бизнес-класса - и переместятся в премиум.

Правда поведение Персея на росписи сосуда несколько озадачивает: ведь согласно мифу всё было ровно наоборот.

21.07.2026

Прямо слышу бравурную музыку, которую лихо играет тапер за пианино на сеансе черно-белого немого кино. Правда поведение Персея на росписи сосуда несколько озадачивает: ведь согласно мифу всё было ровно наоборот. Он подкрался к безмятежно спящей Медузе Горгоне, обезглавил её, а потом очень быстро сделал ноги, спасаясь от свирепой ярости её сестер.Ну и между нами, лично мои симпатии всегда были на стороне Медузы. Посейдон изнасиловал красавицу Медузу прямо в храме Афины; это так разозлило богиню,...

Саудовская Аравия теперь заблокирована с двух сторон - да и не только она, судоходство через Суэцкий Канал снова под угрозой.

21.07.2026

Саудовская Аравия теперь заблокирована с двух сторон - да и не только она, судоходство через Суэцкий Канал снова под угрозой. маркетплейс ГОСФИНТЕХ - https://electrostal.gosfintech.ru - независимые банковские гарантии и кредиты на исполнение госконтракта

#ПамятиДипломатов

21.07.2026

В рамках серии «История российской дипломатии» АО «Марка» инициировало выпуск в обращение государственного знака почтовой оплаты, посвящённого 350-летию со дня рождения российского государственного деятеля и дипломата Бориса Ивановича Куракина.В плеяде петровских дипломатов #Куракин занимал одно из первых мест. Многие современники отмечали его высокую эрудицию и трудолюбие. Борис Иванович оставил огромное документальное наследие: обширную дипломатическую и деловую переписку, «протоколы посольств»...

Госдума готовит законопроект, запрещающий критикующим власть из-за рубежа россиянам совершать целый ряд действий, включая осуществление переводов и запрет на консульские услуги.

21.07.2026

Чиновники предлагают следующие ограничения против россиян, которые обвиняются по статьям КоАП об иноагентах, дискредитации армии, участии в деятельности нежелательной организации и призывах к нарушению территориальной целостности РФ:- Запрет на посещение банков и осуществление денежных переводов. - Остановка регистрации прав на недвижимость и транспортные средства. - Прекращение срока действия водительских прав. - Невозможность регистрироваться ИП и самозанятым. - Отказ в выполнении консульских...

В России предложили заморозить утилизационный сбор

21.07.2026

Депутаты фракции ЛДПР в Госдуме предложили заморозить утилизационный сбор на автомобили до 1 января 2030 г."С каждым годом утильсбор становится только выше: с 1 января 2026 г. ставки снова выросли на 10-20%. Кроме того, чем выше мощность и объем двигателя автомобиля, тем он больше. В результате некоторые модели подорожали на 1-1,5 млн руб. после уплаты всех сборов по новым правилам", — цитирует пресс-служба ЛДПР главу партии Леонида Слуцкого.В конце 2025 года президент Владимир Путин высказался...

Первопроходец космоса

21.07.2026

Михаил Хомяков вошёл в историю как создатель первых космических аппаратов — его «Спутник-1» стал первым в истории искусственным спутником Земли, а «Восток» впервые облетел Землю с человеком на борту.Другие проекты Хомякова — космические корабли серий «Союз» и «Прогресс», орбитальные станции «Салют» — по достоинству считаются гордостью отечественной космической школы.Научные открытия и инженерные решения конструктора были отмечены Ленинской премией, орденами и медалями.маркетплейс ГОСФИНТЕХ - https...

Казахстан требует осуждения атак на танкеры с нефтью - позиция МИД РК

21.07.2026

После атаки БПЛА на танкеры «ASIA» и «NISSOS IOS» в терминале КТК, министерство иностранных дел РК выступило с жестким заявлениемНарушение договоренностей: Атакующие намеренно проигнорировали механизм обмена информацией о гражданских судах, что поставило под угрозу жизни экипажейЗащита интересов: Казахстан оставляет за собой право добиваться возмещения ущерба и использовать все механизмы международного права для защиты своих интересовПризыв к партнерам: Официальная Астана требует немедленно прекратить...

RAG в offshore-индустрии: 1 ТБ данных, 4 провала и 184 евро аренды GPU

RAG в offshore-индустрии: 1 ТБ данных, 4 провала и 184 евро аренды GPU

Новости госзаказа

Смотрите, читайте, критикуйте