RagFlow — open-source RAG engine для работы с документами. Он фокусируется на качественном разборе файлов, построении knowledge base и ответах с цитатами. О RagFlow говорят потому, что RAG по PDF и таблицам часто ломается не на модели, а на подготовке данных. Документы содержат таблицы, заголовки, колонки, сканы, сложную верстку и длинные вложенные фрагменты. RagFlow пытается закрыть именно эту боль. В статье разберём, как он работает, где полезен и как подключить модели через SpeShu.AI.Documentation Index
Fetch the complete documentation index at: https://speshu.ai/docs/llms.txt
Use this file to discover all available pages before exploring further.
Что такое ragflow
RagFlow — это self-hosted платформа для Retrieval-Augmented Generation. Она помогает загрузить документы, распарсить их, построить базу знаний, задать вопрос и получить ответ с опорой на источники. Инструмент нужен компаниям, которые работают с PDF, договорами, инструкциями, регламентами, таблицами, презентациями и техническими документами. RagFlow ближе к готовому продукту, чем к библиотеке. Его обычно запускают как сервис, настраивают knowledge base и подключают пользователей через UI или API.Как работает ragflow
Типовой пайплайн:- загрузка документа;
- parsing и extraction структуры;
- chunking;
- embeddings;
- indexing;
- retrieval;
- генерация ответа с цитатами.
Что умеет ragflow
- создавать knowledge base по документам;
- работать с PDF, таблицами и текстовыми файлами;
- давать ответы с цитатами;
- подключать LLM и embedding-модели;
- запускаться self-hosted;
- предоставлять UI для настройки;
- помогать строить корпоративный Q&A.
ragflow на практике
Практический workflow для базы знаний:- Разверните RagFlow по официальной self-hosted инструкции.
- Создайте knowledge base.
- Загрузите PDF, таблицы или документы.
- Проверьте, как RagFlow нарезал документ на chunks.
- Добавьте OpenAI-compatible LLM provider:
| Поле | Значение |
|---|---|
| API Key | <SPESHU_AI_API_KEY> |
| Base URL | https://speshu.ai/api/v1 |
| Chat model | openai/gpt-5.5 |
| Embedding model | text-embedding-3-large |
- Задайте тестовые вопросы, на которые точно есть ответы в документах.
- Проверьте не только текст ответа, но и citations.
Преимущества и недостатки ragflow
Плюсы:- фокус на документах и citations;
- self-hosted подход;
- удобен для PDF-heavy задач;
- подходит для корпоративных knowledge base.
- тяжелее простой библиотеки;
- требует настройки инфраструктуры;
- качество зависит от parsing и структуры документов.
ragflow vs альтернативы
RagFlow vs Dify: Dify шире как платформа AI-приложений и workflow. RagFlow сильнее сфокусирован на RAG по документам. RagFlow vs LlamaIndex: LlamaIndex — кодовый framework. RagFlow — более готовый сервис с UI. RagFlow vs Flowise: Flowise визуально собирает flow. RagFlow больше про ingestion, parsing и knowledge base с цитатами.Кому подойдёт ragflow
RagFlow подойдёт компаниям с большим количеством документов, юристам, поддержке, техническим командам, аналитикам и self-hosted пользователям. Если у вас много PDF и важны ссылки на источники, RagFlow стоит тестировать раньше универсальных no-code конструкторов.Как попробовать ragflow через SpeShu.AI
SpeShu.AI закрывает доступ к LLM и embeddings:- не нужен VPN;
- не нужна зарубежная карта;
- доступны разные модели;
- один интерфейс для chat и embeddings;
- быстрый старт через speshu.ai/profile.
text-embedding-3-large и chat-модель из каталога.
