Перейти к основному содержанию

Documentation Index

Fetch the complete documentation index at: https://speshu.ai/docs/llms.txt

Use this file to discover all available pages before exploring further.

Qdrant Vector Store — open-source vector database и vector search engine. Его используют для RAG, semantic search, рекомендаций, поиска похожих объектов и хранения embeddings с metadata. О Qdrant говорят потому, что он прост в запуске, даёт понятный API и хорошо подходит для production vector search. В RAG-системах он отвечает за быстрый поиск релевантных chunks перед вызовом LLM. В статье разберём, как работает Qdrant и как создать embeddings через SpeShu.AI.

Что такое qdrant vector store

Qdrant — это база данных для vectors. Вы создаёте collection, задаёте размерность и distance metric, загружаете points с vector и payload, а затем выполняете similarity search. Инструмент нужен backend-разработчикам, AI-стартапам, поисковым командам и компаниям, которые строят RAG по документам, товарам, тикетам или знаниям. Payload позволяет хранить рядом с vector полезные поля: текст chunk, document_id, org_id, timestamp, category, права доступа.

Как работает qdrant vector store

Пайплайн:
  • документ разбивается на chunks;
  • embedding model создаёт vector;
  • Qdrant сохраняет vector и payload;
  • вопрос пользователя превращается в query vector;
  • Qdrant возвращает top-k похожих points;
  • LLM получает контекст и отвечает.
Qdrant поддерживает HNSW indexing, фильтры, payload, quantization и разные SDK. Для SpeShu.AI вы создаёте embeddings через /embeddings, а Qdrant хранит результат.

Что умеет qdrant vector store

  • хранить vectors и payload;
  • выполнять semantic search;
  • фильтровать по metadata;
  • работать локально, self-hosted или в cloud;
  • поддерживать разные клиенты;
  • использовать quantization;
  • строить RAG и recommendation systems.
Мини-кейсы: поиск по базе знаний, похожие товары, похожие тикеты, semantic search по статьям, RAG для поддержки.

qdrant vector store на практике

Пример ниже создаёт in-memory Qdrant collection, получает embeddings через SpeShu.AI и выполняет поиск.
import os
from openai import OpenAI
from qdrant_client import QdrantClient
from qdrant_client.models import Distance, PointStruct, VectorParams

openai = OpenAI(
    base_url="https://speshu.ai/api/v1",
    api_key=os.environ["SPESHU_AI_API_KEY"],
)

texts = [
    "Qdrant хранит embeddings и payload для vector search.",
    "RAG использует поиск по документам перед ответом LLM.",
]

vectors = openai.embeddings.create(
    model="text-embedding-3-large",
    input=texts,
).data

client = QdrantClient(":memory:")
client.create_collection(
    collection_name="docs",
    vectors_config=VectorParams(size=3072, distance=Distance.COSINE),
)

client.upsert(
    collection_name="docs",
    points=[
        PointStruct(
            id=i,
            vector=item.embedding,
            payload={"text": text},
        )
        for i, (item, text) in enumerate(zip(vectors, texts))
    ],
)

query_vector = openai.embeddings.create(
    model="text-embedding-3-large",
    input="Как хранить embeddings для RAG?",
).data[0].embedding

hits = client.search(
    collection_name="docs",
    query_vector=query_vector,
    limit=2,
)

for hit in hits:
    print(hit.payload["text"], hit.score)
В production используйте постоянный Qdrant server, payload-фильтры по пользователю/организации и idempotent обновление points.

Преимущества и недостатки qdrant vector store

Плюсы:
  • быстрый и понятный vector search;
  • хороший Python SDK;
  • payload-фильтры;
  • self-hosted и cloud варианты;
  • подходит для production RAG.
Минусы:
  • нужно сопровождать отдельное хранилище;
  • качество поиска зависит от embeddings и chunking;
  • schema и payload нужно проектировать заранее.

qdrant vector store vs альтернативы

Qdrant vs Chroma: Chroma проще для локального MVP. Qdrant лучше для production, фильтров и нагрузки. Qdrant vs Weaviate: Weaviate богаче встроенными модулями. Qdrant часто выбирают за простоту, скорость и API. Qdrant vs Pinecone: Pinecone managed-first. Qdrant можно удобно self-hosted.

Кому подойдёт qdrant vector store

Qdrant подойдёт backend-командам, AI-продуктам, корпоративным knowledge base, e-commerce, поддержке и поисковым сервисам. Если RAG должен обслуживать пользователей и обновляемые данные, Qdrant — один из самых практичных вариантов.

Как попробовать qdrant vector store через SpeShu.AI

SpeShu.AI закрывает создание embeddings и генерацию ответа:
  • не нужен VPN;
  • не нужна зарубежная карта;
  • один ключ для chat и embeddings;
  • доступ к нескольким моделям;
  • быстрый старт через speshu.ai/profile.
Создавайте embeddings через endpoint, храните их в Qdrant и передавайте найденный контекст в Chat Completions.

Заключение

Qdrant Vector Store — сильный выбор для RAG-поиска, где важны скорость, payload и self-hosted контроль. Главный инсайт: vector DB не исправит плохие chunks, но даст прочную основу для retrieval.

Подключить API

Запустите интеграцию через SpeShu.AI: единый доступ к AI-моделям, без VPN и зарубежной карты