https://www.ruapi.ai/v1, тот же ключ sk-.... Менять в коде нужно только base_url.
Первый вектор
Python (OpenAI SDK)
resp.data — это список: на один входной текст приходится один элемент с полем .embedding. У text-embedding-3-small вектор содержит 1536 чисел.
Нужно качество повыше — возьмите text-embedding-3-large (3072 числа на вектор). Он точнее на сложных текстах, но дороже и медленнее. Для большинства задач -small достаточно.
Сразу несколько текстов
Передавайте список вinput — за один запрос вернётся вектор для каждого элемента. Это и быстрее, и дешевле, чем слать тексты по одному.
Сквозной RAG за пять шагов
Идея простая: заранее разбиваем документы на куски и считаем для них векторы, а на запрос пользователя находим самые близкие куски и отдаём их чат-модели как контекст. 1. Разбиваем текст на куски (chunks). Слишком длинные куски «размывают» смысл, слишком короткие теряют контекст. Обычно берут абзацы или окна по 200-500 слов.Подводные камни
Одна и та же модель для индекса и для запроса
Одна и та же модель для индекса и для запроса
Векторы из
text-embedding-3-small и text-embedding-3-large несравнимы между собой — у них разная размерность и разное пространство смыслов. Каким эмбеддингом построили индекс, тем же считайте и вектор запроса. Сменили модель — пересоберите весь индекс заново.Считайте пачками через список в input
Считайте пачками через список в input
Отправлять тексты по одному — медленно и дороже по числу запросов. Передавайте список в
input (обычно до нескольких сотен строк за раз) — ответы вернутся в том же порядке.-small против -large: размерность и цена
-small против -large: размерность и цена
text-embedding-3-small — 1536 чисел на вектор, дешевле и быстрее, подходит для большинства задач. text-embedding-3-large — 3072 числа, точнее на сложных и длинных текстах, но дороже и занимает вдвое больше места в хранилище. Начните с -small и переходите на -large, только если качества поиска не хватает.Что дальше
- Быстрый старт — регистрация, ключ и первый запрос
- Справочник API — эндпоинты, протоколы и базовые адреса
- LangChain — готовые цепочки и RAG поверх RuAPI без ручного кода