Janus.guru
Глоссарий RAG и ассистентов по документам
Эти термины помогают обсуждать ИИ-ассистентов предметно: не как абстрактный чат, а как управляемую систему поиска, генерации и проверки источников.
Основные понятия
- RAG — retrieval augmented generation: модель отвечает после поиска по корпусу
- Корпус — набор документов, фрагментов и метаданных, по которым работает ассистент
- Чанкинг — разбиение документов на фрагменты, пригодные для поиска
- Эмбеддинги — числовое представление текста для семантического поиска
Контроль ответа
- Source refs — ссылки на найденные фрагменты
- Grounded answer — ответ, основанный на источниках
- Hallucination control — правила, которые ограничивают неподтвержденные утверждения