Janus.guru

Глоссарий RAG и ассистентов по документам

Эти термины помогают обсуждать ИИ-ассистентов предметно: не как абстрактный чат, а как управляемую систему поиска, генерации и проверки источников.

Основные понятия

  • RAG — retrieval augmented generation: модель отвечает после поиска по корпусу
  • Корпус — набор документов, фрагментов и метаданных, по которым работает ассистент
  • Чанкинг — разбиение документов на фрагменты, пригодные для поиска
  • Эмбеддинги — числовое представление текста для семантического поиска

Контроль ответа

  • Source refs — ссылки на найденные фрагменты
  • Grounded answer — ответ, основанный на источниках
  • Hallucination control — правила, которые ограничивают неподтвержденные утверждения