Сравнение

RAG или fine-tuning для документов

RAG лучше подходит, когда важны актуальные источники, обновляемый корпус и проверяемость ответа; fine-tuning полезен для стиля и узких поведенческих навыков.

Главный критерий

Для ассистентов по документам важны актуальность корпуса, проверяемость ответа, стоимость эксплуатации и контроль доступа. Поэтому архитектура выбирается не по моде, а по требованиям к источникам и рискам.

Практический вывод

Janus.guru начинает с корпуса и контрольных вопросов. Такой подход быстро показывает, где достаточно компактной модели, где нужна более сильная модель, а где можно перейти к локальному развертыванию.