-
Notifications
You must be signed in to change notification settings - Fork 9
RAG
arcstep edited this page Sep 21, 2024
·
2 revisions
illufly 的向量检索能力,默认是基于 faiss
实现的。
# 安装 CPU 版本
pip install faiss-cpu
# 安装 GPU 版本
# pip install faiss-gpu
但 illufly 有更具体的实践策略和限制。
对于大量文本资料,我们认为,检索前应当更多地进行“提前阅读”,而不是直接进行向量检索。 就像公司新招的一名员工,你不能指望临时给他看一堆资料,就指望他能回答你的问题。
大模型或智能体框架也一样,它们需要更多地使用“提前阅读”。 而且“阅读”应当是有目的性的,必须针对特定领域、特定问题提炼出关键信息,并进一步反思其中包含的概念、数据、逻辑,进行摘要和总结,然后针对“消化后”的内容做检索,而不是针对原始文本的所有细节做检索。
illufly 的向量检索框架就是基于上述理念设计的。
由于上述理念,我们在框架上限制了在自动从原始文本直接检索细节的能力,也没有在这方面做任何优化。 如果需要在 illufly 的智能体框架中时,期待从从海量未经“阅读”的原始文本中检索细节,请使用相关框架做提前处理,然后使用 illufly 的智能体对接。