-
Notifications
You must be signed in to change notification settings - Fork 60.2k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[Feature] 整合类似chatpdf的功能 #960
Comments
这种功能需要建立向量索引,在纯前端比较难搞,你看到的开源项目都是把文件传到服务器做处理。 不过我在研究怎么在浏览器里跑 embedding 模型,之后会加此功能。 |
那个项目是用纯next.js做的,没有连矢量数据库。自己部署肯定是没问题的,难道Vercel不行吗?我还以为可以比较容易的整合进来呢! |
这个功能实现就太感谢开发者了 |
嗯嗯!确实,不过反正是用户提供自己的Key嘛!这样可以比较快的来实现,多谢大神! |
LangChain 有 Python 和 JS 的版本,可以和很多信息源集成 |
@sperjar 不会使用 langchain,这个库过于重了。 我重申一遍,这个功能实现起来并不难,只需要解析 pdf 内容,然后调 openai 接口进行向量化,然后再去做检索就行了。 这个功能现在没做的原因是优先级比较低,我正筹备 2.0 版本的开发,v2.0 的重磅功能是预设角色,chatpdf 的功能会归到外挂知识库的需求里去做,可能是 v2.5,也可能是 v3.0,可以确认的是近期不会实现该功能。 |
感谢大神,@Yidadaa,一些想法:
|
预设角色的用处: #138 https://www.allabtai.com/prompt-engineering-tips-zero-one-and-few-shot-prompting/ 别人的预设角色只不过是预设一个 prompt,你可以列几个竞品,应该功能都没我的好。 |
@Yidadaa 老师您好,以下为羊驼索引Llamindex的参考链接请您参阅:https://gpt-index.readthedocs.io/en/latest/index.html;我目前已经尝试使用Llamaindex0.6.9构建了一个侧边栏插件(不过只能在谷歌114Beta上运行side panel,且基于本地)和您的项目(最重要的是mask功能)一起配合使用,由于羊驼索引有太多的index方式,比如关键词、树索引、向量索引等等,且目前index还可以进行嵌套等等,除了index也有很多需要深度开发的部分,所以在我认为这个项目目前如果只是使用会很简单,但是想要使用的好会很有难度,我支持你的想法:即“chatpdf 的功能会归到外挂知识库的需求里去做,可能是 v2.5,也可能是 v3.0,可以确认的是近期不会实现该功能”,这个项目现在很活跃基本几天就是一个更新,在给Llamaindex一点时间,让子弹飞一会 希望以上链接能给你一些帮助,至于有人偷盗公众号文章私自转载这件事,希望老师您不要放在心上,如果需要额外的经济支持我愿意尽一些微薄之力!祝你开心 |
PDF文本总结应该是将PDF分段总结后在内存里临时存放,最后输出最终总结结果。和向量检索PDF里的段落应该是两个方向的方案。 |
此功能将于 v2.9 版本加入。 |
用js跑embedding模型?纯前端听起来很酷。 |
结合现有的历史摘要功能,是否可以实现把每一个生成的历史摘要向量化到向量数据库里,然后实现GPT对于整个事件的长期记忆,而不是只局限于上下文和近期的历史摘要? |
Combined with the existing historical summary function, is it possible to vectorize each generated historical summary into a vector database, and then realize GPT's long-term memory for the entire event, instead of being limited to context and recent historical summaries? |
从这个实践的最后示例来看,似乎是可行的。 |
From this last example of practice, the market works. |
bump |
This comment was marked as abuse.
This comment was marked as abuse.
You made the plug-in, do you have a demo address? Can I see the effect? |
i want to know if in roadmap upload or link pdf editable files? |
后续会支持接入 azure embedding模型吗? |
Will it support access to the azure embedding model in the future? |
看到有个网站依赖 https://qdrant.tech 实现 |
纯前端做,我用了nlp.js匹配问题和知识库的相关性,然后给到提示词里面,但参数有些难调 |
Purely front-end, I used nlp.js to match the correlation between the problem and the knowledge base, and then gave it to the prompt word, but the parameters are a bit difficult to adjust |
Witch % is complete this feature? |
any updates on this? pd: superb project! |
|
能不能整合类似chatpdf的功能?比如新建聊天时可以选中文件,然后基于文件开始聊天。
OpenAI的GitHub上有基本的实现,但是UI太差了。
The text was updated successfully, but these errors were encountered: