GPT-File-Uploader

By Hanqi Jiang

随便写着玩

1. 使用说明

后端

cd backend
pip install -r requirements.txt
python app.py

前端

cd frontend
npm install
npm start

Web端

1. 访问http://127.0.0.1:3000 （前端运行在3000端口，后端运行在5000端口）
2. 拖拽或点击上传文件，暂时支持txt/doc/docx/pdf
3. 点击submit提交文件
4. AI回复读取文件成功后，可针对文件内容进行提问

附加功能

如果担心上传的文件过多占用内存，可以选择上传文件五分钟后自动删除

常规报错

- sh : react-scripts: command not found
- 解决方案：删除npm依赖并重新npm install

2. 开发相关

关于 llama_index

llama-index · PyPI

Welcome to LlamaIndex 🦙 (GPT Index)! — LlamaIndex documentation (gpt-index.readthedocs.io)

llama_index 是一个GitHub项目，旨在提供一个简单的方法来利用OpenAI GPT系列模型（例如GPT-3）对一组文档进行索引和查询。该项目的核心思想是将文档编码为向量，然后在查询时与GPT模型的输出进行相似度比较。这个方法的目标是更高效地利用GPT模型的能力，减少API调用次数，从而降低成本。

llama_index 的主要组件包括：

GPTSimpleVectorIndex 类：这个类提供了一个简单的索引结构，用于存储文档向量及其对应的元数据。它包含用于向量化文档、计算文档间相似度、查询文档等的方法。
数据加载器：用于从不同来源加载文档，如文件、URL或其他数据结构。在这个项目中，提供了一个名为 SimpleDirectoryReader的数据加载器，它可以从一个包含文本文件的目录中加载文档。

在这个项目中，选择使用LlamaIndex主要有以下几个原因：

在使用openai基于GPT-3的模型（例如davinci）时，有最大token也就是输入和输出的限制，使用LlamaIndex可以解除这个限制。
LlamaIndex可以更好的衔接文件的上下文，并上传文件给GPT进行处理，具体方式是将上传的文件转换为json格式存储在本地（服务端），并提供给openai API进行解析。可以在这里找到是否使用LlamaIndex优化器的对比。（具体的原理我也没太明白，没有深究）

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
backend		backend
frontend		frontend
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

GPT-File-Uploader

By Hanqi Jiang

1. 使用说明

后端

前端

Web端

附加功能

常规报错

2. 开发相关

关于 llama_index

About

Releases

Packages

Languages

hq0709/GPT-file-uploader

Folders and files

Latest commit

History

Repository files navigation

GPT-File-Uploader

By Hanqi Jiang

1. 使用说明

后端

前端

Web端

附加功能

常规报错

2. 开发相关

关于 llama_index

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages