项目简介
这是一个基于Python框架/库的知识库管理系统,具备与多种模型交互、管理知识库、处理文档和生成文档嵌入等功能。系统支持OpenAI、Baidu QianFan、Fangzhou等多种模型,通过API接口供外部访问。同时涵盖知识库相关的文档管理及嵌入向量生成,支持文本搜索和添加、删除、搜索文档等操作。
项目的主要特性和功能
- 与多种模型交互:支持OpenAI、Baidu QianFan、Fangzhou等多种模型,并提供交互接口。
- 文档管理:可进行文档上传、下载、更新和删除,支持文档向量化处理。
- 嵌入向量生成:能将文本转换为嵌入向量,为自然语言处理任务预处理。
- 文本搜索:提供基于文本的搜索功能,便于用户快速找到相关文档。
- API接口:允许外部应用或用户通过API与系统交互。
- 并发处理:支持同时处理多个请求,提高系统性能。
安装使用步骤
1. 环境配置
确保机器安装了Python 3.8 - 3.10:
shell
$ python --version
Python 3.10.12
创建虚拟环境,在虚拟环境内安装项目依赖:
```shell
$ cd Langchain-Chatchat
$ pip install -r requirements.txt $ pip install -r requirements_api.txt $ pip install -r requirements_webui.txt
```
2. 模型下载
若要在本地或离线环境运行项目,需将所需模型下载到本地,开源LLM与Embedding模型可从 HuggingFace 下载。
以项目默认使用的LLM模型 THUDM/ChatGLM2-6B 与Embedding模型 moka-ai/m3e-base 为例:
Shell
$ git lfs install
$ git clone https://huggingface.co/THUDM/chatglm2-6b
$ git clone https://huggingface.co/moka-ai/m3e-base
3. 初始化知识库和配置文件
按以下方式初始化知识库并复制配置文件:
shell
$ python copy_config_example.py
$ python init_database.py --recreate-vs
4. 一键启动
使用以下命令启动项目:
shell
$ python startup.py -a
5. 启动界面示例
正常启动后,能看到以下界面: 1. FastAPI Docs 界面 2. Web UI 启动界面示例: - Web UI 对话界面 - Web UI 知识库管理页面
注意事项
- 安全性:确保API密钥和其他敏感信息的安全,避免泄露。
- 性能:在高并发场景下,确保系统性能和稳定性。
- 更新和维护:随着模型更新和技术发展,需要定期更新和维护系统。
- 文档管理:确保文档的正确性和完整性,定期备份和恢复。
- 日志和监控:设置日志记录和监控机制,以便于问题排查和性能优化。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】