分享好友 最新动态首页 最新动态分类 切换频道
【大模型本地知识库搭建】ChatGLM3,M3E,FastGPT,One-API_fastgpt m3e
2024-12-26 15:58

目录

引言

【大模型本地知识库搭建】ChatGLM3,M3E,FastGPT,One-API_fastgpt m3e

一、ChatGLM3大模型本地部署

二、部署M3E模型

三、部署One-API

四、部署FastGPT

 
  • 知识延迟问题是训练大模型需要一定的时间,从而训练数据就不可能具有实时性,而且相当耗费资源。

  • 幻想问题问题则由于LLM采用的概率模型,即预测生成下一个字符概率是多少,所有或多或少的它在生成结果的时候都有定的可能出现错误。

     
 
 

使用python api_server.py启动后使用postman工具进行测试。

api_server.py启动后监听8000端口

Postman工具使用post方式进行测试

ChatGLM3返回报文

测试请求体

 
 

M3E 是 Moka Massive Mixed Embedding 的缩写,其中

  • Moka,此模型由 MokaAI 训练,开源和评测,训练脚本使用 uniem ,评测 BenchMark 使用 MTEB-zh

  • Massive,此模型通过千万级 (2200w+) 的中文句对数据集进行训练

  • Mixed,此模型支持中英双语的同质文本相似度计算,异质文本检索等功能,未来还会支持代码检索

  • Embedding,此模型是文本嵌入模型,可以将自然语言转换成稠密的向量

    M3E模型使用场景主要是中文,少量英文的情况,多语言使用场景,并且不介意数据隐私的话,建议使用 openai text-embedding-ada-002。

项目地址:moka-ai/m3e-base · Hugging Face,把项目拉下来即可使用。把项目地址在ChatGLM中openai_api_demo/api_server.py相应修改。

One-API使用Docker进行快速部署,One-API和FastGPT建议使用Linux系统进行部署,本文采用虚拟机安装了CentOS进行部署。

先安装Docker,Docker部署命令

 

One-API部署命令

由于FastGPT也是使用3000端口,这里One-API改用3080端口。

 

利用docker ps查看One-API是否启动

启动后在本地浏览器打开One-API地址为本地IP地址+3080端口,登录页初始账号为root,密码123456。

One-API登录界面

由于是本地部署的模型,需要在“渠道”里配置ChatGLM大模型M3E向量模型的地址。其中Base URL是能访问大模型的地址,密钥是自定义的,可以随意填写。

配置大模型渠道

配置M3E模型渠道

配置好后测试两个模型是否可以调用,点击测试按钮即可。

测试响应

设置令牌,后面在配置FastGPT时会用到。

配置令牌

 
 

FastGPT功能结构示意图

先来了解下 FastGPT 是如何进行知识库检索的。首先了解几个基本概念

  • 向量:将人类直观的语言(文字、图片、视频等)转成计算机可识别的语言(数组)。
  • 向量相似度:两个向量之间可以进行计算,得到一个相似度,即代表:两个语言相似的程度。
  • 语言大模型的一些特点:上下文理解、总结和推理。

结合上述 3 个概念,便有了 “向量搜索 + 大模型 = 知识库问答” 的公式。下图是 FastGPT V3 中知识库问答功能的完整逻辑

FastGPT本文在Linux系统下使用Docker进行部署,目前这也是官方推荐的部署方式,官网介绍链接

依次执行下面命令,创建 FastGPT 文件并拉取和,执行完后目录下会有 2 个文件。

 

接下来修改docker-compose.yml文件

主要修改fastgpt/environment下的OPENAI_BASE_URLCHAT_API_KEY

前者填入One-API的地址和端口号,后者填写设置好的令牌口令。数据库的账号密码可以后面再重新设定。

 

同时修改config.json文件

主要修改“llmModels”键值对中“model”和“name”的名字和其它需要的配置,如果不用其它的模型,保留这样一个字典就行,同时也要修改一下向量模型 "vectorModels"的“model”和“name”。

 

修改后启动容器

在 docker-compose.yml 同级目录下执行。同时确保版本最好在2.17以上,否则可能无法执行自动化命令。

 

用docker ps查看是否正常启动

若oneapi没正常启动

 

正常启动后在浏览器上访问fastgpt,本地ip:3000端口。

账号root,初始密码1234。创建应用后即可测试是否正常使用本地部署的大模型。

那么,如何系统的去学习大模型LLM

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

👉LLM大模型学习指南+路线汇总👈

这份完整版的大模型 LLM 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【】
最新文章
Dede网站SEO优化攻略,高效提升排名,吸引海量流量
Dede网站SEO优化技巧助力提升网站排名,吸引更多流量。通过优化标题、关键词、内链布局、内容质量等方面,使网站在搜索引擎中更具竞争力,提高用户访问量和率。掌握这些技巧,让Dede网站在激烈的市场竞争中脱颖而出。随着互联网的快速发展
2024手机游戏热度排行 受欢迎的手机游戏安卓版排名前十
更新速度较快,经常都会加入各种创新玩法,吸引玩家,2024热度排行小编已经为大家盘点好相关名单,新鲜出炉。各类型高人气游戏应有尽有,比如、角色扮演,有精美的画面及音效,为玩家提供沉浸式体验,多种不同类型满足小伙伴们的众多需求,
2024刺激的开飞机游戏排行榜下载 必玩的模拟飞行游戏有哪些
飞行驾驶类游戏向玩家们展现了一片浩瀚的虚拟飞行天地,那些胸怀飞行憧憬的玩家,将有机会操纵这些钢铁巨鹰,在云层上尽享飞行的畅快,2024刺激的开飞机游戏排行榜下载,在这里你可以展现出你的英勇身姿,单纯享受着驾驶飞机穿越云层的快感
2024新奥正版资料免费|数据解释说明规划
  随着数字化时代的到来,获取信息的方式越来越多样,这让我们对数据的需求也日益增加。但是,面对海量信息,如何快速准确地找到我们所需要的资料,成为了一个难题。在这里,我们将讨论关于2024新奥(非虚构的出版社名称)正版资料的免费
——纯干货!做好流量来源分析 提升跨境电商平台运营效果
  怎么运营跨境电商平台?跨境电商怎么做?电商平台运营工作的核心是提升平台运营效果,而流量是平台效果最直观的表现。因此,要想做好电商平台的运营,第一步就是要要清楚平台流量来源,对不同的流量来源进行拆解,进而通过数据分析和评
2024河源连平全日制艺考生文化课培训班排名>top5排名排名一览
2024河源连平全日制艺考生文化课培训班排名top5排名排名一览2024年河源连平全日制艺考生文化课培训班排名揭晓,TOP5榜单备受瞩目。这些培训班凭借的教学质量和显著的成绩,成为艺考生备考的优选。以下是排名一览:第一名XX班,第二名XX班,
2024石油和化工行业全面绿色转型十大典型案例(一)——绿色勘探装备与技术助推绿色物探转型模式
点击箭头处“蓝色字”,关注我们哦!!编制按为深入贯彻党的二十大和二十届三中全会精神,认真落实《中共中央 国务院关于加快经济社会发展全面绿色转型的意见》要求,加快培育绿色生产力,中国石油和化学工业联合会遴选发布了2024年度石油
7777788888精准一肖,确保成语解释落实的问题_精简版105.220
七七七七八八八八精准一肖是一种基于概率和随机数生成器的预测工具声称能准确预测某个人在未来一段时间内的行为。其工作原理并不复杂只是利用了大数据和人工智能技术通过大量的数据分析来帮助用户更好地了解自己的行为模式并做出更准确的决
dota3设计_今日dota3上线设计教程
摘要:dota3设计,今日dota3上线设计教程,新片场素材小编成丹dota3设计,今日dota3上线设计教程相关内容整理,如果您对dota3设计,今日dota3上线设计教程感兴趣欢迎访问免费阅读。dota3设计,今日dota3上线设计教程一、dota3在线设计教程介绍
2024新奥今晚开什么|全文释义解释落实|0.252903742
2024新奥今晚开什么?——全文释义解析与数据透视在当今信息爆炸的时代,数据成为了我们理解世界、预测未来的重要工具,面对“2024新奥今晚开什么”这一具体问题,我们将运用数据分析的方法,结合历史趋势、概率统计和实时情报,进行一次全
相关文章
推荐文章
发表评论
0评