如何通过 MaxKB 加开源大模型搭建本地开发知识库?

MaxKB 是一款基于大语言模型的知识库问答系统,它结合了大预言模型和知识库问答系统的优势,为团队提供了快速、智能的信息检索和问答服务。传统的文档管理方式可能缺乏上下文感知能力,而MaxKB可以完全理解用户提问的上下文,为用户提供更加相关和连贯的问题。

本文将介绍如何安装和配置MaxKB,快速搭建基于大语言模型的知识库问答系统,提高团队的知识管理和共享效率。

一、安装开源 ollama

安装ollama

首先安装开源 ollama,它是一个大语言模型服务工具,可以帮助个人在本地快速运行大语言模型。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_1

下载好对应安装包,然后点击安装ollama。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_3

安装llama3(可跳过)

由于本教程使用的是LLaMA3中文微调模型,所以llama3可以不用安装,这里简单提一下。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_2

使用简单命令即可启动或运行需要的模型。

    
ollama run llama3

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_4

等待安装完成,然后试试效果,LLaMA3 对中文的处理能力确实很差。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_5

ollama支持多种开源大语言模型,包括常见的LLaMA3和Gemma。本文使用 ollama 安装LLaMA3中文微调模型。

ollama 操作命令

安装完成后,启动 ollama 服务,查看已安装的模型列表。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_6

查看本地安装的模型

使用命令 ollama list 查看本地已安装的模型列表。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_7

二、安装LLaMA3中文微调模型

下载LLaMA3中文微调模型

我已经将需要的模型整理到网盘了,大家扫描文章开头的二维码下载就好了。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_8

下载要使用的中文微调模型放到如下目录并创建 Modelfle:

Modelfle我也整理到网盘了,大家如果是按照这个教程部署,Modelfle完全可以不用改,大家扫描文章开头的二维码下载就好了。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_9

Modelfile 文件内容如下:

    
FROM ./ggml-model-q4_0.gguf
TEMPLATE """{{ if .System }}<|start_header_id|>system<|end_header_id|>

{{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>

{{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>

{{ .Response }}<|eot_id|>"""
PARAMETER stop "<|start_header_id|>"
PARAMETER stop "<|end_header_id|>"
PARAMETER stop "<|eot_id|>"
PARAMETER stop "<|reserved_special_token"

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_10

    
FROM 字段指向GGUF文件的路径,本次主要是知识库问答系统,术语聊天交互,这里使用的是Instruct模型
TEMPLATE 字段定义了Llama-3-Instruct的指令模板格式
SYSTEM 字段定义了系统指令(目前设置为空)
PARAMETER 字段定义了一些超参数,详细列表参见:https://github.com/ollama/ollama/blob/main/docs/modelfile.md

安装LLaMA3中文微调模型

在当前目录下,打开终端命令。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_11

执行通过 Modelfile 创建模型的命令创建中文微调 llama3 模型:

    
ollama create llama3-Chinese:8B -f Modelfile

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_12

三、安装MaxKB

确保电脑上安装了Docker,然后通过Docker安装MaxKB。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_13

然后运行maxkb

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_14

或者使用命令安装并运行启动MaxKB服务。

    
docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data 1panel/maxkb

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_15

然后回到docker打开部署页面或打开浏览器输入http://localhost:8080/

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_16

四、登录MaxKB并配置LLaMA3模型

登录MaxKB

第一次登录MaxKB,需要默认用户名和密码。

    
# 用户名: admin
# 密码: MaxKB@123..

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_17

然后按照提示修改密码。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_18

配置本地的LLaMA3中文微调模型服务

进入系统配置>模型设置>Ollama添加模型。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_19

如果你也是使用 Docker 安装的 MaxKB,API 域名参考这个地址。

    
http://host.dockerinternal:11434

如果没有 API Key 可以输入任意字符。点击【添加】后 校验通过则添加成功,便可以在应用的 AI 模型列表选择该模型。

五、创建知识库

可以看到这里支持两种创建知识库的方式:

1、通用型,支持线下导入文件格式(目前支持txt, markdown,pdf, docx 等类型文档)

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_21

2、Web 站点导入,通过网站链接根目录导入。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_22

知识库同步界面如下,可以等待同步完成再进入后续操作:

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_23

六、创建 MaxKB 应用

进入应用>创建应用配置应用。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_20

关联现有数据库。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_24

七、使用 MaxKB 应用

我们问它一个 Doris 的问题,看看效果。

ai_tutorial_chatgpt_tutorial_sports_acrobatics_MaxKB_ollama_25

可以看到它的来源是Doris的文档,说明我们已经创建成功了。

阅读全文
付费
AI爆文训练营
图文变现友好赛道,低门槛、高上限,教你从0到1做个赚钱的公众号!
立即查看
躺着赚钱
¥149/年
何老师陪你做副业
这里聚焦AI副业、个人IP、自媒体运营、写作、赚钱案例。不哔哔,只分享有价值的副业项目。
立即查看
AI赚钱案例
限免
DeepSeek进阶教程
带你全面掌握DeepSeek应用技巧。提升工作、学习效率
立即查看
100万人学过
付费
网盘拉新实战教程
每周花费一小时,手把手教你赚网盘平台佣金
立即查看
500人学过
限时优惠
AiPPT
结合最新AI技术,为用户提供一键生成高质量PPT的解决方案。
立即查看
一键生成 PPT
免费
豆包MarsCode
一款免费的AI编程助手,全新支持DeepSeek R1/V3、豆包大模型1.5自由切换,免部署、更准确、更强大!
立即查看
AI编程助手
免费
Monica AI
Monica AI满血复活DeepSeek【免费】,提升您的聊天、搜索、写作和编程体验。
立即查看
一站式 AI 助手
云服务
腾讯云
综合性的云计算服务平台,现已接入DeepSeek,提供多样化的云解决方案
立即查看
高效可靠
云服务
阿里云
全球领先的云计算与数据服务平台,提供云服务器、存储、数据库、安全等多种服务
立即查看
多样化
DeepSeek企业微信码
免费领取DeepSeek资料