如何通过 Dify 平台连接外部知识库?

你有没有觉得,有时候 Dify 自带的知识库功能有点不够用?比如,文本召回的结果不够精准,或者你想直接用云厂商的知识库,而不是重复搬运数据到 Dify。别担心,Dify 的“连接外部知识库”功能就是为了解决这些问题的!下面我就来详细讲讲这个功能怎么用。

首先,这个功能的亮点在于,它能让 Dify 平台直接调用外部知识库的数据,不管是你自己搭建的知识库,还是托管在 AWS Bedrock 这样的云服务上的知识库都可以。而且,通过 API 的方式调用数据,真的很方便,开发者只需要专注于优化外部知识库的检索机制就行了。

ai_tutorial_dify_advanced_Connecting_external_bases_1

外部知识库连接的具体步骤

  1. 建立符合要求的外部知识库 API
    要想让 Dify 和你的外部知识库顺利“牵手”,首先得保证你的外部知识库 API 符合 Dify 的规范。这个规范文档可以在 Dify 官网找到,记得仔细阅读。

  2. 关联外部知识库
    接下来,我们需要把外部知识库和 Dify 平台关联起来。打开 Dify 的“知识库”页面,点击右上角的“外部知识库 API”,然后选择“添加外部知识库 API”。
    这时候,你需要填写一些信息:

    • 知识库名称:随便起个名字,方便你区分不同的外部知识库。
    • API 接口地址:比如 api-endpoint/retrieval,具体格式可以参考 Dify 的 API 规范。
    • API Key:也就是连接密钥,这个你得从外部知识库那边拿到。

    ai_tutorial_dify_advanced_Connecting_external_bases_2

  3. 连接外部知识库
    在“知识库”页面,找到刚刚添加的知识库卡片,点击“连接外部知识库”,然后进入参数配置页面。

    ai_tutorial_dify_advanced_Connecting_external_bases_3

    这里需要设置以下内容:

    • 知识库名称和描述:简单填写即可。
    • 外部知识库 API:选择刚刚关联的 API。
    • 外部知识库 ID:指定需要关联的具体知识库,具体格式参考 API 规范。
    • 召回设置
      • Top K:设置返回的文本片段数量,默认是 3,数值越高,召回的内容越多。
      • Score 阈值:设置文本相似度的最低分数,默认是 0.5,分数越高,召回的内容越精准。

    ai_tutorial_dify_advanced_Connecting_external_bases_4

  4. 测试连接和召回效果
    连接成功后,可以在“召回测试”中模拟一些问题关键词,看看召回的文本效果。如果结果不满意,可以调整召回参数,或者直接优化外部知识库的检索机制。

ai_tutorial_dify_advanced_Connecting_external_bases_5

6.在应用中集成外部知识库
这个功能支持两种类型的应用:

  • Chatbot / Agent 应用:在编排页的“上下文”中,选择带有 EXTERNAL 标签的外部知识库。

ai_tutorial_dify_advanced_Connecting_external_bases_6

  • Chatflow / Workflow 应用:在流程中添加“知识检索”节点,然后选择带有 EXTERNAL 标签的外部知识库。

ai_tutorial_dify_advanced_Connecting_external_bases_7

7.管理外部知识库
在“知识库”页面,找到需要修改的外部知识库,点击“设置”可以调整以下内容:

  • 知识库名称和描述:改个名字什么的很简单。
  • 可见范围:可以设置为“只有我”、“所有团队成员”或者“部分团队成员”。注意,公开的知识库其他人也能编辑和删除哦。
  • 召回设置:调整 Top K 和 Score 阈值,优化召回效果。
    不过,外部知识库的 API 和知识库 ID 是不能修改的,如果需要更改,得重新关联新的 API。

使用小贴士

  • 召回参数的调整:Top K 和 Score 阈值是两个关键参数,前者控制召回的数量,后者控制召回的精准度。根据实际需求调整,可以显著提升效果。
  • 权限管理:如果知识库涉及敏感内容,记得设置合适的可见范围,不然团队里的“熊孩子”可能会乱动哦。
  • 实时测试:通过“召回测试”功能,可以快速验证连接是否成功,以及召回的内容是否符合预期。

感觉嘛,这个功能对那些需要高精度文本检索的开发者来说,真的是一大福音。特别是对于有自建知识库的团队,可以完全按照自己的需求来优化检索机制,而不用受限于平台的默认设置。如果你对文本召回的精准度有要求,或者需要整合多个知识库的数据,强烈建议试试这个功能!

阅读全文
付费
AI爆文训练营
图文变现友好赛道,低门槛、高上限,教你从0到1做个赚钱的公众号!
立即查看
躺着赚钱
¥149/年
何老师陪你做副业
这里聚焦AI副业、个人IP、自媒体运营、写作、赚钱案例。不哔哔,只分享有价值的副业项目。
立即查看
AI赚钱案例
限免
DeepSeek进阶教程
带你全面掌握DeepSeek应用技巧。提升工作、学习效率
立即查看
100万人学过
付费
网盘拉新实战教程
每周花费一小时,手把手教你赚网盘平台佣金
立即查看
500人学过
限时优惠
AiPPT
结合最新AI技术,为用户提供一键生成高质量PPT的解决方案。
立即查看
一键生成 PPT
免费
豆包MarsCode
一款免费的AI编程助手,全新支持DeepSeek R1/V3、豆包大模型1.5自由切换,免部署、更准确、更强大!
立即查看
AI编程助手
免费
Monica AI
Monica AI满血复活DeepSeek【免费】,提升您的聊天、搜索、写作和编程体验。
立即查看
一站式 AI 助手
云服务
腾讯云
综合性的云计算服务平台,现已接入DeepSeek,提供多样化的云解决方案
立即查看
高效可靠
云服务
阿里云
全球领先的云计算与数据服务平台,提供云服务器、存储、数据库、安全等多种服务
立即查看
多样化
DeepSeek企业微信码
免费领取DeepSeek资料