在 Dify 中配置 Jina
在 设置 - 模型供应商 - 安装模型供应商
选择安装 Jina 模型供应商,为知识库提供 Embedding 模型和 Rerank 模型。
在 设置 - 数据来源 - Web 站点 使用 Jina Reader
配置 Jina API key,key 可以通过访问 Jina 官网免费获得:jina.ai
新建知识库
创建知识库时在数据源处选择“同步自 Web 站点”,工具选择 Jina Reader,将博客中带有所有文章列表的网页 url 粘贴进去,勾选“爬取子页面”,限制数量适当拉高,否则可能爬取不到所有文章。
运行后会显示可选的页面,选择需要纳入知识库的文章即可。
配置知识库
参考下列配置,我这里选择了高质量索引模式 + 混合检索的 Rerank 模型,分别使用了 Jina 的 jina-embeddings-v2-base-zh embedding 模型和 jina-reranker-v2-base-multilingual rerank 模型。
embedding 模型也可以选择使用 ollama 自部署的 bge-m3 模型。
知识库创建后会为文档产生索引,在应用中可选择添加知识库,这样大模型就能从知识库中获取额外的信息来生成回答。
