腾讯云 Elasticsearch RAG 案例中,如何实现高效问答系统?

2026-05-21 01:104阅读0评论工具资源
  • 内容介绍
  • 文章标签
  • 相关推荐

也许吧... 1、 开启节点出站访问,仅开启数据节点即可,如有专用主节点,仅开启专用主节点即可。:最近我一直在研究如何利用腾讯云ES与DeepSeek大模型来构建一个高效的问答系统, 过程中遇到了不少挑战,但也积累了一些宝贵的经验,今天就和大家分享一下。

一、 开启公网访问

1、集群创建完成后点击集群名称,进入访问控制页面在可视化访问控制设置公网访问策略:说实话, 总结一下。 这个步骤挺关键的,不然你就没法进行后续的操作。

腾讯云 Elasticsearch RAG 案例

弄一下... 本文介绍如何时可开启公网访问,实际生产时建议使用内网访问地址。

pip install ollama

推荐算力套餐

类型 配置
GPU基础型 适合一般性任务
GPU进阶型 适合复杂计算任务

2、 获取当前 IP 地址并设置到 IP 白名单中:这个步骤非常重要,不然你的请求就会被拦截,太水了。。

吃瓜。 代码语言:javascript其实这段代码并不是很重要,你可以用其他语言来实现相同的功能。

二、 创建HAI实例并部署DeepSeek模型

1、登录 高性能应用服务 HAI 控制台

可以。 2、单击新建进入高性能应用服务 HAI 购买页面。

pip install streamlitpip i 我无法认同... nstall elasticsearch==8.16

Elasticsearch作为首选的开源分布式搜索分析引擎,通过一套系统轻松满足用户的日志实时分析、 全文检索、时序数据分析等多种需求,大幅降低大数据时代发掘数据价值的成本。 小小工匠 0篇文章 大厂案例 -腾讯万亿级 Elasticsearch架构实践 学习 活动 专区 工具 文章/答案/技术大牛搜索... ElasticSearch 作为首选的开源分布式搜索分析引擎,通过一套系统轻松满足用户的日志实时分析、 全...,嚯...

Hai平台配置选项说明:记得仔细阅读以下配置选项说明,以便更好地完成配置。

太暖了。 地域:选择与ES集群相同的地域,降低网络延迟、提高您的访问速度。 算力方案:选择合适的算力套餐。在单并发访问模型的情况下 建议最低配置如下: 实例名称:自定义实例名称,若不填则默认使用实例 ID 替代。 购买数量:默认1台。

对吧,你看。 计费模式为按量计费,产品版本为AI搜索增强版、 ES 版本为8.16.1 : 这个版本还是比较稳定的,我在项目中已经验证过了。

三、在Kibana中部署Embedding模型并创建知识库索引与向量化管道

点击Kibana 公网访问地址访问 Kibana。 在左侧导航栏找到Machine Learning 功能,并进入模型管理页面。 找到类型为text_embedding 的模型, 本次演示我们使用.multilingual-e5-small_linux-x86_64 模型,这是一个 384 维的多语言模型,点击Download 下载完成后点击Deploy ,弹窗信息使用默认值即可。 等待创建完成。单击实例任意位置 并进入该实例的详情页面。一边您将在站内信中收到登录密码。此时可通过可视化界面或命令行使用 DeepSeek 模型。此处我们需保存公网IP,以便于通过SDK进行调用。

四、 使用Bulk API批量写入数据到Elasticsearch

创建知识库索引:index-name为索引名称,实际可按需命名: PUT /index-name{ "mappings": { "properties": { "title": { "type": "keyword" }, "content": { "type": "text" }, "content_embedding": { "type": "dense_vector", "dims": 384 } } }}

创建推理管道,该管道可用于写入数据时进行数据向量化: PUT /_ingest/pipeline/index-name-pipeline{ "description": "Text embedding pipeline", "processors": } } ] },冲鸭!

通过 Bulk API 批量写入数据,可将 title 、 content 、 url 的内容替换为实际的知识库数据。 POST index-name/_bulk?pipeline=index-name-pipeline& ;refresh{ "index" : {} }{ "title" : "公司年度财务报告","content": "2022年公司总收入为5000万元,净利润为1200万元,弯道超车。。

主要增长来源于新产品线的推出和市场 。" }{ "index" : {} }{ "title" : "员工满意度调查后来啊","content": "2022年员工满意度调查显示, 85%的员工对公司的工作环境表示满意,70%的员工对薪酬福利表示满意。

五、 运行问答系统

安装 streamlit与elasticsearch client: pip install streamlitpip install elasticsearch==8.16,要我说...

共勉。 在上述 python 文件的目录下使用如下命令运行系统: streamlit run web_

完整代码参考:

import streamlit as stfrom elasticsearch import Elasticsearchfrom hai_ds import deepseek_gptes_client = Elasticsearch)def get_elasticsearch_results: es_query = { "knn ": { "field ": "content_embedding ", “num_candidates ”: 100 , “query_vector_builder ”: { “text_embedding ”: { “model_id ”“: ”.multilingual-e5-small_linux-x86_64 ”, “model_text ”“: query } } }, “query ”:{ “match ”:{ “content ”“:query } }, “rank ”:{ “rank_fusion ”:{ “rank_window_size ”“:100 , “rank_constant ”“:20 } } } result = es_ return resultdef create_deepseek_prompt: context = "" for hit in results : source_field = hit hit_context = source_field context += f"{hit_context} " prompt = f"""Instructions :结合{context }的信息回答{question }的问题, 太暖了。 要求简练高效 """ return promptdef generate_deepseek_completion: response = deepseek_gpt response_str = str # 去掉 标签及其内容 while ' ' in response_str and '' in response_str : start_idx = response_ end_idx = response_ + len response_str = response_str + response_str return response_strdef format_result: title = hit return f ''def main : # 创建输入框和查询按钮 question = _input if : # 显示“思考中...”信息 status_text = status_ # 获取Elasticsearch后来啊并创建HunYuan提示 elasticsearch_results = get_elasticsearch_results user_prompt = create_deepseek_prompt system_prompt = f """你是一个问答任务的助手。

”,“公司2022年的财务报告是什么?”,“员工满意度调查后来啊如何? 换个赛道。 ”,“公司2023年的市场营销策略是什么?

使用呈现的上下文实事求是地回答问题。 """ # 使用deepseek模型生成回答 openai_completion = generate_deepseek_completion # 覆盖“思考中...”信息并显示后来啊 status_ # 添加换行 #展示Elasticsearch查询后来啊 references_html = "" for hit in elasticsearch_results : references_html += f "{format_result}" references_html += "" # 添加换行 # 添加推荐问题 recommended_questions=[“2023年公司计划推出的新产品有哪些?

的准确性和可靠性, 还有效避免了大模型的幻觉问题,为企业提供了更加优质的本地知识库智能问答服务。

一边, 作为国内公有云首个从自然语言处理、到向量生成/存储/检索、并与大模型集成的端到端一站式技术平台,腾讯云ES作为核心参编单位参与了由中国信通院发起的RAG标准制定,并成为首个通过RAG权威认证的企业,我狂喜。。

可见, 使用腾讯云ES与HAI部署能力,为企业打造更加智能、 我给跪了。 高效的知识库问答系统。

希望这篇文章能对你有所帮助,如果你有任何疑问或建议,欢迎留言讨论,要我说...!

也许吧... 1、 开启节点出站访问,仅开启数据节点即可,如有专用主节点,仅开启专用主节点即可。:最近我一直在研究如何利用腾讯云ES与DeepSeek大模型来构建一个高效的问答系统, 过程中遇到了不少挑战,但也积累了一些宝贵的经验,今天就和大家分享一下。

一、 开启公网访问

1、集群创建完成后点击集群名称,进入访问控制页面在可视化访问控制设置公网访问策略:说实话, 总结一下。 这个步骤挺关键的,不然你就没法进行后续的操作。

腾讯云 Elasticsearch RAG 案例

弄一下... 本文介绍如何时可开启公网访问,实际生产时建议使用内网访问地址。

pip install ollama

推荐算力套餐

类型 配置
GPU基础型 适合一般性任务
GPU进阶型 适合复杂计算任务

2、 获取当前 IP 地址并设置到 IP 白名单中:这个步骤非常重要,不然你的请求就会被拦截,太水了。。

吃瓜。 代码语言:javascript其实这段代码并不是很重要,你可以用其他语言来实现相同的功能。

二、 创建HAI实例并部署DeepSeek模型

1、登录 高性能应用服务 HAI 控制台

可以。 2、单击新建进入高性能应用服务 HAI 购买页面。

pip install streamlitpip i 我无法认同... nstall elasticsearch==8.16

Elasticsearch作为首选的开源分布式搜索分析引擎,通过一套系统轻松满足用户的日志实时分析、 全文检索、时序数据分析等多种需求,大幅降低大数据时代发掘数据价值的成本。 小小工匠 0篇文章 大厂案例 -腾讯万亿级 Elasticsearch架构实践 学习 活动 专区 工具 文章/答案/技术大牛搜索... ElasticSearch 作为首选的开源分布式搜索分析引擎,通过一套系统轻松满足用户的日志实时分析、 全...,嚯...

Hai平台配置选项说明:记得仔细阅读以下配置选项说明,以便更好地完成配置。

太暖了。 地域:选择与ES集群相同的地域,降低网络延迟、提高您的访问速度。 算力方案:选择合适的算力套餐。在单并发访问模型的情况下 建议最低配置如下: 实例名称:自定义实例名称,若不填则默认使用实例 ID 替代。 购买数量:默认1台。

对吧,你看。 计费模式为按量计费,产品版本为AI搜索增强版、 ES 版本为8.16.1 : 这个版本还是比较稳定的,我在项目中已经验证过了。

三、在Kibana中部署Embedding模型并创建知识库索引与向量化管道

点击Kibana 公网访问地址访问 Kibana。 在左侧导航栏找到Machine Learning 功能,并进入模型管理页面。 找到类型为text_embedding 的模型, 本次演示我们使用.multilingual-e5-small_linux-x86_64 模型,这是一个 384 维的多语言模型,点击Download 下载完成后点击Deploy ,弹窗信息使用默认值即可。 等待创建完成。单击实例任意位置 并进入该实例的详情页面。一边您将在站内信中收到登录密码。此时可通过可视化界面或命令行使用 DeepSeek 模型。此处我们需保存公网IP,以便于通过SDK进行调用。

四、 使用Bulk API批量写入数据到Elasticsearch

创建知识库索引:index-name为索引名称,实际可按需命名: PUT /index-name{ "mappings": { "properties": { "title": { "type": "keyword" }, "content": { "type": "text" }, "content_embedding": { "type": "dense_vector", "dims": 384 } } }}

创建推理管道,该管道可用于写入数据时进行数据向量化: PUT /_ingest/pipeline/index-name-pipeline{ "description": "Text embedding pipeline", "processors": } } ] },冲鸭!

通过 Bulk API 批量写入数据,可将 title 、 content 、 url 的内容替换为实际的知识库数据。 POST index-name/_bulk?pipeline=index-name-pipeline& ;refresh{ "index" : {} }{ "title" : "公司年度财务报告","content": "2022年公司总收入为5000万元,净利润为1200万元,弯道超车。。

主要增长来源于新产品线的推出和市场 。" }{ "index" : {} }{ "title" : "员工满意度调查后来啊","content": "2022年员工满意度调查显示, 85%的员工对公司的工作环境表示满意,70%的员工对薪酬福利表示满意。

五、 运行问答系统

安装 streamlit与elasticsearch client: pip install streamlitpip install elasticsearch==8.16,要我说...

共勉。 在上述 python 文件的目录下使用如下命令运行系统: streamlit run web_

完整代码参考:

import streamlit as stfrom elasticsearch import Elasticsearchfrom hai_ds import deepseek_gptes_client = Elasticsearch)def get_elasticsearch_results: es_query = { "knn ": { "field ": "content_embedding ", “num_candidates ”: 100 , “query_vector_builder ”: { “text_embedding ”: { “model_id ”“: ”.multilingual-e5-small_linux-x86_64 ”, “model_text ”“: query } } }, “query ”:{ “match ”:{ “content ”“:query } }, “rank ”:{ “rank_fusion ”:{ “rank_window_size ”“:100 , “rank_constant ”“:20 } } } result = es_ return resultdef create_deepseek_prompt: context = "" for hit in results : source_field = hit hit_context = source_field context += f"{hit_context} " prompt = f"""Instructions :结合{context }的信息回答{question }的问题, 太暖了。 要求简练高效 """ return promptdef generate_deepseek_completion: response = deepseek_gpt response_str = str # 去掉 标签及其内容 while ' ' in response_str and '' in response_str : start_idx = response_ end_idx = response_ + len response_str = response_str + response_str return response_strdef format_result: title = hit return f ''def main : # 创建输入框和查询按钮 question = _input if : # 显示“思考中...”信息 status_text = status_ # 获取Elasticsearch后来啊并创建HunYuan提示 elasticsearch_results = get_elasticsearch_results user_prompt = create_deepseek_prompt system_prompt = f """你是一个问答任务的助手。

”,“公司2022年的财务报告是什么?”,“员工满意度调查后来啊如何? 换个赛道。 ”,“公司2023年的市场营销策略是什么?

使用呈现的上下文实事求是地回答问题。 """ # 使用deepseek模型生成回答 openai_completion = generate_deepseek_completion # 覆盖“思考中...”信息并显示后来啊 status_ # 添加换行 #展示Elasticsearch查询后来啊 references_html = "" for hit in elasticsearch_results : references_html += f "{format_result}" references_html += "" # 添加换行 # 添加推荐问题 recommended_questions=[“2023年公司计划推出的新产品有哪些?

的准确性和可靠性, 还有效避免了大模型的幻觉问题,为企业提供了更加优质的本地知识库智能问答服务。

一边, 作为国内公有云首个从自然语言处理、到向量生成/存储/检索、并与大模型集成的端到端一站式技术平台,腾讯云ES作为核心参编单位参与了由中国信通院发起的RAG标准制定,并成为首个通过RAG权威认证的企业,我狂喜。。

可见, 使用腾讯云ES与HAI部署能力,为企业打造更加智能、 我给跪了。 高效的知识库问答系统。

希望这篇文章能对你有所帮助,如果你有任何疑问或建议,欢迎留言讨论,要我说...!