Products
GG网络技术分享 2026-04-15 15:18 4
哎呀, 这篇《如何构建AI智能体,将非结构化文本转化为结构化医疗知识图谱?》的标题听起来像是老板交代的任务,却总觉得自己像在给一只懒猫喂鱼罐头——味道有点腥, 出道即巅峰。 又不太好吃。先来个大喊:别指望这篇文章像光纤一样顺滑它更像是老旧的拨号上网。
先把那堆医院报告、医生笔记、患者自述全都塞进一个巨大的字符串里——你可以想象成把一堆碎纸片往锅里倒,等着沸腾出味道。然后用正则表达式硬砸一下把“血糖高”“血压偏高”之类的关键词挑出来。 如果正则写得不好,后来啊可能会出现:

这时候只能哭笑不得地加一段噪声过滤——比如随机丢掉5%到10%的句子,让模型学会在缺失信息中生存。
交学费了。 ⚙️ 步骤1:选一个大模型,给它喂食「实体识别」任务。 ⚙️ 步骤2:让模型输出 的列表;如果模型跑偏,就手动补齐:比如把“胰岛素”标记为DRUG。
⚙️ 步骤3:再让模型玩「关系抽取」——从文本里找出 三元组。这里最常见的关系有:,操作一波...
| 关系类型 | 示例 |
|---|---|
| TREATS | |
| CAUSES | |
| HAS_SYMPTOM | |
| IS_A | |
| USES |
def extract_entities_with_llm:
prompt = f"""请从以下医疗文本中识别实体...{text}"""
# 调用模型
response = model_api
# 假装解析JSON
return
def extract_relations_with_llm:
prompt = f"""请分析以下文本并抽取关系...{text}"""
response = model_api
return
# 构建图
graph = {}
for txt in medical_texts:
ents = extract_entities_with_llm
rels = extract_relations_with_llm
# 随手塞进去
for e,t in ents: graph = t
for s,r,o in rels: print
============================================================ 开始使用Qwen大模型构建医疗知识图谱... ============================================================ 开始从 8 条文本构建知识图谱 ------------------------------------------------------------ 处理文本 1/8: 糖尿病是一种慢性疾病,其特征是高血糖,摆烂。。
常见症状包括多饮、多尿和多食。... 调用Qwen大模型进行实体识别, 耗时: 5.49秒 成功提取到 5 个实体: 调用Qwen大模型进行关系抽取,耗时: 20.72秒 成功提取到 4 个关系: ------------------------------------------------------------ 处理文本 2/8: 高血压患者需要定期服用降压药,如氨氯地平或缬沙坦,躺平。。
| 2025年AI平台功能对比 | |||
|---|---|---|---|
| # | 平台名称 | 支持中文NLP? | 价格 |
| 1️⃣ | LunaAI 🔮 | ✅ | ¥199 |
| 2️⃣ | MarsGPT 🚀 | ✅ | ¥299 |
| 3️⃣ | |||
Demand feedback