知识信息(语料视图)
语料视图是用于管理和操作语料相关内容的重要模块,支持对语料进行编辑、索引管理、关联等一系列操作,助力用户高效管理知识语料。一、语料切片基础查看
在语料视图中,能直观看到语料被切分成众多切片(如示例图中 “53AI 产品说明” 被拆分为多个切片)。页面左上角清晰展示语料的切片数以及语料被召回数(如 “切片数:19 命中数:82”),方便用户实时掌握语料的整体拆分与召回情况,为后续语料管理提供数据参考。
二、语料切片操作
(一)拆分与合并
对语料切片进行拆分或者合并操作后,系统会弹出提示框(如 “更新了 6 个语料片段,是否同步更新检索块?”),此时可根据需求选择 “更新” 以同步更新索引块,使索引与语料切片的最新状态保持一致;或选择 “暂不更新”,暂不同步索引块,待后续统一处理。
(二)启用与禁用
每个切片的右上角都设有启用 / 禁用状态标识(如绿色 “已启用”、红色 “已停用”),点击可对切片进行启用或禁用操作,灵活控制切片的可用状态,便于管理不同阶段、不同重要性的语料切片。
(三)内容编辑
单击选择切片后,点击切片右上角的 “编辑” 按钮(如切片右上角的 “编辑” 标识),可进入切片内容编辑模式,对切片内的文字、图片等内容进行修改;同时,也能对切片的索引进行编辑,点击后会弹出该切片的索引块编辑界面(如右侧弹出的包含 “检索块”“内容摘要” 等的编辑区域)。
三、索引块操作
(一)拆分、合并与编辑
在弹出的切片索引块编辑界面中,可对索引块进行拆分或者合并操作,根据语料内容的逻辑和检索需求,调整索引块的结构,编辑索引块,修改内容等,提升索引的精准性。
(二)内容概要与知识点关联设置
- 内容概要设置:在索引块的 “内容摘要” 栏,可手动输入对索引内容的简要概括,让用户能快速了解索引对应的核心信息。
-
知识点关联设置:点击 “添加” 关联知识点时,会弹出选择其他文档切片的窗口(如 “添加” 窗口中展示的目录及切片列表),在窗口中可通过左侧目录选择要关联的语料文档,或在搜索框输入关键词(如 “销售漏斗”)查找相关语料切片,勾选目标切片后点击 “确定”,完成知识点关联设置,增强知识间的关联性与系统性。
(三)删除
在切片索引块编辑界面,点击垃圾桶图标,可对切片进行删除操作,及时清理无用或错误的语料切片与索引块。四、批量索引更新、启用/禁用
(一)入口
点击页面右上角的 “拆分索引””启用/禁用“ 按钮或者左边已选列表的 “拆分索引”(如左侧勾选文档后的 “拆分索引” 选项),可对多选的知识进行启用/禁用,进入重新索引设置页面。
(二)模式选择
- 1、重新拆分并更新:进入该模式的设置界面后,可设置知识点(如拆分校验按二级标题(H2)拆分等)、索引块(如拆分规则、最大长度等)、高级设置(如拆分时将知识标题追加到默认索引、内容摘要和常见问法的生成方式等)等相关内容,完成设置后点击 “保存并处理”,执行重新拆分并更新索引的操作,使索引与语料的拆分、内容更新完全同步。
- 2、仅更新索引:选择该模式则只对索引进行更新,无需进行拆分等额外设置操作,点击 “确定” 即可完成索引更新,适用于仅需更新索引状态的场景。
五、召回测试功能
(一)功能概述
召回测试用于验证知识体系对提问内容的匹配精准度,通过输入问题,系统会从已有知识中筛选出匹配度最高的 Top10 内容,既帮助评估知识召回效果,也可用于模型的标注与调优。
(二)操作流程
1、进入召回测试页面
在左侧导航栏,点击「召回测试」选项,进入功能界面。2、发起测试
- 输入问题:在「提问」输入框中,输入待测试的问题(如示例中 “介绍下 53AI 公司”)。
- 执行测试:点击「测试」按钮,系统会从知识体系中筛选匹配内容。
3、查看匹配结果
右侧「匹配度 Top10」区域会展示结果列表,每条结果包含:- 得分:匹配度分值(得分越高,与问题的匹配度越高)。
- 数据源:标注内容来自哪份文档(如 “产品研发 / 技术栈 / 胃瘤疾病基础知识.docx”)。
- 内容预览:展示与问题匹配的核心片段,快速判断召回准确性。
- 启用状态:标注 “已启用”,表示该数据源当前可被召回(可在文档管理中调整状态)。
4、历史查询记录
「最近查询」区域会记录过往测试的问题与时间(如 “介绍下 53AI 公司 2025-05-23 15:45”),方便回溯历史测试、对比召回效果。(三)文档详情与检索配置(点击结果进入)
点击「匹配度 Top10」中的任意结果,可进入对应文档的详情页,进行更细致的知识与检索配置:
1、知识点编辑区(左侧)
可对文档的知识点内容进行编辑,支持修改文字、插入图片 / 表格等,与普通文档编辑逻辑一致。2、检索块配置区(右侧)
用于优化知识的召回逻辑,包含:- 默认索引:提取文档核心内容生成索引片段(如 “53AIHub 是一款开源的 AI 门户……”),助力模型快速匹配问题。
- 内容摘要:手动添加 / 修改文档核心概括,帮助快速了解文档主旨。
- 常见问法:预设用户可能的相关问题(如 “SSO 在销售中具体指什么?”),丰富召回的触发场景。
- 关联知识点:添加与当前文档相关的其他知识点,强化知识关联,提升召回全面性。