知乎直答是知乎集团于 2024 年 6 月正式推出的AI 搜索与问答平台,其核心价值在于以社区专业内容为基础,结合大模型技术重构信息获取方式。
知乎直答采用检索 – 生成 – 验证的混合架构,核心技术包括:
- 多模态数据整合:整合知乎社区 8.3 亿条问答数据、维普等 5000 万篇中英文文献,覆盖政策法规、学术论文、行业报告等多维度内容。
- 语义召回优化:通过 BGE Embedding 模型调优,结合语义召回、标签召回和向量空间对齐,实现搜索准确率提升 30%1。例如,输入 “碳中和政策对企业影响”,系统可关联 “碳关税”“碳捕获技术” 等 20 余个细分领域。
- 分块处理(Chunk):采用动态文本切片算法,将长文档切分为 200-500 字的段落,解决大模型 “信息丢失” 问题,响应速度提升 40%。
- 多智能体协同:通过定制大模型的函数调用能力,实现信息查询、数学计算、代码生成等功能的分工处理,例如分析财报数据时调用专业财务模型。
- 多轮对话理解:通过上下文记忆和意图解析,支持连续追问。例如用户提问 “如何选择充电桩”,系统进一步询问 “安装环境”“预算”,最终推荐 3 款匹配型号并分析优劣势。
- 思维链提示词工程:在复杂问题(如 “量子计算商业化路径”)中,通过提示词引导模型分步骤推理,生成结构化回答。
- 专业搜索:支持上传 PDF 文件并直接解析,例如上传学术论文可自动提取研究方法、实验数据并生成摘要,翻译准确率达 95%。
- 内容溯源:每轮回答标注信息来源,用户点击可跳转至知乎答主原文或论文链接。例如输入 “MCP 是什么?”,系统引用 41 个来源,其中 32 个为知乎专业答主内容。
- 多模态交互:支持语音、拍照输入,例如拍摄食物照片可自动计算卡路里并生成健康建议。
- 学术研究:科研人员输入 “深度学习在地质储层预测中的应用”,系统整合 50 篇中英文论文,生成文献综述并标注高被引论文。
- 职场效率:企业用户上传招标文档后,系统自动提取技术要求、评分标准,生成结构化标书框架,并推荐 3 年内中标率超 60% 的案例。
- 生活服务:输入 “北京周边亲子游”,系统结合实时数据推荐景点、酒店,并生成行程规划,信息获取效率提升 50%。