API商城
提示词商城
AI大模型
API提供商
API知识库
产品和服务
控制台
所有文章
> 当前标签:
大模型RAG
大模型RAG问答行业最佳案例及微调、推理双阶段实现模式
2025/03/03
该工作所提出的模块化(Modular)RAG比较有趣,因此,今天我们来看看这个话题,价值之一在于,对RAG各个模块的方案进行了归置,对建立体系认知有帮助,供大家一起参考
微调碾压RAG?大模型意图识别工程化实践
【AI驱动】
文章探讨了大模型在智能电视意图识别中的应用与工程化实践,对比了基础模型、RAG(检索增强生成)和微调模型三种方案的优缺点。智能电视行业正借助AI大模型的自然语言处理和逻辑推理能力提升用户体验,但传统NLP算法在复杂语境下的意图识别、上下文理解和多轮对话方面存在局限性。文章详细介绍了三种方案的特点、模型选择、实现方法及优缺点:方案一(基础模型+Prompt)开发成本低,但对垂类领域分类识别能力有限;方案二(基础模型+Prompt+RAG)通过知识库增强意图分类能力,但存在延迟和幻觉问题;方案三(小尺寸模型微调)通过LoRA微调解决延迟问题,同时利用微调提升数据增强效果。最终,作者选择了7B底座的微调方案,并通过自动质检和自动微调工程链路实现生产准确率的持续优化。该方案在某国产头部电视厂家落地后,平均延迟500ms,实时准确率达到98%以上,显著提升了用户体验。
2025/02/21
搜索、试用、集成国内外API!
幂简集成
API平台
已有
6657
种API!
API大全
搜索文章