所有文章 > 当前标签:LLM

ADP IT 课程 RAG 问答 API:2 天低延迟实现
2025/08/28
📌 引言 在企业培训场景里,学员的提问往往千变万化: “这门课的实验环境怎么登陆?” “Lab3 的评分细则是什么?” 传统 FAQ 页面更新慢、命中率低;而通用大模型又容易“幻觉”出本不存在的课程章节。 RAG(Retri...

DeepSeek128K 在线 Lab 会话 API:4 天设计方案
【如何集成API】
📌 引言 在生成式 AI 爆发式增长的当下,如何用最短的时间把超长上下文(128K tokens)能力封装成可商用的 在线 Lab 会话 API,成为无数创业团队与企业的刚需。本文以真实项目为例,记录团队在 4 天 内从 0 到 1 打造 ...
2025/08/28

DeepSeek128K 编程课 AI 助教 API:3 天落地实战
【AI驱动】
📌 引言 在 2025 年,大模型(LLM)已从“炫技”走向“生产”。DeepSeek128K 编程课 AI 助教 API 的诞生,让任何教育机构都能在 3 天内 完成「AI 助教」的上线与调优。本文用真实案例、数据、代码、流程图带你从 0...
2025/08/28

基于阿里Qoder的求职自我介绍文生视频API生成与优化技术
【AI驱动】
引言:为什么视频简历会成为 2025 求职新标配? 2024 年 9 月,LinkedIn 发布《全球招聘趋势报告》指出: 年度 传统图文简历占比 视频简历占比 HR 平均查看时间 2022 94 % 6 % 7.2 秒 ...
2025/08/24

200行python代码实现LLM
【AI驱动】
通过200行Python代码,从零实现一个极简大语言模型(LLM)。作者以诗词生成为切入点,先用传统方式构建基于统计的Bigram模型,再引入PyTorch实现更高效的模型版本。过程中详细解释了词汇表构建、模型训练与推理等关键步骤,还对比了自建模型与真实LLM的tokenizer差异。最终,借助PyTorch的Embedding层和线性层,搭建出能生成类似诗词文本的模型,为理解LLM架构和原理提供了直观示例,也为后续实现更复杂模型奠定基础。
2025/05/30

中文LLM(大语言模型API)排行榜:DeepSeek、通义千问、腾讯混元
【API对比报告】
国内LLM语言大模型近年来发展迅猛,成为人工智能领域的热门方向。这些模型基于海量中文语料训练,能够精准理解与生成自然语言文本,广泛应用于智能问答、文本创作、语言翻译等场景。它们不仅提升了语言处理的智能化水平,还推动了相关产业的创新与发展,展现出强大的技术实力和广阔的应用前景,成为国内AI领域的重要力量。
2025/04/29

【LLM落地应用实战】LLM + TextIn文档解析技术实测
【AI驱动】
本文探讨了LLM与TextIn文档解析技术的结合应用,分析了现有大模型在文档解析中的挑战,如图像处理、版面分析、内容识别和语义理解的难题。TextIn通过其强大的技术实力,提供了精准的文档解析解决方案,使文档信息能够快速、准确地转化为计算机可处理的格式,并与LLM结合进行深层次的内容分析和任务处理。通过TextIn和LLM的结合,可以实现对复杂文档的高效解析和信息提取,提升文档处理能力。
2025/03/12

TensorRT-LLM 在 PyPi 上的安装与配置指南
【日积月累】
本文介绍了如何通过 PyPi 安装和配置 TensorRT-LLM,以提升大规模语言模型的推理性能。TensorRT-LLM 是一个高效的推理框架,支持多种量化技术如 FP16 和 INT8,能够显著降低推理延迟和提高吞吐量。安装前需确保系统满足基本要求,如 CUDA 版本为 12.2 或更高,并推荐使用特定的 PyTorch 镜像。在 Docker 环境中,通过 PyPi 安装相关 Python 包及 TensorRT,配置环境变量后进行模型构建和推理。
2025/02/06

LLM产品经理的角色与机遇
【日积月累】
LLM产品经理在现代科技和商业领域中扮演着重要角色,负责大型语言模型的产品开发与管理。他们需要结合LLM技术与市场需求,制定产品策略,具备技术背景和商业敏锐度。核心职责包括需求分析、项目管理、技术沟通和市场推广。LLM产品经理面临技术复杂性和市场不确定性等挑战,通过不断学习和创新,他们能够在医疗、金融等新兴领域探索更多机遇,推动产品和行业发展。
2025/02/01

从零开始创建自己的llm:深入探索与实践指南
【日积月累】
从GPT-3到BERT,这些模型在文本生成、翻译、问答等任务中展现了强大的能力。然而,大多数开发者依赖于预训练模型,缺乏对LLM底层原理和实现细节的深入理解。本文旨在引导读者从零开始创建自己的LLM,涵盖从理论基础到实际操作的完整流程,帮助开发者深入掌握LLM的核心技术。
2025/01/16

大语言模型技术是什么?
【日积月累】
本文聚焦大语言模型技术 Large Language Model,简称LLM,详述其基于深度学习利用海量文本经预训练与微调掌握语言规律的原理,介绍 Transformer 架构及训练机制;梳理从萌芽至爆发增长各阶段历程;展现内容创作、客服、开发等多领域应用;剖析数据、可解释性、伦理等挑战;展望架构、效率、应用拓展及协同发展趋势,全面解读该技术现状与未来走向
2025/01/09