所有文章 > 当前标签:DeepSeek-R1

使用DeepSeek R1、LangChain和Ollama构建端到端生成式人工智能应用
2025/07/06
本文介绍了如何使用DeepSeek R1、LangChain和Ollama构建一个端到端的生成式人工智能应用。首先,需要搭建开发环境,安装Ollama并选择合适的DeepSeek R1模型。接着,通过LangChain将DeepSeek R1与外部数据源连接,并构建提示链以实现上下文感知的交互。然后,利用Streamlit创建用户友好的界面,设计流畅的用户交互流程,并实现用户输入处理和响应生成。此外,文章还提供了优化应用程序性能的方法,如使用高性能硬件、多线程处理以及添加语音识别、多语言支持等高级功能。最后,强调了DeepSeek R1在多个领域的应用潜力,并鼓励开发者尝试新的应用场景。

DeepSeek R1 × 飞书多维表格赋能教育领域
【创新的API案例】
很多小伙伴要求出一些国内模型能直接用的教程和相关场景,官网使用DeepSeek的痛苦大家应该都有感受,最近,飞书的多维表格悄咪咪接入了 DeepSeek R1,无论是教育场景的专有名词解释、还是自媒体场景的文案创作,亦或者数据分析场景,这个组合都能让你轻松搞定!多维表格 + DeepSeek,喂饭级的教程来了!
2025/07/04

DeepSeek R1 VS Claude 3.7 Sonnet:技术架构与编码能力全解析
【API对比报告】
DeepSeek R1逻辑推理强,开源易定制,训练成本低,但长文本生成与工程类任务表现稍逊。Claude 3.7 Sonnet编程能力出色,覆盖软件开发全流程,有混合推理、输出token限制高、多模态等优势,但API使用受限,生成内容需优化,复杂项目理解及需求分析设计能力有待提升。
2025/05/28

2025年最受欢迎AI大模型API:DeepSeek、通义千问、ChatGPT
【API对比报告】
DeepSeek R1 是基于 Transformer 架构的大型语言模型,支持中英文双语处理,通过优化算法和增加训练数据提升性能,其定位是专注高端推理和复杂逻辑问题,如数学、代码等,开源且定制化程度高。通义千问 2.5 Max 是阿里巴巴推出的语言模型,暂未查到其详细信息。ChatGPT 的 GPT-4o 是 OpenAI 于 2024 年发布的多模态模型,能同时处理图像、音频和文本数据,响应速度快,处理效率高,适用于复杂多模态交互场景。
2025/05/23

国内最好用的AI大模型API技术解析:DeepSeek R1、Kimi moonshot v1 32k、Doubao 1.5 pro 256k
【API对比报告】
DeepSeek R1是基于DeepSeek-V3-Base开发的推理模型,拥有6710亿参数,每次激活370亿参数。Kimi 32k是月之暗面科技有限公司开发的AI助手Kimi的模型版本,支持32k上下文长度,具备强大的长文本处理能力。Doubao 1.5 Pro 256k是火山引擎推出的自研大语言模型专业版,支持256K长文本,具有更强的理解、生成和逻辑能力。
2025/05/22

最强AI大模型API再易主!Qwen3超越DeepSeek R1
【API对比报告】
Qwen3大模型是一款先进的自然语言处理模型,具有强大的语言理解和生成能力。它基于海量数据进行训练,能够精准地理解复杂的语言指令,并生成高质量、连贯且富有逻辑的文本内容。无论是写作、翻译还是问答,Qwen3都能表现出色,为用户提供高效、智能的语言服务,助力各领域的创新与发展。
2025/05/21

中美顶级AI大模型API大PK:DeepSeek R1、通义千问 Max、Claude3.7、GPT-4o
【API对比报告】
DeepSeek R1 是一款专注于推理优化的人工智能模型,采用大规模强化学习技术,擅长数学、代码和自然语言推理等任务,性能比肩 OpenAI-o1。通义千问 Max 是阿里巴巴推出的多模态大模型,具备强大的语言生成和图像理解能力,可广泛应用于内容创作、智能办公等场景。Claude3.7 是 Anthropic 开发的混合推理架构模型,兼具即时响应与深度推理能力,在数学竞赛和编程领域表现优异,还支持企业级代码任务。GPT-4o 是 OpenAI 的多模态推理模型,具备强大的通用能力和推理能力,支持复杂的思维链推理。
2025/05/20

2025年全球数学AI大模型深度评测与排名分析
【API对比报告】
DeepSeek-R1、Qwen-Math和GPT-4o是当前领先的大语言模型,各具特色。DeepSeek-R1由深度求索公司研发,专注于高效推理与长文本处理,适用于复杂任务;Qwen-Math由阿里云推出,强化数学推理能力,在解题与公式推导上表现突出;GPT-4o是OpenAI的最新一代多模态模型,整合文本、图像与音频处理,以强泛化能力和流畅交互见长。三者均推动AI边界,分别在高精度计算、数学专项及跨模态应用领域树立标杆。
2025/05/07

国内开源AI大模型API对比:DeepSeek R1 对比通义千问Max
【API对比报告】
DeepSeek R1和通义千问Max(Qwen 2.5)是两款优秀的国内AI大模型,DeepSeek R1以其卓越的多语言能力和强大的逻辑推理能力而闻名,而通义千问Max(Qwen 2.5) 则以其精确性和代码可靠性而闻名。本文将对DeepSeek R1和通义千问Max(Qwen 2.5)这两款国内AI大模型对比进行分析比较,重点关注语言流畅性、逻辑连贯性和信息准确性。
2025/04/21

2025年AI大模型排行:从代码生成到多模态处理,谁是最佳选择?
【AI驱动】
本文聚焦于2025年主流AI大模型的比较与选择,针对初级开发人员,从应用场景出发,深入剖析了OpenAI GPT-4.5、Google Gemini 2.0、Anthropic Claude 3.7 Sonnet和DeepSeek R1四个模型的特点与优势。文章首先阐述了AI大模型的重要性,指出其在多领域广泛应用且性能各异,合理选择模型对项目成果和资源利用至关重要。接着从模型架构、应用场景、性能指标、易用性与集成、成本与效率等维度对各模型进行详细比较,如GPT-4.5语言理解和生成能力强、适用于多种场景但成本高,Gemini 2.0在多模态任务中表现突出但资源需求大,Claude 3.7 Sonnet注重安全性和性价比,DeepSeek R1开源且在技术密集型应用中表现优异。通过代码生成案例直观展示模型差异,分析各模型输出代码的质量、效率及适用性。最后给出选择建议,根据项目需求、预算、技术能力等因素选择合适的AI大模型,以期为开发人员提供参考,助力项目成功。
2025/03/11

如何在本地运行 DeepSeek
【AI驱动】
DeepSeek-R1作为一款开源的AI模型,因其出色的性能和成本效益而受到广泛关注。它不仅在问题解决、推理和编码方面表现出色,还通过内置的链式思考推理提升了效率。本文详细介绍了如何使用Ollama在本地免费运行DeepSeek-R1模型,整个过程仅需3分钟。通过简单的安装步骤,用户可以快速下载并启动该模型,实现在本地与DeepSeek-R1的交互。此外,文章还提供了如何结合SingleStore数据库和LangChain框架构建RAG应用的教程。通过NVIDIA NIM微服务获取DeepSeek-R1的API密钥后,用户可以利用LangChain将模型与SingleStore数据库连接,实现对自定义文档的查询和分析。这一过程不仅展示了DeepSeek-R1的强大功能,还为开发者提供了在本地运行和部署AI模型的实用指南。
2025/03/07

基于DeepSeek-R1实现本地/API知识库,并接入微信BOT
【AI驱动】
本文详细介绍了搭建知识库并接入微信机器人的完整流程,包括环境配置、知识库部署、资料上传及细节调优技巧。DeepSeek 部署分为本地部署和第三方 API 调用两种方式,本地部署数据私有且响应快,但需较高硬件配置;API 调用快速接入且免维护,但数据需传输至第三方,长期成本不可控。知识库搭建使用开源框架 AnythingLLM,支持多模态模型,强调本地化和隐私保护。通过火山方舟和硅基流动平台获取 API 密钥,配置知识库时需填写相关参数,如请求地址、模型名称等。资料上传后需优化文档格式以提高 AI 理解准确性,如整理关键内容、删除无关信息。最后,通过生成 AnythingLLM 秘钥并配置 NGCBOT,将知识库接入微信机器人,实现智能问答功能。
2025/03/03

DeepSeek × 时间序列 :DeepSeek-TS,基于状态空间增强MLA与GRPO的时序预测新框架
【日积月累】
本文介绍 DeepSeek-TS,该框架受到 DeepSeek 中高效的多头潜在注意力(MLA)和群组相对策略优化(GRPO)技术的启发,并将其应用于多产品时间序列预测。 这个的方法扩展了 MLA,提出了 MLA-Mamba。MLA-Mamba 允许潜在特征通过具有非线性激活的状态空间模型动态演变,为模型提供自适应记忆,使其能够适应趋势变化。
2025/02/27

如何获取字节火山deepseek系列-api完整教程,及使用方法
【AI驱动】
API使用的几种方式:飞书多维表格调用,Coze智能体调用,浏览器插件调用。
2025/02/24

如何在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型
【AI驱动】
本文介绍了如何在IDE中使用DeepSeek-V3和DeepSeek-R1满血版模型,以及通义灵码的最新功能升级。通义灵码支持VS Code、JetBrains IDEs等多种开发环境,用户可通过插件市场或官网下载安装,并在IDE中切换使用Qwen 2.5、DeepSeek-V3、DeepSeek-R1等模型,以实现代码生成、智能补全、代码优化等功能。文章详细说明了在JetBrains IDEs和VS Code中安装通义灵码的步骤,并介绍了其核心能力,包括行级/函数级实时补全、自然语言生成代码、企业代码生成增强、智能问答以及AI程序员的多文件代码修改和单元测试生成等功能。通过这些功能,开发者可以在IDE中高效完成复杂编码任务,提升编程效率和代码质量。
2025/02/21

在 Claude 上复刻 DeepSeek-R1 效果
【AI驱动】
本文讲述了作者通过提示词工程在 Claude 上“复刻”DeepSeek-R1 使用效果的过程。作者首先介绍了 DeepSeek-R1 的特点,包括其在复杂推理任务中的卓越表现以及公开的深度思考过程。为了在 Claude 上实现类似效果,作者尝试通过调整提示词,让模型先输出推理过程再给出结论,并通过结构化标签展示思考过程。经过多次优化,最终成功模拟出 DeepSeek-R1 的深度思考框架,提升了 Claude 3.5 Sonnet 的表现。这一过程不仅实现了在 Claude 上复刻 DeepSeek-R1 效果的目标,还展示了提示词工程在优化大模型输出中的重要作用,同时为用户提供了更透明化的推理过程和更个性化的使用体验。
2025/02/20
搜索文章