所有文章 > 当前分类:日积月累
86 条 DeepSeek 的关键思考 |Best Ideas 开源
86 条 DeepSeek 的关键思考 |Best Ideas 开源
2025/03/16
01.神秘的DeepSeek “DeepSeek 最重要的事是 push 智能” 1. 创始人兼CEO梁文锋是 DeepSeek 最核心的人,和 Sam Altman 不是一类人,他是很懂技术的。 2. ...
10 万卡集群:通往 AGI 的新门票
10 万卡集群:通往 AGI 的新门票
【日积月累】 GPT-4 发布之后,一直存在一种声音认为 AI 发展低于预期,模型能力没有明显跃升,主要原因就是目前还没任何一家 AI Lab 能够大幅增加在单一模型上投入的计算量。目前市面上已发布的模型在训练计算量上基本都是 GPT-4 水平(~2e2...
2025/03/16
RL 是 LLM 的新范式
RL 是 LLM 的新范式
【日积月累】 1.强化学习及语言模型技术回顾 强化学习的核心是 exploration and exploitation 强化学习的前置内容是机器学习(Machine Learning)。上一波的 AI 浪潮主要讨论的是 ML,它是通过人标注...
2025/03/16
Vercel:用生成式UI重塑前端开发
Vercel:用生成式UI重塑前端开发
【日积月累】 1.前端开发与 Next.js 的发展 为什么关注前端市场 AGI 很可能在开发领域率先实现,因为代码比自然语言更清晰明确、是经过形式逻辑优化的语言,而且开发场景的 feedback loop 是可以由机器自己验证并迭代的,因为...
2025/03/16
LLM的范式转移:RL带来新的 Scaling Law
LLM的范式转移:RL带来新的 Scaling Law
【日积月累】 1.为什么我们期待 RL 改变 LLM 范式? 1.1 LLM 利用现有数据,RL 探索长距离推理 2018 年,Lex Fridman 邀请 Ilya 来 MIT 客座讲一节课,Ilya 选择的主题是 RL 和 self-pl...
2025/03/16
Anthropic 创始人最看好的领域,AI for Science 深度解读
Anthropic 创始人最看好的领域,AI for Science 深度解读
【日积月累】 1.研究方法 导言 生命科学公司致力于将科学发现转化为药物、诊断工具和技术,显著改善人们的生活质量。在过去 15 年,该领域取得了巨大进展:多种影响深远的药物获得批准,如新冠疫苗、检查点抑制剂(checkpoint inhibi...
2025/03/16
为什么 AGI 应用还没有大爆发
为什么 AGI 应用还没有大爆发
【日积月累】 1.搜索是 LLM 初期最大的 Killer App 张小珺:你今年依然在美国花的时间非常的多,整个上半年最大的感受是什么? Guangmi Li:GPT-4 出来一年多了但 AI 应用还没大爆发,从结果上看是比较无聊的。抛开 ...
2025/03/16
Voice Agent:AI 时代的交互界面,下一代 SaaS 入口
Voice Agent:AI 时代的交互界面,下一代 SaaS 入口
【日积月累】 1.Voice Agent 全景图  为了快速框定出端到端模型出现后什么领域会有剧烈变化、什么领域不会,我们搭建了以下框架来分析声音领域的不同场景需求。 象限分类标准:1)纵轴是该场景是否对实时性敏感,上方的需要实时在线的回答,...
2025/03/16
LLM 进化分岔口:多模态、成本、代码推理
LLM 进化分岔口:多模态、成本、代码推理
【日积月累】 1.模型更新 OpenAI 主线 1:成本下降 LLM 大模型的成本下降趋势是非常明确的,在 GPT-3.5 和 GPT-4 的模型定价上都体现得尤其明显。4o 的模型设计初衷除了大家熟知的多模态之外,就是为了推理成本优化...
2025/03/16
Twelve Labs: 多模态重塑视频内容检索
Twelve Labs: 多模态重塑视频内容检索
【日积月累】 1.Thesis • 视频的存量市场巨大,而搜索需求远未被开发;另外从增量来看,视频智能问答、摘要、分类都是新的应用 根据 Sandvine 的数据,从 2021 年到 2022 年上半年,Google、Meta 的互...
2025/03/16
Kore.ai:LLM能否为AI客服带来新一轮洗牌与机遇
Kore.ai:LLM能否为AI客服带来新一轮洗牌与机遇
【日积月累】 1.Thesis • 原有客服市场格局分散,AI 客服市场快速增长,LLM 有可能提高市场集中度 客服市场从上世纪 50 年代发展到今天,主要经历了四个阶段:传统电话客服(2000 年以前)—多渠道客服(2000 年-...
2025/03/16
AGIX ETF 上线:构建 AI-native 的投资工具
AGIX ETF 上线:构建 AI-native 的投资工具
【日积月累】 1.ChatGPT 让科技投资 进入 AI-alpha 时代 一年前,AI 是否会遭遇“互联网泡沫” 是所有人的疑问,但一年后,随着 AI 开始实打实地帮助公司获得收入增长、Nvidia 等头部公司不断 beat 预期,市场对于...
2025/03/16
AI-native 应用长什么样?
AI-native 应用长什么样?
【日积月累】 1. 什么是 AI-native 应用? 在传统企业软件领域,AI 往往作为一种补充性能力被整合到现有系统中。但随着 ChatGPT 在 2022 年底的惊艳亮相,一种全新的软件形态开始崭露头角,即AI 原生应用(AI-native ...
2025/03/16
Anthropic 联创:机制可解释性的秘密
Anthropic 联创:机制可解释性的秘密
【日积月累】 1. 什么是机制可解释性 Lex Fridman:我们可以先从机制可解释性(mechanistic interpretability) 这个概念开始讨论。 Chris Olah:我个人认为理解神经网络首先要建立一个基本的认知,也...
2025/03/16
一分钟部署 Llama3 中文大模型教程
一分钟部署 Llama3 中文大模型教程
【日积月累】 本文介绍了如何在 Sealos 平台上快速部署 Llama3 中文大模型。文章指出,Meta 最新发布的开源大模型 Llama3 在性能上逼近甚至超越了一些顶级商业模型,如 GPT-4 和 Claude3。作者推荐使用 HuggingFace 社区的 zhouzr/Llama3-8B-Chinese-Chat-GGUF 模型,该模型经过中文微调,能够更好地处理中文对话。文章详细介绍了部署过程:用户可以通过 Sealos 提供的模板快速部署 Llama3 模型,并通过 WebUI(如 Lobe Chat)进行交互。部署过程仅需几分钟,用户无需具备 GPU 资源,因为该模型支持量化,可在 CPU 上高效运行。
2025/03/13
手把手教你如何用 ComfyUI 来画出刺激的图
手把手教你如何用 ComfyUI 来画出刺激的图
【日积月累】 本文是一篇关于如何使用 ComfyUI 进行 AI 绘画的详细教程。文章首先介绍了 AI 绘画工具的分类,指出 ComfyUI 作为模型与产品分离的工具,具有高度的自由度和可拓展性。作者详细介绍了 ComfyUI 的优势,包括低显存需求、快速启动和出图能力,以及清晰的工作流设计。接着,文章提供了在 Linux 主机(包括本地和云端)上安装 ComfyUI 的步骤,包括安装 NVIDIA 驱动、Docker,配置 GPU 支持,以及拉取 ComfyUI 镜像。作者还展示了如何通过 ComfyUI 的可视化编程界面,利用节点和边构建图像生成流程,并详细解析了 ComfyUI 的工作原理,包括加载模型、输入提示词、生成潜空间图像、采样生成图像和解码图像等步骤。最后,文章展示了使用 ComfyUI 生成的高质量图片,并提供了导入和使用高级工作流的方法。
2025/03/13
1 7 8 9 10 11 176