所有文章
> 当前分类:日积月累

86 条 DeepSeek 的关键思考 |Best Ideas 开源
2025/03/16
01.神秘的DeepSeek “DeepSeek 最重要的事是 push 智能” 1. 创始人兼CEO梁文锋是 DeepSeek 最核心的人,和 Sam Altman 不是一类人,他是很懂技术的。 2. ...

10 万卡集群:通往 AGI 的新门票
【日积月累】
GPT-4 发布之后,一直存在一种声音认为 AI 发展低于预期,模型能力没有明显跃升,主要原因就是目前还没任何一家 AI Lab 能够大幅增加在单一模型上投入的计算量。目前市面上已发布的模型在训练计算量上基本都是 GPT-4 水平(~2e2...
2025/03/16

RL 是 LLM 的新范式
【日积月累】
1.强化学习及语言模型技术回顾 强化学习的核心是 exploration and exploitation 强化学习的前置内容是机器学习(Machine Learning)。上一波的 AI 浪潮主要讨论的是 ML,它是通过人标注...
2025/03/16

Vercel:用生成式UI重塑前端开发
【日积月累】
1.前端开发与 Next.js 的发展 为什么关注前端市场 AGI 很可能在开发领域率先实现,因为代码比自然语言更清晰明确、是经过形式逻辑优化的语言,而且开发场景的 feedback loop 是可以由机器自己验证并迭代的,因为...
2025/03/16

LLM的范式转移:RL带来新的 Scaling Law
【日积月累】
1.为什么我们期待 RL 改变 LLM 范式? 1.1 LLM 利用现有数据,RL 探索长距离推理 2018 年,Lex Fridman 邀请 Ilya 来 MIT 客座讲一节课,Ilya 选择的主题是 RL 和 self-pl...
2025/03/16

Anthropic 创始人最看好的领域,AI for Science 深度解读
【日积月累】
1.研究方法 导言 生命科学公司致力于将科学发现转化为药物、诊断工具和技术,显著改善人们的生活质量。在过去 15 年,该领域取得了巨大进展:多种影响深远的药物获得批准,如新冠疫苗、检查点抑制剂(checkpoint inhibi...
2025/03/16

为什么 AGI 应用还没有大爆发
【日积月累】
1.搜索是 LLM 初期最大的 Killer App 张小珺:你今年依然在美国花的时间非常的多,整个上半年最大的感受是什么? Guangmi Li:GPT-4 出来一年多了但 AI 应用还没大爆发,从结果上看是比较无聊的。抛开 ...
2025/03/16

Voice Agent:AI 时代的交互界面,下一代 SaaS 入口
【日积月累】
1.Voice Agent 全景图 为了快速框定出端到端模型出现后什么领域会有剧烈变化、什么领域不会,我们搭建了以下框架来分析声音领域的不同场景需求。 象限分类标准:1)纵轴是该场景是否对实时性敏感,上方的需要实时在线的回答,...
2025/03/16

LLM 进化分岔口:多模态、成本、代码推理
【日积月累】
1.模型更新 OpenAI 主线 1:成本下降 LLM 大模型的成本下降趋势是非常明确的,在 GPT-3.5 和 GPT-4 的模型定价上都体现得尤其明显。4o 的模型设计初衷除了大家熟知的多模态之外,就是为了推理成本优化...
2025/03/16

Twelve Labs: 多模态重塑视频内容检索
【日积月累】
1.Thesis • 视频的存量市场巨大,而搜索需求远未被开发;另外从增量来看,视频智能问答、摘要、分类都是新的应用 根据 Sandvine 的数据,从 2021 年到 2022 年上半年,Google、Meta 的互...
2025/03/16

Kore.ai:LLM能否为AI客服带来新一轮洗牌与机遇
【日积月累】
1.Thesis • 原有客服市场格局分散,AI 客服市场快速增长,LLM 有可能提高市场集中度 客服市场从上世纪 50 年代发展到今天,主要经历了四个阶段:传统电话客服(2000 年以前)—多渠道客服(2000 年-...
2025/03/16

AGIX ETF 上线:构建 AI-native 的投资工具
【日积月累】
1.ChatGPT 让科技投资 进入 AI-alpha 时代 一年前,AI 是否会遭遇“互联网泡沫” 是所有人的疑问,但一年后,随着 AI 开始实打实地帮助公司获得收入增长、Nvidia 等头部公司不断 beat 预期,市场对于...
2025/03/16

AI-native 应用长什么样?
【日积月累】
1. 什么是 AI-native 应用? 在传统企业软件领域,AI 往往作为一种补充性能力被整合到现有系统中。但随着 ChatGPT 在 2022 年底的惊艳亮相,一种全新的软件形态开始崭露头角,即AI 原生应用(AI-native ...
2025/03/16

Anthropic 联创:机制可解释性的秘密
【日积月累】
1. 什么是机制可解释性 Lex Fridman:我们可以先从机制可解释性(mechanistic interpretability) 这个概念开始讨论。 Chris Olah:我个人认为理解神经网络首先要建立一个基本的认知,也...
2025/03/16

一分钟部署 Llama3 中文大模型教程
【日积月累】
本文介绍了如何在 Sealos 平台上快速部署 Llama3 中文大模型。文章指出,Meta 最新发布的开源大模型 Llama3 在性能上逼近甚至超越了一些顶级商业模型,如 GPT-4 和 Claude3。作者推荐使用 HuggingFace 社区的 zhouzr/Llama3-8B-Chinese-Chat-GGUF 模型,该模型经过中文微调,能够更好地处理中文对话。文章详细介绍了部署过程:用户可以通过 Sealos 提供的模板快速部署 Llama3 模型,并通过 WebUI(如 Lobe Chat)进行交互。部署过程仅需几分钟,用户无需具备 GPU 资源,因为该模型支持量化,可在 CPU 上高效运行。
2025/03/13

手把手教你如何用 ComfyUI 来画出刺激的图
【日积月累】
本文是一篇关于如何使用 ComfyUI 进行 AI 绘画的详细教程。文章首先介绍了 AI 绘画工具的分类,指出 ComfyUI 作为模型与产品分离的工具,具有高度的自由度和可拓展性。作者详细介绍了 ComfyUI 的优势,包括低显存需求、快速启动和出图能力,以及清晰的工作流设计。接着,文章提供了在 Linux 主机(包括本地和云端)上安装 ComfyUI 的步骤,包括安装 NVIDIA 驱动、Docker,配置 GPU 支持,以及拉取 ComfyUI 镜像。作者还展示了如何通过 ComfyUI 的可视化编程界面,利用节点和边构建图像生成流程,并详细解析了 ComfyUI 的工作原理,包括加载模型、输入提示词、生成潜空间图像、采样生成图像和解码图像等步骤。最后,文章展示了使用 ComfyUI 生成的高质量图片,并提供了导入和使用高级工作流的方法。
2025/03/13
搜索文章
热门话题