所有文章
> 当前分类:日积月累
LLM的范式转移:RL带来新的 Scaling Law
2025/03/16
1.为什么我们期待 RL 改变 LLM 范式? 1.1 LLM 利用现有数据,RL 探索长距离推理 2018 年,Lex Fridman 邀请 Ilya 来 MIT 客座讲一节课,Ilya 选择的主题是 RL 和 self-pl...
Anthropic 创始人最看好的领域,AI for Science 深度解读
【日积月累】
1.研究方法 导言 生命科学公司致力于将科学发现转化为药物、诊断工具和技术,显著改善人们的生活质量。在过去 15 年,该领域取得了巨大进展:多种影响深远的药物获得批准,如新冠疫苗、检查点抑制剂(checkpoint inhibi...
2025/03/16
为什么 AGI 应用还没有大爆发
【日积月累】
1.搜索是 LLM 初期最大的 Killer App 张小珺:你今年依然在美国花的时间非常的多,整个上半年最大的感受是什么? Guangmi Li:GPT-4 出来一年多了但 AI 应用还没大爆发,从结果上看是比较无聊的。抛开 ...
2025/03/16
Voice Agent:AI 时代的交互界面,下一代 SaaS 入口
【日积月累】
1.Voice Agent 全景图 为了快速框定出端到端模型出现后什么领域会有剧烈变化、什么领域不会,我们搭建了以下框架来分析声音领域的不同场景需求。 象限分类标准:1)纵轴是该场景是否对实时性敏感,上方的需要实时在线的回答,...
2025/03/16
LLM 进化分岔口:多模态、成本、代码推理
【日积月累】
1.模型更新 OpenAI 主线 1:成本下降 LLM 大模型的成本下降趋势是非常明确的,在 GPT-3.5 和 GPT-4 的模型定价上都体现得尤其明显。4o 的模型设计初衷除了大家熟知的多模态之外,就是为了推理成本优化...
2025/03/16
Twelve Labs: 多模态重塑视频内容检索
【日积月累】
1.Thesis • 视频的存量市场巨大,而搜索需求远未被开发;另外从增量来看,视频智能问答、摘要、分类都是新的应用 根据 Sandvine 的数据,从 2021 年到 2022 年上半年,Google、Meta 的互...
2025/03/16
Kore.ai:LLM能否为AI客服带来新一轮洗牌与机遇
【日积月累】
1.Thesis • 原有客服市场格局分散,AI 客服市场快速增长,LLM 有可能提高市场集中度 客服市场从上世纪 50 年代发展到今天,主要经历了四个阶段:传统电话客服(2000 年以前)—多渠道客服(2000 年-...
2025/03/16
AGIX ETF 上线:构建 AI-native 的投资工具
【日积月累】
1.ChatGPT 让科技投资 进入 AI-alpha 时代 一年前,AI 是否会遭遇“互联网泡沫” 是所有人的疑问,但一年后,随着 AI 开始实打实地帮助公司获得收入增长、Nvidia 等头部公司不断 beat 预期,市场对于...
2025/03/16
AI-native 应用长什么样?
【日积月累】
1. 什么是 AI-native 应用? 在传统企业软件领域,AI 往往作为一种补充性能力被整合到现有系统中。但随着 ChatGPT 在 2022 年底的惊艳亮相,一种全新的软件形态开始崭露头角,即AI 原生应用(AI-native ...
2025/03/16
Anthropic 联创:机制可解释性的秘密
【日积月累】
1. 什么是机制可解释性 Lex Fridman:我们可以先从机制可解释性(mechanistic interpretability) 这个概念开始讨论。 Chris Olah:我个人认为理解神经网络首先要建立一个基本的认知,也...
2025/03/16
一分钟部署 Llama3 中文大模型教程
【日积月累】
本文介绍了如何在 Sealos 平台上快速部署 Llama3 中文大模型。文章指出,Meta 最新发布的开源大模型 Llama3 在性能上逼近甚至超越了一些顶级商业模型,如 GPT-4 和 Claude3。作者推荐使用 HuggingFace 社区的 zhouzr/Llama3-8B-Chinese-Chat-GGUF 模型,该模型经过中文微调,能够更好地处理中文对话。文章详细介绍了部署过程:用户可以通过 Sealos 提供的模板快速部署 Llama3 模型,并通过 WebUI(如 Lobe Chat)进行交互。部署过程仅需几分钟,用户无需具备 GPU 资源,因为该模型支持量化,可在 CPU 上高效运行。
2025/03/13
手把手教你如何用 ComfyUI 来画出刺激的图
【日积月累】
本文是一篇关于如何使用 ComfyUI 进行 AI 绘画的详细教程。文章首先介绍了 AI 绘画工具的分类,指出 ComfyUI 作为模型与产品分离的工具,具有高度的自由度和可拓展性。作者详细介绍了 ComfyUI 的优势,包括低显存需求、快速启动和出图能力,以及清晰的工作流设计。接着,文章提供了在 Linux 主机(包括本地和云端)上安装 ComfyUI 的步骤,包括安装 NVIDIA 驱动、Docker,配置 GPU 支持,以及拉取 ComfyUI 镜像。作者还展示了如何通过 ComfyUI 的可视化编程界面,利用节点和边构建图像生成流程,并详细解析了 ComfyUI 的工作原理,包括加载模型、输入提示词、生成潜空间图像、采样生成图像和解码图像等步骤。最后,文章展示了使用 ComfyUI 生成的高质量图片,并提供了导入和使用高级工作流的方法。
2025/03/13
通过内网代理工具frp轻松将本地服务暴露到公网
【日积月累】
本文介绍了 frp(Fast Reverse Proxy),一款开源的内网代理工具,能够轻松将内网服务暴露到公网。frp 使用 Go 语言编写,支持 TCP、UDP、HTTP、HTTPS 等多种协议,并具备丰富的功能,如自定义域名、负载均衡、加密传输等。文章详细解析了 frp 的架构和工作原理,包括在公网服务器上部署 frp 服务端(frps)和在内网服务器上部署客户端(frpc)以建立反向代理通道。此外,文章还对比了 frp 与其他内网代理解决方案(如 ngrok 和 Cloudflare Tunnel),指出 frp 在开源友好度、功能灵活性和成本控制上的优势。部署方面,作者推荐通过 Sealos 应用商店一键部署 frp,简化安装过程。使用示例包括将本地 Web 服务暴露到公网、TCP 服务代理(如 SSH)、加密与压缩传输以及负载均衡配置。文章总结 frp 的优势为使用简单、功能强大、性能出色、可扩展性强和社区活跃,适合个人开发测试及小型团队使用。
2025/03/13
3分钟教你接入超低价 DeepSeek-V3
【日积月累】
本文介绍了如何将 Cursor 编程工具接入超低价的 DeepSeek-V3 模型,以降低使用成本。作者指出,DeepSeek-V3 的价格非常实惠,每百万输入 tokens 仅需 0.1 元(缓存命中)或 1 元(缓存未命中),输出 tokens 每百万 2 元,性价比极高。通过 Sealos AI Proxy,用户可以以官方定价接入 DeepSeek-V3 模型,无需支付额外费用。文章详细介绍了接入过程:用户需要登录 Sealos Cloud,创建一个新的 API Key,然后在 Cursor 的设置中添加自定义模型,将模型名称设置为 `deepseek-chat`,并输入 Sealos AI Proxy 的 API 地址和 API Key。完成这些步骤后,用户即可在 Cursor 中使用 DeepSeek-V3 模型进行代码生成和对话交互。
2025/03/13
使用 Goland 远程开发基于 MCP 的智能对话助手
【日积月累】
本文介绍了如何使用 JetBrains Goland 远程开发基于 MCP(Model Context Protocol)的智能对话助手。作者首先介绍了 MCP 协议的核心思想:通过程序读取大模型的格式化输出并自动执行某些操作。基于这一理念,作者展示了如何在 Sealos 平台上创建一个 Go 语言开发的对话助手,而无需依赖官方的 Go SDK 或受限于客户端选择。开发环境通过 Sealos Devbox 创建,利用云端算力解决本地开发资源不足的问题。核心代码实现包括加载 MCP 服务、生成提示词、对话循环和工具调用等功能。通过配置本地的 `server.json` 文件,开发者可以定义工具的名称、参数和描述,使得大模型能够调用这些工具来执行特定任务。文章还展示了实际运行效果,证明了该方案的可行性和稳定性。
2025/03/13
使用Cursor 和 Devbox 一键搞定开发环境
【日积月累】
本文介绍了如何使用 Cursor 和 Devbox 快速搭建开发环境并连接数据库,极大地简化了传统开发中繁琐的环境配置过程。作者通过实际操作展示了如何在 Sealos 平台上创建一个 MySQL 数据库,并通过 Devbox 创建 Go 语言的开发环境。借助 Cursor 编程 IDE,开发者可以快速初始化项目、安装依赖并使用 GORM 框架连接数据库,实现用户数据的增删改查操作。文章还提到可以通过 Cursor 的 AI 能力进一步完善项目,例如添加数据验证和接口化等功能。这种开发模式让开发者能够专注于核心业务逻辑,而不是被环境配置所困扰。
2025/03/13
搜索文章
热门话题