
模型压缩四剑客:量化、剪枝、蒸馏、二值化
从“玄学流量”爆发到个人开发者量产星座内容,如何用不到 8 块钱跑通一条AI 占星流水线?
本文带你从 0 到 1 搭建完整系统:API 接入、语料构建、LoRA 微调、vLLM 推理、平台自动发布,全流程实操 + 源码开源 + 成本测算。
(全文约 4800 字,含一键运行链接)
我们要做的,不是再多一个“神婆”,而是打造一个能:
✅ 支持日更 + 周更 + 月更报告
✅ 每篇 300–500 字,完全零人工参与
✅ 输出风格接近真人占星博主
✅ 成本低于 0.002 元 / 篇
功能 | 方案 | 理由 | 链接 |
---|---|---|---|
星盘数据 | Astro-Seek API | 免费稳定,返回相位/宫位/月相等详细参数 | 官方链接 |
模型基座 | Chinese-LLaMA-2-7B | 中文表现优秀,支持本地推理 | HuggingFace |
微调框架 | PEFT + LoRA | 轻量灵活,单卡 3 小时训练完 | PEFT 文档 |
推理加速 | vLLM | 高吞吐,吞吐量提升 8× | vLLM |
调度 | Prefect 3.0 | 图形化可视 DAG,方便定时任务管理 | Prefect Docs |
/daily-planets
端点获取每日天象数据示例返回:
{
"sun": {"sign": "狮子", "degree": 9.4},
"moon": {"sign": "摩羯", "degree": 12.7},
"aspects": [{"p1": "太阳", "p2": "木星", "angle": 60, "type": "六合"}]
}
最终格式统一成:
<星象>太阳六合木星<星象>
<星座>白羊座<星座>
<运势>今天你会遇到职场贵人,穿红色增强运势!<运势>
共计 70 万条训练样本,9.3MB 纯文本。
完整训练代码与参数请见文中片段(支持复制粘贴直接使用)
vLLM
启动 OpenAI API 兼容服务支持定时发布、自动格式化 Markdown、图文导出等
实测性能:单卡 QPS 45,生成 12 星座内容耗时 14 秒
显存占用 < 7.5 GB,支持多卡扩展
平台集成一览:
平台 | 工具 | 功能 |
---|---|---|
小红书 | XHS-Auto-Publisher | 自动加话题/图片上传 |
公众号 | Wechaty | 定时群发/草稿发布 |
Notion | Notion API | 数据库写入,可自动排版 |
你只需要在 cron 中调用生成结果,即可自动完成平台分发。
成本项 | 单价 | 用量 | 月成本 |
---|---|---|---|
Astro-Seek API | 前 1000 次免费,超出 0.0002 \$/次 | 每日 12 次 | 0 元 |
GPU 云主机(3090) | 1.2 元 / 小时 | 每日 12 星座仅需 0.2h | 7.2 元/月 |
本地推理 | 免费 | – | – |
📉 总成本:7.2 元 / 月
对比人工写稿:节省 99.8% 成本 + 无限扩容能力
开源仓库(含数据结构、微调脚本、生成脚本、自动发布):
🔗 GitHub 仓库
快速启动:
git clone https://github.com/yourname/ai-horoscope-pipeline.git
cd ai-horoscope-pipeline
docker-compose up -d
首次运行约 5 分钟后,即可访问 http://localhost:8000/docs
进行在线测试。
/moon-voc
端点补充用 7B 中文模型 + Astro-Seek 数据 + LoRA 微调,仅需 7 元/月,即可产出媲美真人博主的星座运势内容。
适合开发者、内容创作者和运营团队实现 零人力内容生产闭环。
👣 现在就启动一条你的 AI 占星流水线:
docker-compose up
12 星座的明日运势,正在你的 GPU 里悄悄生成。