传统回归聚类分析 + LLM 拆解内容逻辑
基于 874 条真实笔记 + 2465 条评论,双轨验证每一条诊断建议
薯医不是又一个"AI 帮你写文案"的玩具。它是一套 5 个 AI Agent 多轮辩论的诊断系统—— 内容分析师、视觉诊断师、增长策略师、用户模拟器、综合裁判,五个维度像专家会诊一样针锋相对,最终输出量化评分和可执行的优化方案。
每一条诊断建议背后,都有 874 条真实小红书笔记 + 2465 条评论的数据支撑。 我们用 Spearman 相关、线性回归、K-Means 聚类、LLM 深度分析建立了品类差异化的评分基线——不猜,不编,用数据说话。
传统统计 + LLM 深度分析,互相验证,互相补充
三轮辩论:独立诊断 → 互相质疑 → 综合裁判
美食靠标题、穿搭靠图片、旅游靠标签——一套标准不够用
从数据采集到模型验证,48 小时内完成的完整数据科学研究。
覆盖美食、穿搭、科技、旅游、生活 5 大品类。24 个 xlsx 文件自动导入,统一字段映射。
Spearman 相关 → 线性回归 → Kruskal-Wallis 检验 → K-Means 聚类 + PCA 可视化。
mimo-v2-pro 分析内容模式,mimo-v2-omni 理解封面视觉,mimo-v2-flash 分类 2465 条评论。
将统计结果转化为 5 维度评分权重,每个品类独立参数,构建可运行的评分模型。
lifestyle 品类 r=0.484***,生成 5 品类 × 5 Agent 的数据驱动提示词。
从数据采集到最终报告,每一步都有 AI 参与。不是简单的"GPT 套壳"——是一套完整的多智能体协同诊断系统。
874 条真实笔记 + 2465 条评论
Spearman · 回归 · K-Means
5 品类差异化基线
回归系数 → 品类权重
5 维度即时打分 <50ms
无 LLM 调用,纯数学
4 Agent 并行诊断
交叉质疑 · 补充论据
裁判 Agent 综合裁定
LLM 参与数据清洗
AI 生成优化方案
评分重算验证效果
视频笔记互动是图文的 2.25 倍,但 84% 创作者还在只发图文
下午 5 点发布互动量 22,632,凌晨 3 点只有 4——差 5,658 倍
0→3 个钩子,互动逐步提升。但 4 个钩子反而崩塌——用力过猛适得其反
文字只能解释 1.7% 的互动差异,剩余 98.3% 靠图片。这就是为什么需要多模态 AI
旅游赛道标签是最强预测因子,但营销感标题反而降低互动
美食赛道中等长度互动 49,724,是短文 2 倍,也远超长文
科技赛道头部是均值的 24.4 倍(赢家通吃),选赛道比优化内容更重要
最火评论 39,000 赞,超过 97% 的笔记。评论区是第二战场
| 品类 | 核心驱动 | 最强因子 | R² | 平均互动 | 爆款线 |
|---|---|---|---|---|---|
| 美食 | 标题驱动 | 标题 β=0.71 | 0.106 | 33,462 | 112,965 |
| 穿搭 | 视觉驱动 | 文本几乎无效 | 0.017 | 7,507 | 18,037 |
| 科技 | 信息密度 | 图片 β=0.41 | 0.177 | 1,275 | 3,325 |
| 旅游 | 标签策略 | 标签 β=0.52 | 0.138 | 16,563 | 39,426 |
| 生活 | 标题+标签 | 标题 β=1.00 | 0.396 | 8,038 | 17,097 |
美食 — 标题质量独大(57.3%)
穿搭 — 视觉权重最高(25%)
我们用 mimo-v2-pro 分析了每个品类的内容模式,用 mimo-v2-flash 分类了 2465 条评论。
以下是 AI 从数据中提炼的核心洞察。
爆款的核心是情绪价值:美食笔记的爆款首先需要制造强烈的感官向往和情感共鸣,‘好吃’的具象化描述比单纯的步骤罗列更重要。
穿搭品类文字特征与互动量几乎无相关性(R²=0.017),核心竞争力在视觉表现力
科技笔记标题频繁使用表情符号和感叹号来增强视觉吸引力和 engagement。
高互动内容常结合强烈情感表达(如震撼、幸福)和高质量视觉元素。
爆款笔记多围绕女性议题,如经济独立、性教育、职场平等,易引发高互动。
我们用 AI 分类了 2,465 条真实评论。
"太好看了吧!求链接" — 穿搭占比最高,情绪强度 3.8
"我也用过,建议搭配..." — 科技占比最高,平均获赞 8
"我直接住你家算了" — 生活占比最高,平均获赞 122
"真的假的?有滤镜吧" — 科技品类最多
"多少钱?哪里买的?" — 穿搭占比最高
"不错 " — 低参与度但数量最多
| 品类 | Spearman r | p 值 | 显著性 | 爆款均分 vs 普通 |
|---|---|---|---|---|
| 生活 | 0.484 | 0.0005 | *** | 75.3 vs 72.7 |
| 科技 | 0.181 | 0.005 | ** | 74.4 vs 73.3 |
| 美食 | 0.089 | 0.23 | ns | 77.7 vs 73.3 |
| 旅游 | -0.065 | 0.46 | ns | 72.9 vs 70.8 |
| 穿搭 | -0.026 | 0.66 | ns | 70.3 vs 71.7 |
"有幸在亲戚家吃过一回,被惊艳到了!!"
只用了情感+好奇心,没有任何技巧
一条没有标题的笔记,纯靠封面图
证明视觉的力量不可忽视
17:00 vs 凌晨 3 点的互动量差距
同样的内容,发布时间决定生死
科技品类负面评论占比最高
穿搭只有 8.5%——两个世界
通过社媒助手工具从小红书公开页面采集,覆盖 5 个品类:
美食(183条)· 穿搭(278条)· 科技(235条)· 旅游(130条)· 生活(48条)
评论数据 2,500 条(穿搭 177 / 科技 282 / 生活 1,744 / 未分类 254)
所有数据已脱敏,仅用于学术研究,不含个人隐私信息
后端:FastAPI + 5 Agent 辩论系统 + 评分引擎 + SSE 流式推送
前端:React 19 + MUI v9 + Framer Motion + ECharts
研究:10 个 Python 脚本 + 7 种统计方法 + 3 个 LLM 模型
产出:7 张图表 · 25 条优化提示词 · 独立评分模型 · 完整论文框架
48 小时内由 4 名 13 岁中学生完成全部开发与研究
React 19 + TypeScript + MUI v9 · Framer Motion 动画 · ECharts 雷达图 · html2canvas 导出
FastAPI + SQLite · asyncio 并行 Agent · 多模态文件处理 · SSE 流式诊断
mimo-v2-pro(诊断)· mimo-v2-omni(视觉)· mimo-v2-flash(快速任务)· 三层模型调度
scikit-learn + scipy · matplotlib · Spearman / 线性回归 / K-Means / PCA / Kruskal-Wallis