将HelloWorld在Windows、Mac、iOS与Android的销售数据放在同一度量体系下比较:先统一口径(时间范围、币种、归因规则)、再做基数标准化(按活跃设备或安装量)、拆解转化与留存差异、用统计检验判断显著性,最后结合生命周期价值与渠道成本做综合排序与决策,并分层化执行优化策略持续调整。

一、先说结论式的思路(用费曼法则先把事情讲清楚)
要比较各平台销售表现,最好的方式不是简单把收入相加比大小,而是把数据“放到同一台秤上”来称。换句话说,你得先回答三个基础问题:数据口径是什么?用哪个基数来归一?要看的是即时转化还是长期价值?解决这三点后,再用漏斗、留存与统计检验去拆解差异的原因,最后把成本(像获客成本)和生命周期价值(LTV)放到一起比较。
二、准备工作:统一口径与数据来源
比较之前,先把基础工作做足,这一步很容易被忽略,但决定了后续结论的可信度。
1. 时间口径要一致
- 相同时间窗口:比如都用过去30天、7天或首次付费后60天等,千万不要Windows用本月、iOS用过去7天那样混着比。
- 对促销周期敏感:如果某个平台刚好有折扣活动,应该把活动期单独标记或剔除,或者在分析中加入控制变量。
2. 货币与计费口径
收入要统一货币,并明确是毛收入还是净收入(扣平台抽成后的数)。例如App Store会抽成、Windows商店/第三方分发有不同收费结构,这会直接影响净收入的可比性。
3. 归因与渠道规则
不同平台常有不同的归因逻辑(安装来源、首次来源、归因窗口)。务必统一归因规则或至少说明差异。例如按首次接触归因还是按最后点击归因?
4. 数据质量检查
- 检测重复订单、退款、异常交易。
- 核对安装数与活跃设备数,检查采样率或埋点缺失。
- 确认时间戳时区一致(UTC或本地)。
三、核心指标与计算方法(你需要哪些度量)
把复杂问题拆成简单指标是费曼方法的核心。下面列出常用指标并给出计算公式,便于照着做。
- 安装数(Installs):自然量,直接反映覆盖。
- 活跃用户(DAU/MAU):衡量使用频率和基数。
- 收入(Gross Revenue / Net Revenue):总收入与扣除平台分成后的净收入。
- ARPU(每用户平均收入):ARPU = 收入 / 活跃用户数(或ARPPU只算付费用户)。
- 转化率(Conversion Rate):如安装→注册、注册→付费等漏斗阶段的比例。
- 留存(Retention):常用D1、D7、D30留存率。
- LTV(生命周期价值):特定窗口内的累计净收益,常见30/90/365天LTV。
- CAC(获客成本):各渠道的人均获客成本,和LTV比较决定可持续性。
几个常用公式
- ARPU = 净收入 / 活跃用户数。
- 付费率 = 付费用户数 / 安装数。
- LTV(30天) = 平均每用户在30天内贡献的净收入。
- 归一化收入(按1,000安装) = 净收入 / 安装数 * 1000。
四、示例表格:用虚拟数据演示如何比较
用表格把指标并列,直观判断差异。下面的数字是举例说明,真实分析要用你们的原始数据。
| Windows | Mac | iOS | Android | |
| 安装数(30天) | 50,000 | 15,000 | 120,000 | 200,000 |
| 活跃用户(MAU) | 20,000 | 7,000 | 60,000 | 110,000 |
| 净收入(30天,人民币) | ¥600,000 | ¥180,000 | ¥1,800,000 | ¥1,000,000 |
| ARPU(30天) | ¥30.00 | ¥25.71 | ¥30.00 | ¥9.09 |
| 付费率 | 3.0% | 3.3% | 5.0% | 2.0% |
| D7留存 | 22% | 24% | 28% | 18% |
| LTV(90天)估算 | ¥70 | ¥65 | ¥120 | ¥25 |
从表里你可以看到:iOS虽然安装量不一定是最高(在此例是第二高),但单用户价值与留存更好;Android安装量大但ARPU与LTV偏低;Windows用户群有不错的ARPU但规模有限;Mac用户表现介于Windows与iOS之间。重要的是要理解这些“表面”差异背后的原因。
五、如何做标准化(让不同平台可比)
标准化常用的方法:
- 按安装量归一:把收入换算成每千安装收入(Revenue per 1k Installs),适合比较市场推广效率。
- 按活跃用户归一:用ARPU或LTV/DAU比较用户质量。
- 按用户分层:把用户分为新用户/回流用户/高价值用户,分别比较。
举例:如果Android的安装是iOS的2倍,但ARPU只有三分之一,你需要问:增长是低质拉新还是高质用户都不来的问题?标准化能帮你回答。
六、拆解差异:漏斗与留存分析
单看收入无法告诉你“为什么”表现差。漏斗和留存是诊断问题的显微镜。
- 漏斗阶段:曝光→安装→注册→首次付费。分别计算每一步的转化率。
- 留存:观察D1、D7、D30留存,判断用户是否长期粘性好。
- 分渠道/分人群:同一平台内不同渠道可能差异更大,分渠道比较常常比跨平台比较更有价值。
一个简单的SQL示例(思路,不同公司字段名不一样):
SELECT platform, count(distinct user_id) as installs, sum(revenue) as revenue FROM events WHERE event_date BETWEEN X AND Y GROUP BY platform;
再用漏斗表把每个平台每一步的人数放出来,看哪里流失最多,这一步非常关键。
七、统计检验:差异是真实还是偶然?
当你发现iOS的ARPU比Android高很多时,需要判断差异是否显著。常用方法:
- t检验:比较两个样本均值(例如两平台ARPU)是否有显著差异,要求近似正态分布或样本足够大。
- 卡方检验:比较比例差异(比如付费率)是否显著。
- Bootstrap(重采样):对非正态或复杂分布更稳健,直接对ARPU或LTV做置信区间估计。
实际工作中,我常常把“显著性”与“效应量”一起看。差异可能统计上显著但业务上不重要(比如ARPU差0.1元),相反较大但样本小的差异要谨慎。
八、把成本和长期价值放一起看(利润视角)
收入高不等于利润高,特别是不同平台的分发成本、渠道投放成本、退费率都不同。所以最终比较建议按净利或LTV-CAC来排序:
- 计算各平台的净收入(扣除平台抽成、退款)
- 扣除对应的用户获取成本(广告投放、分发费用)
- 对比LTV(比如90天)与CAC的比值,看看能不能达到可持续水平(常见目标LTV/CAC > 3)
九、可视化建议(让复杂数据一目了然)
好的图能大幅提升沟通效率。推荐几种视图:
- 并排柱状图:比较四个平台的核心KPI(安装、净收入、ARPU)。
- 归一化柱图(per 1k installs):方便看市场推广效率。
- 漏斗图:展示各平台关键转化步骤。
- 留存热力图(cohort heatmap):观察不同平台用户的留存趋势。
- 误差条或置信区间:在比较均值时加上置信区间,避免误导。
十、常见误区(别踩这些坑)
- 只看毛收入:忽略平台分成和退款,会高估某个平台的价值。
- 时间口径混乱:把促销期与常态期混合比较会产生偏差。
- 样本偏小就下结论:小样本容易被少数高付费用户拉高平均值。
- 忽视渠道内差异:同平台不同渠道(如自然下载 vs 广告)表现差异往往更大。
十一、落地操作清单(执行步骤)
给你一个可复制的步骤清单,照着做就行:
- 确认比较目标与业务问题(增长、变现、留存或可持续性)。
- 统一时间窗口和货币口径,明确净收入定义。
- 抽取原始数据:安装、活跃、付费、退款、渠道归属、时间戳。
- 做数据清洗:去重复、剔除异常交易、调整时区。
- 计算核心指标(安装、活跃、ARPU、付费率、LTV、CAC)。
- 按基数归一(每1000安装或每1000活跃用户)并绘图对比。
- 做漏斗与留存拆解,找出主要差异点。
- 做统计检验,判断差异显著性并估计置信区间。
- 结合成本与LTV做优先级排序,形成可执行建议。
- 将结果做成可复现的报表或仪表盘,设置定期复查。
十二、实战小建议(那些容易被忽略但有用的细节)
- 分设备版本:桌面端(Windows/Mac)用户行为和手机用户差异大,别把桌面和移动的核心指标直接混合。
- 考虑付费模型差异:订阅制、一次性付费、内购道具的用户行为不同,拆开看更清楚。
- 地域拉平:如果不同平台用户分布在不同国家,货币购买力、价格策略需做地域矫正。
- 长期视角:短期促收与长期可持续常常冲突,要把季度和年度视角都看一遍。
如果你现在只想快速得到一个可操作的结论:先做“每千安装净收入”和“90天LTV/CAC”两个归一化指标,把四个平台排个序,然后用留存与转化漏斗去解释排名靠前或靠后的原因;再把统计显著性和样本量检查一下,别被噪声误导。
十三、最后一点话(边想边写的感觉)
做平台间销售对比,核心其实是两件小事:把口径统一,把问题拆成可衡量的小块。其它的,大多是数据实现和沟通细节。你会发现,做完一次标准化的对比,后续复盘、A/B、价格实验都会变得顺手多了。就像我自己每次对比完,总会在表里多留一列“备注”,记录那次促销、那次上架延迟、那次退款多的原因——这些短小的注释,后来往往比一堆图表更有用。