| 维度 | 内容 |
|---|---|
| 用得多 | 投行、PE/VC、大型企业的资本预算 |
| 怎么用 | 预测未来5-10年自由现金流,选折现率(WACC),算企业价值。VC用风险调整折现率30%-80% |
| 效果评价 | 中等偏上。对成熟企业(稳定现金流)估值较准;对早期公司、高波动行业系统性偏差大。敏感性极高——终值假设小幅变动可导致估值差异50%+ |
| 学界共识 | 理论上最优,但实践中WACC估算误差大(股权风险溢价、Beta不稳定),终值假设主观性强 |
| 业界反馈 | 投行标配但心里有数——"模型是用来justify价格的,不是discover价格的" |
| 用得少 | 早期创业公司、无形资产占比高的公司(如SaaS) |
| 替代方法 | 可比公司法(P/E、EV/EBITDA)、LTV:CAC倍数、Rule of 40 |
| 维度 | 内容 |
|---|---|
| 用得多 | 互联网大厂(美团/字节/阿里/滴滴)、大型零售/快消 |
| 怎么用 | 用历史交易数据做回归,估计需求弹性,做动态定价和补贴策略优化 |
| 效果评价 | 良好。数据充足时弹性估计相对稳定,定价优化可带来5-20%收入增长。但跨品类外推效果差,促销期间弹性剧烈变化 |
| 学界共识 | 方法成熟,但识别因果价格效应需处理内生性(消费者选择性购买) |
| 业界反馈 | 大厂用起来效果好,中小公司数据采集能力不足 |
| 用得少 | 中小企业、B2B定价、低频消费品 |
| 替代方法 | 竞品跟随定价、成本加成、A/B测试试出来 |
| 维度 | 内容 |
|---|---|
| 用得多 | 管理咨询(战略项目)、反垄断经济咨询、大型企业的战略规划 |
| 怎么用 | 五力模型做行业分析,博弈论做竞争策略推演(产量竞争、价格战),合并模拟预测并购后的均衡价格 |
| 效果评价 | 框架价值高,定量预测弱。五力模型是极好的结构化思考工具;但博弈论模型的定量预测能力有限——Nash均衡假设太强(完全理性、完全信息),实际企业行为远更复杂 |
| 学界共识 | 博弈论是思考竞争的好语言,但预测能力不如描述性统计。合并模拟在特定条件下(同质产品Cournot)有效,异质产品市场误差大 |
| 业界反馈 | 麦肯锡说博弈论的价值是"结构化讨论"而非"算出正确答案" |
| 用得少 | 创业公司、内部运营决策 |
| 替代方法 | 竞品对标、SWOT、定性判断 |
| 维度 | 内容 |
|---|---|
| 用得多 | 各国央行(美联储、欧央行、中国人民银行)、财政部、IMF |
| 怎么用 | 货币政策模拟(加息/降准的影响传导)、财政政策的宏观效应评估、政策沟通的工具 |
| 效果评价 | 预测能力:差。政策分析:中等。 2008年金融危机完全未预测到;多数DSGE模型无法解释80%的关键宏观变量波动;短期GDP预测误差显著大于简单BVAR |
| 学界共识 | 预测不行,但结构清晰,适合做政策反事实分析。金融危机后加入了金融摩擦(Gertler-Karaki)、异质性代理人(HANK),预测能力有所改善但仍有限 |
| 业界反馈 | 央行内部清楚DSGE预测不可靠,实际预测用VAR/BVAR/DFM,DSGE主要做政策情景模拟 |
| 为什么还用 | 制度惯性(央行需要"科学化"决策的外表)、可以做政策反事实("如果不降息会怎样")、有微观理论基础不受Lucas批判 |
| 用得少 | 企业战略、投资机构(除宏观对冲基金) |
| 替代方法 | VAR、BVAR、专家判断、跟踪高频指标 |
| 维度 | 内容 |
|---|---|
| 用得多 | 央行(美联储FRB/US、欧央行NAWM II)、券商宏观组、经济预测机构 |
| 怎么用 | 多变量时间序列分析,做GDP/通胀/利率的联合预测和脉冲响应分析 |
| 效果评价 | 短期预测:良好。中长期:衰减。 1-4季度的GDP预测VAR/BVAR通常 outperform DSGE。但超过1年预测准确率急剧下降,与简单AR(1)差距缩小 |
| 学界共识 | 短期预测最可靠的结构性方法之一。大样本BVAR(用贝叶斯收缩处理参数过多问题)效果较好 |
| 业界反馈 | 央行实际预测的主力工具。高盛等券商大量使用VAR类模型做季度预测 |
| 用得少 | 中小企业、非宏观投资机构 |
| 替代方法 | Nowcasting(混频数据模型)、机器学习预测、专家判断 |
| 维度 | 内容 |
|---|---|
| 用得多 | 券商策略组、保险资产配置、FOF |
| 怎么用 | 根据经济周期阶段(复苏/过热/滞胀/衰退)配置资产类别(股票/商品/债券/现金) |
| 效果评价 | 长期:勉强有效。短期:基本无效。 美林投资时钟在美国2004年前效果较好,但2008年后因央行干预打破周期规律,效果大幅衰减。中国市场因政策干预更强,适用性更差 |
| 学界共识 | 经济周期存在但阶段划分主观性强,且央行逆周期干预使周期扁平化。作为定性参考有价值,作为定量交易信号效果差 |
| 业界反馈 | 卖方报告常用(好讲故事),买方实际决策中权重低 |
| 维度 | 内容 |
|---|---|
| 用得多 | 互联网大厂(Google/Amazon/字节/阿里)、药企(FDA要求)、部分零售/金融 |
| 怎么用 | 随机分组比较处理效果,判断因果关系。Google一年3万+次实验 |
| 效果评价 | 效果非常好——业界因果推断的黄金标准。 内部有效性极高(随机化消除了选择偏差)。但存在样本选择偏差(只测试能承受失败的产品改动)、网络效应难处理、长期效应未知 |
| 学界共识 | 因果识别的金标准。但存在外部有效性限制(实验环境≠真实环境)、伦理约束、成本高昂 |
| 业界反馈 | 大厂标配,但约1/3-2/3的实验结果为阴性(无显著效果)。Meta曾因过度依赖A/B测试错过重大战略机会 |
| 用得少 | 中小企业、低频高客单价业务、政策领域(RCT难做) |
| 替代方法 | 小规模试点、前后对比、专家评估 |
| 维度 | 内容 |
|---|---|
| 用得多 | 政策评估(劳动经济学、发展经济学)、科技公司(评估功能上线效果)、医药行业 |
| 怎么用 | 比较处理组和对照组在政策前后的变化差异,识别因果效应。如评估最低工资政策对就业的影响 |
| 效果评价 | 政策评估中最常用的方法,效果中等偏上。 关键假设是平行趋势假设——处理组和对照组在政策前趋势一致。这个假设常被违反且无法直接检验,是最大软肋 |
| 学界共识 | 1990-2010年代最热门的因果方法,但近年来被批评过度使用。新方法(合成控制、交错DID修正)不断涌现 |
| 业界反馈 | 科技公司用得多(如滴滴用DID评估动态调价效果),但需要数据团队支持 |
| 用得少 | 没有对照组构造空间的场景(全公司统一政策)、数据不足 |
| 替代方法 | 合成控制法、简单前后对比 |
| 维度 | 内容 |
|---|---|
| 用得多 | 教育政策评估(分数线上下)、扶贫政策评估、部分营销场景 |
| 怎么用 | 利用政策门槛值(如中考分数线)附近的人群比较,识别因果效应 |
| 效果评价 | 内部有效性很高——接近RCT。 因为在断点附近的人群本质上是随机的。但适用场景有限——需要存在明确的 cutoff |
| 学界共识 | 最可信的准实验方法之一。但外部有效性弱(断点附近的效应≠整体效应)、需要大样本(断点附近样本少) |
| 业界反馈 | 学术用得多,业界用得少(门槛条件太特殊) |
| 维度 | 内容 |
|---|---|
| 用得多 | 经济咨询(反垄断/诉讼)、劳动经济学研究、部分金融研究 |
| 怎么用 | 处理内生性问题(如价格与需求互为因果),找外生工具变量做两阶段回归 |
| 效果评价 | 理论上强大,实践中难用。 核心难点是找到好的工具变量——需要与内生变量相关、与误差项不相关。好IV稀缺,弱IV问题普遍 |
| 学界共识 | 好的IV是稀缺资源。大多数实证研究中的IV说服力有限。Angrist因IV获诺奖,但也承认IV的局限性 |
| 业界反馈 | 经济咨询中用来估计需求弹性、评估合并效应,但需要PhD级别训练 |
| 用得少 | 一般企业、数据科学团队 |
| 替代方法 | 自然实验、A/B测试 |
| 维度 | 内容 |
|---|---|
| 用得多 | 金融机构(风险管理、期权定价)、对冲基金 |
| 怎么用 | 预测资产价格波动率,计算VaR/ES,做压力测试。巴塞尔协议强制要求 |
| 效果评价 | 波动率预测:良好。极端风险:差。 GARCH(1,1)在正常市场条件下预测波动率效果较好,但无法预测尾部风险(黑天鹅事件)。2008年GARCH预测的VaR被系统性突破 |
| 学界共识 | 波动率聚类现象建模的标准工具。但正态分布假设导致尾部风险低估。已实现波动率(realized volatility)模型在日内数据上效果更好 |
| 业界反馈 | 银行必须用它(监管要求),但知道它预测不了崩盘。实际风险管理中配合压力测试使用 |
| 用得少 | 非金融机构 |
| 替代方法 | 历史模拟法、极值理论(EVT)、专家情景分析 |
| 维度 | 内容 |
|---|---|
| 用得多 | 零售(销售预测)、物流(需求规划)、制造业(库存管理)、宏观预测 |
| 怎么用 | 用历史数据拟合自回归+移动平均模型,做短期预测 |
| 效果评价 | 简单场景:效果好。复杂场景:被ML超越。 Makridakis竞赛持续发现,在数据模式稳定、季节性规律明显的场景中,简单指数平滑(ETS) outperform 复杂机器学习。但在经济结构变化时,ML更灵活 |
| 学界共识 | 对于稳定的时间序列,复杂模型不会带来显著改善。"Occam's Razor"在时间序列预测中成立 |
| 业界反馈 | 零售/物流广泛使用(简单、可解释、好实现)。Amazon等公司用ARIMA做基线,复杂场景用ML |
| 用得少 | 快速变化的市场、没有历史数据的新产品 |
| 替代方法 | 管理层判断、简单移动平均、机器学习 |
| 维度 | 内容 |
|---|---|
| 用得多 | 市场调研(Nielsen/Kantar)、大型广告主(宝洁/联合利华)、金融风控 |
| 怎么用 | 用多元回归分解各营销渠道(TV/数字/促销)对销售的贡献,估计ROI。金融风控用Logit做信用评分 |
| 效果评价 | MMM:中等。信用评分:好。 MMM需要大量历史数据(2-3年),且假设历史关系稳定,在数字营销快速变化时滞后。信用评分(Logistic回归)效果稳定,是银行标准工具 |
| 学界共识 | MMM是连接学术计量与营销实务的重要桥梁,但面临归因挑战(数字vs线下)。信用评分模型成熟,但存在歧视性担忧 |
| 业界反馈 | MMM大厂用、中小公司不用(数据+技术门槛)。信用评分全行业标准化 |
| 用得少 | 中小企业、没有数据基础设施的公司 |
| 替代方法 | 最后点击归因、经验判断、小规模测试 |
| 维度 | 内容 |
|---|---|
| 用得多 | 科技公司(定价/推荐/风控)、对冲基金、央行(nowcasting) |
| 怎么用 | 随机森林/XGBoost做预测,深度学习做高频交易,NLP做 sentiment analysis,DML做因果推断 |
| 效果评价 | 预测能力:通常 outperform 传统计量。解释性:差。 ML在GDP nowcasting、股票收益预测、消费者行为预测中通常比传统模型更准确。但黑箱问题严重——说不清"为什么",央行/监管机构不接受 |
| 学界共识 | ML是强有力工具但非万能。在预测问题上优于传统方法,但在因果推断和结构分析上仍不成熟。Kleinberg等推动的因果ML(双重机器学习)是前沿方向 |
| 业界反馈 | 科技公司全面拥抱,传统金融机构谨慎采用(监管对可解释性有要求)。因果ML(EconML)开始被采纳 |
| 限制 | 需要大量数据、容易过拟合、黑箱不可解释 |
| 维度 | 内容 |
|---|---|
| 适用场景 | 创业、高度不确定的环境、目标模糊的问题 |
| 核心逻辑 | 环境不可预测时,预测无效。从既有手段出发,通过快速行动创造信息 |
| 效果评价 | 在不确定环境中:有效。在可预测环境中:低效。 Sarasvathy的实证研究表明,expert entrepreneurs确实使用效果推理,且成功率高于纯因果推理。但在成熟市场中,缺乏系统规划会导致资源浪费 |
| 与学术方法的关系 | 不是替代,是互补——不确定性强时用效果推理,确定性高时用因果推理 |
| 维度 | 内容 |
|---|---|
| 适用场景 | 企业内部管理、目标分解、绩效评估 |
| 核心逻辑 | 将模糊的战略目标分解为可衡量的关键结果 |
| 效果评价 | 执行层面有效,战略层面有限。 OKR在目标对齐和进度追踪上效果很好。但54%的企业将OKR与绩效脱钩(避免目标操纵)。不能替代战略分析 |
| 方法 | 领域 | 效果 | 关键局限 |
|---|---|---|---|
| DCF | 投行/PE | 中(成熟公司好,早期差) | WACC估算误差、终值假设主观 |
| 价格弹性 | 互联网/零售 | 良好 | 需要大量数据,跨品类外推差 |
| 博弈论 | 咨询/反垄断 | 框架好,预测弱 | 理性假设太强 |
| DSGE | 央行 | 预测差,政策模拟还行 | 未预测到2008危机 |
| VAR/BVAR | 央行/券商 | 短期良好,中长期衰减 | 超过1年准确率急剧下降 |
| 投资时钟 | 券商/保险 | 长期勉强,短期无效 | 央行干预打破周期规律 |
| A/B测试 | 互联网大厂 | 很好(因果推断金标准) | 适用场景有限,不能测试战略决策 |
| DID | 政策/科技公司 | 中等偏上 | 平行趋势假设常被违反 |
| RDD | 教育/政策 | 内部有效性高 | 适用场景太少 |
| IV | 经济咨询 | 理论上强,实践中难 | 好IV稀缺 |
| GARCH | 金融机构 | 波动率好,极端风险差 | 预测不了黑天鹅 |
| ARIMA | 零售/物流 | 简单场景好,复杂场景被ML超 | 结构变化时失效 |
| MMM/回归 | 营销/金融 | 中等(稳定环境好) | 数字营销变化快时滞后 |
| ML | 科技/金融 | 预测好,解释性差 | 黑箱、过拟合、需要大数据 |
| 效果推理 | 创业 | 不确定环境有效 | 成熟市场中低效 |