搜广推校招面经四十五-EW帮帮网

快手主站推荐算法

这个是做因果选券的，如果大家的工作和这个有关，可以看看

传统的特征重要度衡量方法，就不介绍了。什么基于树模型的、SHAP值、LIME等。
但其实实际工程中一般还是使用Null Importance 特征贡献度。

Null Importance 是一种基于置换检验（Permutation Test）的特征选择方法，用于评估特征的真实贡献度。通过比较真实特征重要性与随机噪声下的特征重要性，可以识别出对模型预测有实际贡献的特征。

Null Importance 的核心思想是通过以下步骤评估特征的重要性：

上述方法还要计算特征重要性，但是在实际工程中，其实没法计算特征重要性。所以完全可以通过打乱

倾向分消偏（Propensity Score Adjustment）主要用于处理样本之间的选择偏差。其基本思想是计算每个个体被选入某个处理组的概率（倾向分），然后在建模时使用倾向分进行调整，确保处理组和对照组在观察变量上尽可能相似。具体方法包括：

IPS（Inverse Propensity Score）和 DR（Doubly Robust）是两种常见的消偏方法：

IPS（逆倾向评分加权）
- 公式：
  $W_i = \frac{T_i}{P(T_i | X_i)} + \frac{(1 - T_i)}{1 - P(T_i | X_i)}$
- 其中， $T_i$ 是处理变量， $P(T_i | X_i)$ 是倾向分。
- IPS 方法通过对样本进行加权，使不同组别的样本在统计上具有相似的分布。
DR（双重稳健方法）
- 结合了倾向分加权和回归模型，既能利用倾向分减少选择偏差，又能利用回归模型降低模型方差。
- 其核心是对 IPS 进行调整，使得即便倾向分模型不完全准确，回归模型也可以部分补偿偏差。

消偏塔通常指的是一种分层消偏方法，通常涉及多个步骤：

原始数据层（Raw Data Layer）
- 收集所有原始特征数据，并进行预处理，如缺失值填充、标准化等。
倾向分计算层（Propensity Score Estimation Layer）
- 训练倾向分模型，如逻辑回归、梯度提升树（GBDT）或深度学习模型，计算每个样本的倾向分。
样本调整层（Reweighting Layer）
- 使用 IPS、PSM、DR 等方法进行样本加权或匹配，以调整数据分布，减少偏差。
建模层（Modeling Layer）
- 在消偏后的数据上训练目标模型，如分类、回归或推荐系统模型。
评估层（Evaluation Layer）
- 评估消偏效果，例如通过 ATE（Average Treatment Effect）、ATT（Average Treatment on Treated）等指标衡量偏差是否减少。