决策树构建流程:
1. 节点划分
在每个树节点上,遍历所有特征以及该特征下的所有取值,以最大化实验组和对照组之间的转化率差异。
2. 增益计算
每个节点根据实验组和对照组在该特征下的转化率差异来计算增益。例如,某一群体可能在干预下表现出更高的购买率,而另一群体则没有显著变化。增益计算公式如下:
D gain = D after _ split ( P T ( Y ) , P C ( Y ) ) − D before _ split ( P T ( Y ) , P C ( Y ) ) D_{\text {gain }}=D_{\text {after }\_{\text {split }}}\left(P^T(Y), P^C(Y)\right)-D_{\text {before}\_{\text {split }}}\left(P^T(Y), P^C(Y)\right) Dgain =Dafter _split (PT(Y),PC(Y))−Dbefore_split (PT(Y),PC(Y))
- P T ( Y ) P^T(Y) PT(Y)表示实验组样本中类别 Y Y Y的概率
- P C ( Y ) P^C(Y) PC(Y)表示对照组样本中类别 Y Y Y的概率
- D D D表示度量距离,可以欧氏距离、KL散度等
- D after _ split ( P T ( Y ) , P C ( Y ) ) D_{\text {after }\_{\text {split }}}\left(P^T(Y), P^C(Y)\right) Dafter _split (PT(Y),PC(Y)) 即为该叶子节点的uplift值,一般都是 P T ( Y ) − P C ( T ) P^T(Y) - P^C(T) PT(Y)−PC(T)
3. 增益预测
给定一用户,根据该用户的所有特征以及该特征下的所有取值,将其分配到某一个叶子节点,得到该用户的uplift值。
参考
- 因果推断笔记——uplift建模、meta学习、Class Transformation Method(八)
- 闲聊因果效应(5):树模型(Tree-Based)、分类模型(The class transformation)
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ji-chu/85296.html