Tan Jay

分布偏移与保形推断

Tan Jay / 2025-03-03


Distribution Shift 与 Conformal Inference 的关系

在机器学习中,Distribution Shift(分布偏移)Conformal Inference(保形推断) 的关系可以从以下角度分析:

1. 核心挑战:可交换性假设的违背

2. 覆盖概率的退化

3. 应对 Distribution Shift 的保形方法

为在分布偏移下保持有效性,研究者提出以下改进方法:

(1) 加权保形推断(Weighted Conformal Prediction)

(2) 条件保形推断(Conditional Conformal Prediction)

(3) 自适应保形推断(Adaptive Conformal Inference)

(4) 分布鲁棒保形推断(Distributionally Robust Conformal Prediction)

4. 不同类型 Distribution Shift 的影响

偏移类型 对保形推断的挑战 解决方法
协变量偏移 输入分布 $P(x)$ 变化,但 $P(y|x)$ 不变 加权保形推断、条件保形推断
标签偏移 标签分布 $P(y)$ 变化,但 $P(x|y)$ 不变 反向加权校准(如标签密度比调整)
概念偏移 条件分布 $P(y|x)$ 变化 自适应保形推断、在线重校准
联合分布偏移 $P(x,y)$ 整体变化 分布鲁棒保形推断、领域自适应

5. 实际应用与挑战

主要挑战

6. 总结

保形推断在分布偏移下的研究,正推动其从理论工具向实际高可靠性系统的演进,尤其在医疗、金融等高风险领域具有重要价值。