
上QQ阅读APP看书,第一时间看更新
5.1.3 纵向联邦的一个困境
由于数据样本在ID和特征上的限制,横向和纵向联邦学习在训练和预测时必须选择ID全部对齐或者特征全部对齐,无法对齐的样本则不能参与训练和预测。在真实应用场景中,这种设置往往会产生诸多困难。
我们以一个真实的业务案例来说明这个问题。金融公司在信贷业务中往往会针对目标客户投放广告来提高产品的关注度。在一个互联网广告案例中,金融公司A、B希望对它们的目标客户投放广告来提高产品的注册授信度。对于公司A、B,它们分别拥有各自用户的ID和标签,但是缺少这些用户的特征。某外部数据供应方C拥有较为完整的用户信息。于是在A、B、C三方建模过程中,A、B提供用户ID、少部分用户特征和标签,C提供较为完整的用户特征。注意,单纯地采用横向或者纵向的方式都无法有效进行三方联合建模。因为在横向的情况下,A、B两方用户重合的范围太小;而在纵向的情况下,A、B、C三方重合的特征数量太少。更加重要的是,即使采用横向或者纵向的数据进行了训练,在预测阶段也会由于样本无法重合而不能有效地进行预测,因此我们希望找到一种新的联邦学习方法来解决这种问题。