近年来,随着《网络安全法》《数据安全法》和《个人信息保护法》的颁布与实施,完善数据要素治理制度,保障数据流通交易安全得到了越来越多的重视。在 2022年Gartner技术成熟度曲线列出的25项值得关注的新兴技术中,有6项与隐私计算相关,足见其价值与潜力。近日,信也科技成功加入全球首个联邦学习开源社区FATE,并以工业级隐私计算框架FATE为基础,针对金融反欺诈场景进行了深入研究,成功研发了图联邦技术FateGraph。
【资料图】
信也科技旗下上海上湖被授予为FATE开源社区成员单位
加密联合建模打通数据壁垒
随着数据的不断增长和应用场景的不断扩展,隐私保护问题已经成为了一个全球性的关注点。联邦学习作为隐私计算的三个关键技术之一,通过加密联合建模打通了各个企业之间数据的壁垒同时保护了数据的私有性质。
以FATE为例,现存联邦学习算法对于表格数据、图片、文本等结构化数据有着广泛的算法支持,而对于非结构化的图数据却较难实现工业级。有一些轻量级的联邦学习平台如FedGraph、FederatedScope等,在安全性、稳定性、易用性方面有所不足。在一些实验场景中发现,相对于单点GNN(图神经网络)的计算速度,FedGraph的用时较长,主要受限于通信、加密及存储。
在实际场景中,图模型常用于反欺诈、分子制药、社交网络、营销等。目前,信也科技研发的图联邦技术FateGraph已同步发布于FATE开源社区,为图数据的隐私保护提供了更加高效、可靠的解决方案。
图联邦技术工业化应用有效保证隐私安全
信也科技FateGraph已成功集成到联邦学习算法功能组件FederatedML框架中,从而实现了图联邦技术的工业化应用。FateGraph能够最大程度复用该组件进行深度学习,且所有计算均在密文空间内进行,有效保证了隐私安全。
FateGraph作为算法插件集成在FederatedML框架中
多样化应用功能为数据安全保驾护航
FateGraph集成了学界广泛使用的PyG(Pytorch-geometric,基于pytorch的图神经网络框架),使用户能够像对单点GNN建模一样,在联邦环境下实现图算法,过程更加简单高效。
1、支持PyG所有图卷积算子,如GCN,Sage,Gin,Gprgnn等;
2、支持PyG的DataLoader,用户可以继承此类开发,自定义数据加载器;
3、子图采样,可加载局部图完成训练,节省资源占用;
4、自定义图算法,以py文件形式提交后台执行,与非联邦环境编程的用户体验类似;
5、支持节点分类和子图分类两种任务。
FateGraph的推出,不仅解决了图数据在不同单位和机构之间的孤岛问题,也扩展了隐私计算的应用范围。为进一步推广该技术,信也科技将努力加强研发创新,控制通信成本,在计算过程中实现对数据的保护,推动隐私计算更广泛的落地。