半导体跨界潮,谁在跟风,谁在下棋?Nikola,一个千亿造车独角兽破产了消息称谷歌将因违反反垄断规则而遭欧盟指控,恐被处以高额罚款透明美学再进化,Nothing Phone(3a)系列手机宣传物料曝光2025 年春运今日迎来最后一天,全国铁路已累计发送旅客 4.99 亿人次国内通信运营商首次:中国联通通过数字货币桥实现跨境支付微软 Outlook“保存邮件到 OneNote”功能 3 月谢幕,“发送到 OneNote”接棒全国首个:浙江率先布局低空经济“下乡”,目标到年底建成 200 个乡村无人机起降枢纽拨打客服电话强制等待 15 分钟,惠普欧洲试点遭强烈反对后取消OPPO一键问屏 / 全能搜基于阶跃星辰Step系列多模态模型打造京东&创维联合定制JD100 Mini电视发布 下单享免费送装一体服务我国成功发射中星 10R 卫星中科闻歌发布“智川”企业智能体平台1.0、“优雅”音视频大模型平台1.5,领先技术加速AI普惠落地这个周末,在最懂开发者的城市邂逅最懂开发者的算力平台DDN推出 Infinia 2.0对象存储 加速AI数据处理速度全部免费!百度文心智能体平台已全面接入DeepSeek模型灯塔云系统:开启劳务派遣管理4.0时代超2671万名消费者申请手机等数码产品购新补贴 用国补买手机上京东皇家马德里对阵赫罗纳:不乏进球与高水平竞技的足球现场OpenAI宣布面向多个国家推出AI代理 Operator
  • 首页 > 数据存储频道 > 数据库频道 > 操作系统与开源

    FATE开源项目首位贡献者团队聊“联邦学习”:高校已加大投入深研

    2019年06月14日 17:26:25   来源:互联网

      作为一门新兴技术,“联邦学习”能在保证数据隐私安全基础上,实现共同建模,提升AI模型的效果。

      这样的前景,让“联邦学习”自提出以来就受到各方关注,在国内,微众银行首席人工智能官,国际人工智能学会理事长杨强教授与微众银行AI团队为了“联邦学习”的普及与落地,率先发布了商用级开源项目 FATE(Federated AI Technology Enabler)。

      FATE作为“联邦学习”的第一个开源社区,吸引了大量技术爱好者与高校研究团队的目光,来自香港科技大学的研究生——敬清贺,就是其中一员。作为首位贡献者,他提出了对FATE通信框架的优化建议,显著提升了通信效率。

      对此我们采访了敬清贺,分享他与团队对FATE的研究,以及更多关于FATE的期望与设想。

      1.国内第一个对“联邦学习的良好实现

      敬清贺所在的港科大研究小组,主要工作中有一大项即为对机器学习框架进行优化,也因此接触到了“联邦学习”这一新兴的概念。

      “联邦学习”在本质上,是一种基于多方安全计算的分布式机器学习技术,参与各方可以在不披露底层数据和底层数据的加密(混淆)形态的前提下共建模型。作为一种共赢的机器学习方式,它能有效连接“数据孤岛”,形成一片共赢的AI大陆。行业应用中能帮助不同机构打破隔阂,联合建立AI模型,同时各方的数据都不出本地,能让用户隐私得到最好保护。

      而FATE作为“联邦学习”的落地实现项目,受到了研究小组的重点关注。在对FATE进行深入了解并讨论后,这一群年轻的技术爱好者,跃跃欲试地开始尝试用FATE解决研究中遇到的问题,并由此对FATE开源项目提出优化建议。

      据敬清贺讲:“接触FATE一段时日后,我们感到这是国内第一个对‘联邦学习’的良好实现”。在敬清贺及研究小组看来,FATE对 “联邦学习”概念进行了丰富和拓展,不仅包括了横向联邦学习,还包括纵向联邦学习, 更将“联邦学习”和“联邦学习”相结合,从而让不同组织不同模式的数据都能实现合作。他们认为,这样的实现形式,使得FATE能为有特殊需求的机构,比如对用户隐私保护有诉求的两个公司,提供了合作的可能。

    1.jpg

      图:敬清贺接受采访

      2.基于联邦迁移学习的FATE适用场景很广泛

      据敬清贺设想,FATE的适用场景相当广泛,尤其是在金融、医疗等,对数据更敏感,监管也更强的场景下,FATE能够协助实现在保障数据隐私基础上的协同合作。

      敬清贺及研究团队明白,真正的使用场景中,不可能要求两个单位训练模型时,具有相同结构的信息,这几乎是无法实现的,即使能限制整个用户都要有相同模型,那应用场景也会相当有限。因而,像FATE这样结合了纵向联邦学习,联邦迁移学习的形式,能进一步拓展适用场景。即使两个机构的模型是不一样的,它还是可以共享数据一起训练。这也是FATE最让这群年轻的研究爱好者所欣赏的点。

      以微众银行为例,在不共享用户数据的前提下,微众银行联合多家银行建立的反洗钱模型,经过模拟测试,参与银行越多,模型的性能越高。而在医疗场景下,比如多家医院医疗影像、病例分散的情况,也可以通过联邦学习提升疾病预测准确度,提升整体诊疗水平。

      当然,除了学习和建模能力,面对即将到来的5G时代,网络安全特别是数据安全问题也是一大要点,人人都在提给数据装上“安全阀”,从欧盟的“数据隐私保护法”GDPR(The General Data Protection Regulation),到我国国家互联网信息办公室起草的《数据安全管理办法(征求意见稿)》,数据在安全合规的前提下自由流动,成了大势所趋。

      而在同样关注数据安全的敬清贺看来,FATE对加密算法的优化,使用同态加密而非DP等形式,也更有力地保障了数据安全,对AI的落地起到了极大的推动作用。

      3.年轻研究团队与技术爱好者心中的FATE

      作为FATE开源项目的首位贡献者,也是最早使用和接触FATE的一群年轻技术爱好者,敬清贺和研究团队的伙伴也对FATE具有许多构想,他们相信FATE框架语言还可以实现更多模型,从而应用在不同的场景中。而在性能上,他们也会继续深入研究,探索是否有优化的可能。

      在采访的最后,敬清贺表示,FATE是一个非常好,非常新的东西,给AI的落地提供了更大的帮助,也让AI能应用到更多的适用场景里,对不同的领域让机器学习学出的模型更可靠,让机器学习更好地进入我们的生活。在以后,他也会持续关注着FATE,期待着自己和更多的技术爱好者,能跟随着整个框架的更新去做一些有意义东西。

      4. 开源生态离不开有志向的年轻技术爱好者

      据了解,敬清贺来自于香港科技大学网络系统实验室(HKUST SingLab),香港科技大学副教授、SINGLAB主任陈凯带领学生们共同研究网络系统的设计、分析和落地。实验室这一研究可以打破人工智能设施Scale Out的通信瓶颈,提升人工智能基础设施的算力,让联邦学习技术更好、更快的落地。

      像敬清贺这样的贡献者初现峥嵘,可以预见,在以后会有越来越多高校和年轻技术爱好者投入FATE开源项目建设中。杨强教授欣慰地表示:一个有活力的开源生态离不开有志向的青年人的贡献。

      杨强教授指出,安全和保护隐私的智能计算是软件业当前最重要的发展方向之一。FATE已经成为维系大数据、人工智能和多方计算架构的主力军。我们欢迎更多像清贺这样的技术新秀参与其中,让这个“机器学习大数据的操作系统”生态变得越来越有活力。

      同时,面对许多技术爱好者及开发者所关心的联邦学习走向,以及这门技术的未来发展等问题,杨强教授讲到,“联邦学习是一种保护用户数据隐私的有效技术,它的研发和工业应用密不可分。所以,在接下来的发展中,也期待越来越多的企业和机构会采用联邦学习技术,发展2C和2B的人工智能垂直应用。”

      社会对隐私和数据安全愈加严格的要求,将会推动新的加密技术和多方建模的技术更加蓬勃的发展。让我们一起期待。

      FATE开源社区,汇聚了大量人工智能专业人士,为联邦学习的“帝国”添砖加瓦。

      来github一起参与项目,贡献者将加入FATE开源项目名单,更可获取300-10000元等同价值激励:https://github.com/webankfintech/fate

      了解更多,可访问FedAI联邦学习官网:https://www.fedai.org/#/

      咨询及沟通,可添加【FATE开源社区助手】微信号:FATEZS001。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [No. X002]
    分享到微信

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。