报告题目:联邦学习与个性化样本抽样处理
报告时间:2023年7月18日(星期二) 上午10:00 – 11:00
报告地点:信息科技大楼 A914-915
报告人:樊平毅 教授
主持人:董云泉 教授
报告摘要:
联邦学习作为一种自带数据隔离措施和用户隐私保护机制的联合分布式学习架构,受到学术界和工业界的广泛关注。然而,作为一种数据驱动的学习模型,联邦学习架构面临数据驱动学习模型普遍存在的挑战问题,例如,用户数据的异质性和数据分布的不均衡性、相关性等。在本报告中,我们介绍一种新的个性化样本抽样处理技术。首先,我们在通用的模型下引入一种集中模式的数据学习模型,以此为标准,给出了联邦机制下数据重采样模式的理论性能界。基于理论界,我们构造了一类个性化数据处理的优化问题,并利用信息论中注水原理导出最优重采样权重显示表示式。之后,利用数据库测试验证了理论方案的有效性,并给出一些理论可解释性的系统设计原则。最后,给出了总结和展望,包括该技术的应用场景。
专家简介:樊平毅,清华大学电子工程系长聘教授,开源数据认知创新中心主任,1994 年在清华大学电子工程系获博士学位,1997-1999 年在香港科技大学和美国特拉华大学访问,多次到美国、欧洲、日本、香港和新加坡多所大学和研究所访问。承担国家 973、863、移动专项、重点研发计划,国家自然基金和国际合作项目。发表SCI论文 200 多篇(IEEE杂志140多篇),申请国家专利30多项,国际专利5项,学术著作4部。获 IEEE ICC2020、 Globecom2014 等 9个国际会议最佳论文奖,IEEE TAOS 2020 年度最佳论文奖,IEEE TWC (2009) 优秀杂志编委奖等,任 IEEE 和 MDPI 等多个杂志的编委,任 Open Journal of Mathematical Sciences 编委,中国信息论分会副主任,中国6G-ANA TG4合作主席,IEEE ChinaSIP 网络与通信技术委员会主席等。 近期的主要研究方向包括 6G 无线通信网络与机器学习、语义信息论与 广义信息论,大数据处理理论以及智能网络与系统检测等。