大咖开讲:杨强教授讲授“迁移学习与联邦学习”
2025/06/17

2025年6月6日,加拿大工程院及加拿大皇家学院院士、香港理工大学AI研究院院长、微众银行首席人工智能顾问、香港科技大学荣休教授、联邦学习奠基人杨强教授受邀赴深圳大学金融科技学院,为研究生必修课《机器学习》的学生带来题为《迁移学习与联邦学习》的专题讲座。杨强教授作为人工智能领域的顶尖学者,曾于3月14日在我院同一课堂讲授机器学习基础理论,并系统梳理了人工智能的发展脉络,为学子们呈现了一场兼具深度与广度的知识盛宴。在次课堂上,杨强教授围绕迁移学习和联邦学习的核心概念、方式算法、应用场景以及研究前沿进行了深入阐述,并与学生们探讨了相关挑战与未来发展方向。

迁移学习:起源、定义与方法

迁移学习(Transfer Learning)的概念最初来源于教育心理学。根据心理学家C.H. Judd提出的经验泛化理论,“学习迁移”是指学习成果从一种情境向另一情境的转移,只要两个学习活动之间具有某种联系,就可以实现经验的迁移。在机器学习领域,迁移学习被定义为:给定源域和学习任务,以及目标域及其任务,迁移学习的目标就是利用源域中学到的知识来帮助提升目标域的预测性能。这一思想强调模型和知识的复用,尤其适用于“大数据向小数据迁移”的场景:当目标域的数据稀缺或样本有限时,可以借助源域的丰富数据或预训练模型进行迁移学习,从而缓解小样本学习的困难。杨强教授指出移学习的核心在于识别不同任务间的共性(不变量)。他以自动驾驶研究为例说明:尽管英联邦等国家驾驶座位于右侧,而多数国家位于左侧,但在联合训练时,关键在于提取数据间的不变量——即驾驶员位置始终更靠近道路中心线。这一共性分析是迁移学习有效应用的基础。他还提到迁移学习擅长解决“冷启动”问题,并指出当新领域数据稀缺时,利用已有领域中训练好的模型进行微调往往能明显提升性能。

迁移学习的方法大致可分为四种基本类型:基于样本的迁移基于特征的迁移基于模型的迁移基于关系的迁移。其中,基于样本的迁移学习(实例重权法)通过对源域样本赋予不同权重来复用数据;例如,TrAdaBoost算法就是在迁移学习中运用AdaBoost思想,对有利于目标任务的源域样本赋予更高权重、抑制无关样本权重,从而改善模型性能。基于特征的迁移学习则通过映射函数将源域和目标域的数据映射到一个公共特征空间,以减小两者分布差距。著名的迁移成分分析(Transfer Component Analysis, TCA)便通过最大均值差异(MMD)度量来最小化源域与目标域之间的分布差异。此外,基于模型的迁移(如预训练-微调)通过共享模型参数实现迁移;而基于关系的迁移则着眼于实例之间、特征之间或任务之间的关联性迁移。

迁移学习应用案例

在实践中,迁移学习已在诸多领域展现出优势。金融风控领域中,迁移学习可利用历史大数据知识帮助解决新客户或新业务场景下的数据不足问题。例如,有研究分析指出,将预训练模型应用于金融新闻情感分析场景,可以快速提取情感特征;同时,迁移学习也被应用于信用风险评估、欺诈检测、交易监控等场景,以减少标注数据需求并提升模型泛化能力。医疗图像识别方面,迁移学习可将在大规模自然图像上学到的知识迁移到医学影像分类任务。一篇案例分析介绍了使用预训练的ResNet模型并通过PyTorch微调,对肺部感染图像进行检测的过程,从而在少量医学数据上实现高效识别。在情感分析领域,迁移学习被用于跨域文本理解,例如利用英文语料训练情感模型再迁移到中文场景。推荐系统中,常见的做法是将用户在不同应用场景的丰富行为迁移到目标场景,以缓解目标域数据稀疏和冷启动问题。根据相关研究,通过源域丰富数据的迁移,目标域的性能得到显著提升,用户对新产品的推荐准确率提高。多模态识别方面,杨强教授特别指出,迁移学习的机制在跨媒体场景中尤为重要:通过多模态数据(如图像与文本)的协同,复用源领域的高信息密度样本(如“一图胜千言”),可显著提升目标领域的训练效率,化解数据异质性挑战。总之,从金融风控到医疗健康、从自然语言到图像任务,迁移学习都以多种形式帮助破解“数据不足”与“跨域协同”的难题。

迁移学习方法与研究趋势

针对不同场景,学术界发展了多种迁移学习方法。TrAdaBoost和TCA只是其中典型代表实际应用中还包括迁移神经网络、对抗性迁移学习、领域自适应网络等多种技术。杨强教授还提及“传递迁移学习”(Transitive Transfer Learning)等新方法,通过联合矩阵分解或深度学习模型在多个不相似领域间进行知识迁移

未来的研究趋势包括跨媒体迁移(Cross-media Transfer)、自动化迁移学习(Learning to Transfer)等。如将图像识别与文本识别结合的多模态迁移,以及让机器自动选择迁移策略的研究正兴起。自动化转移方面,一些工作尝试在AutoML框架下优化迁移过程。对此,杨强教授启发到:许多预训练模型(如BERT、GPT、ResNet等)可作为通用模型框架,通过少量定向微调直接应对新任务,节省大量手工调参时间。此外,可解释AI(XAI)在迁移学习中的探索也逐渐兴起,研究如何让模型的迁移过程和迁移结果更加透明,以便满足监管与信任需求。总体来说,迁移学习正逐步与深度学习、AutoML等新技术融合,杨强教授鼓励同学们勤于思考、勇于创新,争取为各领域应用带来更加灵活高效的解决方案。

联邦学习:起源、类型与挑战

与迁移学习并行发展的联邦学习(Federated Learning)应运而生,用以应对中心化AI架构带来的局限以及数据隐私监管要求。作为联邦学习的开拓者杨强教授回顾指出,传统集中式机器学习需要汇集各方数据,但在隐私法律法规日益严格的背景下,数据往往无法共享。这正体现了“波兰尼悖论”:人类往往可以解决问题但难以用语言描述所有规则,许多关键知识只能通过数据分散训练来实现。联邦学习的目标是在不直接传输原始数据的前提下,通过分布式训练共同构建模型,从而突破数据孤岛限制。根据各参与方数据分布的不同,联邦学习主要分为横向联邦学习纵向联邦学习联邦迁移学习三种模式。横向联邦学习(Horizontal FL)适用于各方拥有相似特征空间但样本不同的场景;杨强教授举例到Google Gboard输入法便采用这种方式,在用户本地设备上训练词预测模型,从而保护个人输入数据。纵向联邦学习(Vertical FL)适合各方拥有相同用户但特征不同的场景他以一项案例展开介绍某银行与互联网公司拥有大量重合用银行掌握信用和贷款数据,互联网公司掌握用户网络行为,两方希望联合建模信用风险,但由于行业规定和隐私限制无法直接交换数据,于是通过纵向联邦学习将各自特征安全融合完成训练。联邦迁移学习则整合迁移学习理念,用于参与方间样本和特征都不完全重合的情景。总体而言,联邦学习构建了“数据可用不可见”的新生态,让不同机构能够在保护隐私的前提下协同建模。

然而,联邦学习也面临新的挑战。首先,隐私和安全是核心问题。为保障隐私安全,差分隐私(Differential Privacy)、安全多方计算(Secure MPC)、同态加密(Homomorphic Encryption)等技术被广泛引入FL框架。差分隐私通过在模型更新中添加噪声来防止个体信息泄露;安全多方计算和同态加密则通过加密协议确保在聚合过程中无法窃取敏感数据。其次,联邦学习过程可能遭受攻击:如梯度深度泄露攻击(DLG)可从共享的梯度中反向重建原始训练样本;参与方共谋攻击贝叶斯推断攻击也被提出,用于从模型更新中推测其他方数据。针对这些威胁,杨强教授介绍了各种防御方案,包括安全聚合协议、多重加密、多方验证等。同时,他指出一些专门的防御框架如“可信联邦学习也在探讨对抗数据投毒和模型窃取的方法。为了建立可信联邦学习系统,除了安全和隐私,还需要考虑效率、可靠性、可解释性和模型版权等特性杨强教授指出,构建可信联邦学习系统需突破五大核心维度:在效率革新层面,其团队研发FedBCD算法成功将纵向联邦学习通信成本降低80%,在确保特征信息不可复原的前提下突破传统通信瓶颈;针对可靠性认证,基于物流仓库质押场景的实证验证了抗数据投毒能力,FedSpectral防御框架为系统安全提供强力保障;可解释监管维度则通过专用审计接口满足金融/医疗行业强监管需求,实现全流程决策可追溯;模型版权领域首创的FedIPR水印技术,通过黑盒/白盒双模式验证机制根治版权纠纷;而公平激励体系创新性采用Shapley值量化各方贡献(如脑卒中预测中使小机构权重提升40%),从根源杜绝滥竽充数行为。该系统通过多目标协同优化,推动联邦学习从技术可行迈向商业可信。

联邦学习:最新研究与生态政策

近年来,联邦学习研究持续深入,一些新框架和算法不断涌现。例如,杨强教授启发同学们:针对非IID数据的个性化定制模型、结合预训练大模型的协同学习、以及与检索增强生成(RAG)相结合的方案都研究的前沿方向。开源生态方面,以微众银行为核心的FedAI社区推出了FATE(Federated AI Technology Enabler)等工业级开源框架,为联邦学习提供可靠的安全计算基础。FATE项目采用多方安全计算和同态加密技术,支持逻辑回归、树模型、深度学习乃至迁移学习等多种机器学习算法的安全协同。此外,国际标准组织和中国政府也在积极推动联邦学习技术在产业中的应用。在中国,“十四五”国家信息化规划明确提出要“推动区块链、安全多方计算、联邦学习等技术模式在数据流通中的创新利用”,并通过一系列政策促进数据要素市场建设、隐私保护计算技术研发和标准制定。这些政策支持为联邦学习的产业化提供了良好环境,各行各业也开始探索落地场景。

联邦学习:应用示例与未来展望

在实际应用中,联邦学习的潜力正逐步释放。例如,AI客服系统可以利用联邦学习在多个公司或组织间联合训练对话模型,提升智能客服的语义理解能力而无需共享客户隐私信息;多中心医疗诊断则可以通过各医院间的联邦模式训练全球化的诊断模型,实现数据孤岛打通;在无人驾驶领域,不同车企或车队之间可以通过联邦学习共享道路感知、决策策略等模型,提升自动驾驶算法的适应性;在工业物流场景,各分布式仓库之间通过联邦学习合作优化物流调度和监控系统,提升整体效率。这些应用案例表明,联邦学习正在成为解决跨组织协同与数据隐私矛盾的有力方法。展望未来,联邦学习将进一步与个性化建模、预训练大模型以及检索增强生成等前沿技术融合,以应对非IID数据、复杂任务和实时服务的需求,不断拓展人工智能在更多领域的应用边界。

总结

杨强教授的课程不仅是一次知识的传递,更是一场思想的启蒙。从迁移学习的共性不变量本质到联邦学习的五维可信标准,他以其独到的学术视野与产业洞察,为学子们勾勒出隐私计算时代的技术图景。通过Google输入法联邦架构、银行-互联网风控建模等案例,生动诠释了数据不动模型动的协作范式;借由FATE开源平台在医疗诊断、金融风控的实证,架设起理论到产业的贯通之桥。正如杨强教授在课堂结尾所勉励的那句话面对人工智能快速发展的浪潮,青年学子应不断提升思维的深度与广度,勇于探索、善于创新,在实践中锤炼跨领域理解力与技术责任感。在微众银行金融科技学院这片融合学术与产业的热土上,新一代AI人才正积蓄力量,迎接数据智能时代更加复杂而富有挑战性的未来。