业界大咖杨强教授解析机器学习前沿,助力AI人才培养——微众银行金融科技学院 ”机器学习“ 课程纪实
2025/03/19

杨强院士客座《机器学习》课程,助力我院AI人才培养——微众金融科技学院 “机器学习”课程纪实杨强院士客座《机器学习》课程,助力我院AI人才培养——微众金融科技学院 “机器学习”课程纪实

2025年3月14日,加拿大工程院及加拿大皇家学院院士、微众银行首席人工智能官、香港科技大学荣休教授杨强先生,受邀为学院人工智能专业研究生一年级学生讲授《机器学习》课程。作为人工智能领域的顶尖学者,杨强以其深厚的学术积淀和丰富的产业经验,从机器学习基础理论到大模型前沿技术,系统梳理了人工智能的发展脉络,并结合实际案例与未来挑战,为学子们呈现了一场兼具深度与广度的知识盛宴。

从智能规划到联邦学习:机器学习的演进之路

课程伊始,杨强教授以个人科研历程为线索,回顾了机器学习领域的核心研究方向与技术突破。

1. 智能规划:早期AI的逻辑探索

上世纪80至90年代,杨强教授的研究聚焦于智能规划(Planning)。他提出,智能规划的核心是“如何根据问题描述生成最优策略”,例如机器人路径规划问题。然而,早期研究面临知识表达复杂、搜索空间庞大等挑战。为解决这些问题,杨强团队提出“抽象空间自动生成”方法,通过分层抽象与约束满足优化搜索效率。这一阶段的探索为后续基于数据的机器学习奠定了基础。

2. 基于案例的推理:小数据时代的突破

1995年至2001年,杨强教授转向基于案例的推理(Case-based Reasoning),旨在解决小样本场景下的建模难题。以“海上搜救”为例,如何在数据稀缺的情况下融合逻辑图谱与统计建模。他提出“单样本建模=逻辑+统计”的创新方法,通过案例库推理实现知识迁移,为后续迁移学习研究埋下伏笔。

3. 迁移学习:跨领域知识复用的革命

2000年后,杨强教授开创性地提出迁移学习(Transfer Learning)框架,解决“如何将知识迁移到新领域”的核心问题。例如,如何利用互联网图像数据提升医疗影像模型的性能。他系统梳理了迁移学习的三大关键问题——“迁移什么(What)”、“如何迁移(How)”、“何时迁移(When)”,并提出基于实例、特征、模型的迁移方法。这一理论在工业界广泛应用,成为破解数据孤岛与冷启动难题的重要工具。

4. 联邦学习:隐私保护下的协同智能

2018年至今,杨强教授主导的联邦学习(Federated Learning)技术成为学术界与产业界的热点。针对数据分散、隐私严苛的场景,如跨机构金融建模或手机端模型更新。他提出横向联邦、纵向联邦、联邦迁移学习等范式,并构建“数据可用不可见”的联邦生态。他特别强调:“联邦学习的核心不仅是技术突破,还需设计激励机制与标准协议,推动多方共赢。”

大模型时代:AI的“大一统”思想与物理学的启示

在课程的“大模型”章节中,杨强以其深厚的物理学背景为锚点,提出了一个宏大的命题:“人工智能的终极目标,是构建一个能统一解释和生成所有智能现象的‘大一统模型’,正如物理学追求解释自然规律的根本理论。”这一思想贯穿了他的技术解析与未来展望。

1. 物理学的镜子:从统一场论到AI的统一模型

杨强在从事AI研究工作的多年间,都深受物理学中“统一理论”的启发。他类比道:“爱因斯坦穷尽后半生追寻统一场论,试图用一组方程描述引力与电磁力;而今天的AI学者,则在探索如何用一个模型框架覆盖语言、视觉、推理等所有智能任务。”

他以大语言模型(LLM)为例解释这种统一性:“GPT系列模型通过海量文本预训练,不仅学会了语法和知识,还能生成代码、解析图像、甚至模拟逻辑推理——这像极了物理学中标准模型对基本粒子的统一描述。尽管两者领域迥异,但内核都是‘用最少假设解释最多现象’。”

2. 判别式与生成式AI的分野

杨强教授深入剖析了生成式AI与大模型(LLM)的技术本质与发展趋势。他首先对比了判别式模型(如传统分类器)与生成式模型(如ChatGPT)的差异:前者基于数据分布完成预测任务,后者则通过学习数据规律生成新内容。杨强教授指出:“生成式AI的突破在于其创造性,但需警惕‘幻觉’问题,即模型生成内容的真实性与安全性。”

3. 大模型的三驾马车:规模、数据与算力

杨强教授引用“Scaling Law”理论,强调大模型的性能取决于参数量、数据量与算力规模。他特别提到:“参数规模较小时,增加参数量对效果的提升远优于增加数据或算力。”然而,数据质量与多样性同样关键。他援引研究预测:“高质量文本数据将于2026年耗尽,中文数据枯竭速度更快,多语言模型与数据合成技术将成为破局关键。”

经典算法的生命力:决策树与聚类的现代启示

尽管大模型风头正盛,杨强教授在课程后半程着重强调了经典机器学习算法的持久价值。

1. 决策树:可解释性与小模型的优势

通过《决策树》(Decision Tree)专题,杨强教授剖析了ID3、C4.5等算法的核心逻辑——基于信息增益、增益率或基尼指数选择分裂属性,最终构建可解释的分类模型。他提出犀利问题:“在LLM时代,为何仍需关注决策树等小模型?”答案在于其天然的可解释性、低计算成本以及对缺失数据的鲁棒性。“在医疗、金融等高风险领域,决策树仍是不可替代的‘白盒’工具。”

2. 聚类分析:无监督学习的艺术

在《聚类》(Clustering)章节,杨强教授巧妙设计了一场以学生为中心的互动实验,将抽象的K-means算法转化为一场生动的“角色扮演游戏”,让学生在动态参与中领悟无监督学习的精髓。杨强教授以沉浸式互动简化K-means算法的核心步骤,他随机选择两名学生作为初始聚类中心,其余学生模拟二维数据点,计算座位与“中心”的距离,自主选择归属簇。随后,“中心”学生根据簇内成员的平均位置调整坐标,完成一轮迭代。

经过两次动态调整后,簇分布趋于稳定。他借机点出算法特性:“初始中心随机性可能导致结果偏移,且边缘‘噪声点’会干扰均值计算——这正是K-means的局限。”短短十分钟的模拟,学生亲历了聚类从初始化到收敛的全过程,直观理解了无监督学习中“迭代优化”的本质。最后,杨强教授以一道思考题收尾:“如何将聚类转化为分类问题?”


产研融合:AI人才的培养方向

课程尾声,杨强教授结合微众银行的产业实践,对AI人才培养提出三点建议:

1. 夯实理论基础:深入理解机器学习数学本质,避免陷入“调参工程师”陷阱;

2. 关注技术伦理:在追求模型性能的同时,重视隐私保护、公平性与社会责任;

3. 拥抱跨学科思维:AI的未来在于与金融、医疗、法律等领域的深度融合,复合型人才将主导下一代技术创新。


结语:站在巨人的肩膀上眺望未来

杨强教授的课程不仅是一次知识的传递,更是一场思想的启蒙。从智能规划到联邦学习,从决策树到千亿参数大模型,他以其独到的学术视野与产业洞察,为学子们勾勒出人工智能的壮丽图景。正如他曾在开学典礼上所言:“AI的未来属于探索者,在微众银行金融科技学院这片沃土上,新一代AI人才正蓄势待发,迎接智能时代的星辰大海。”

课后,杨强教授与学院党委书记刘海山、院长陈海强、副院长葛锐就学院研究生、博士生培养体系建设进行深入研讨交流。本次公开课是学院人工智能专业硕士项目核心课程《机器学习》的客座专题之一。学院作为与微众银行共建的产业学院,我院将持续深化产教融合,创新校企协同育人模式,着力打造具有示范效应的校企合作课程体系,欢迎大家持续关注。