人工智能与数据科学专题： AlphaGo的算法原理：强化学习与图神经网络（GNN）研究-几何留学

人工智能与数据科学专题： AlphaGo的算法原理：强化学习与图神经网络（GNN）研究

项目时间 2023.04.29 开课

编辑 | 几何留学学姐

适合人群

适合年级 (Grade): 大学生及以上

适合专业 (Major): 计算机科学、人工智能、数据科学、电子与计算机工程等专业，软件工程、自动化等相关专业或者希望掌握强化学习的学生；对人工智能、大数据以及交叉学科和方向感兴趣的学生；
学生需要具备线性代数及概率论与数理统计基础，至少会使用一门编程语言实现神经网络，有过强化学习开发经验的申请者优先

项目介绍

项目内容涉及强化学习核心理论和技能，具体包括遗传算法、强化学习框架、Q-learning、行动者-批评（actor-critic；AC）模型、马尔可夫决策过程、优化控制、图神经网络（graph neural networks; GNN）、自动机器学习（Auto ML）等。学生通过项目了解如何开发基于强化学习的生产力软件，在结束时提交项目个性化研究课题报告，进行成果展示。

授课教授

♔Pietro导师现任剑桥大学计算机科学与技术终身正教授，意大利国家认定Top100科学家， H-index64，被引用次数35000+。

♕教授2021年连中三篇计算机顶会ICML，其论文还曾发表在包括世界级学术期刊《Nature》。

♖导师持有欧洲学习和智能系统实验室（Ellis；欧洲大型跨国人工智能研究所，目前拥有千位全球顶尖计算机工程师、数学家和其他领域科学家，旨在重构欧洲人工智能前沿研究）席位、剑桥大学大数据研究指导委员会席位。

✪Pietro导师的研究兴趣为人工智能图神经网络建模，在国际知名学术期刊发表论文多篇，曾荣获欧盟委员会未来与新兴技术（FET；迄今欧盟规模最大、资助力度最强的科研资助项目之一）会展三等奖。

你能获得

7周在线小组科研学习+5周论文指导学习，共125课时
项目报告
优秀学员获得主导师 Reference Letter
结业证书
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表指导
成绩单

个性化研究课题参考

强化学习在博弈论中的应用：类alpha算法开发
利用经验留存解决强化学习所需样本太多问题的可行性分析
强化学习中的机器奖励设置方法迭代
为强化学习过拟合的特定场景重新建模的自动过程研究
具有精确尺度估计的动作-评价网络结构与强化学习优势函数

开课日期：2023-04-29

具体上课时间、最终时间安排，均以实际安排为准

预约咨询

最新项目