微信里点“发现”,扫一下
二维码便可将本文分享至朋友圈
演讲摘要:数据科学与人工智能正在改变世界。无论人工智能模型如何聪明强大,数据科学与人工智能的终极成功取决于能否获得用户信赖。建立可信的数据科学涉及多个层面。在用户与模型交互层面,如何使用户相信并接受数据分析结果呢?在数据科学与人工智能模型合作层面,如何确保参与各方之间的公平,以及合作生成的模型和分析结果对内外部用户公平呢?在数据科学生态系统层面,如何有效连接各种角色,打通数据和模型的需求与供给呢?在这个报告里,我们将探讨如何建立可信的端到端数据科学流程。为了增强用户与模型间的交互与信任,我们提出机器学习模型的精确性及一致性解释准则。我们的研究表明,机器学习模型的精确及一致解释不但是理论上的蓝图,在实践上可行性,甚至对基于云API的人工智能服务也能提供精确及一致的解释。为了在多个合作方之间建立互信,我们探讨在联邦学习中的公平性问题,包括补偿分配的公平性和模型的公平性。为了满足可信数据科学生态系统的需求,我们讨论数据和模型市场中公平性和隐私保护。最后,我们将讨论可信数据科学的一些未来研究方向。
讲者简介:加拿大西门菲沙大学裴健教授的研究聚焦在数据科学、大数据、数据挖掘和数据库领域,致力为各种新颖的数据密集型应用研发高效的数据分析技术,并转化为产品和商业实践。他是加拿大皇家学会(即加拿大国家科学院)和加拿大工程院院士、ACM和IEEE会士。他的研究成果在学术界和产业界产生了广泛影响。他的著作被广泛引用超过十万余次。他的若干算法被产业界及开源软件(如SPARK)广泛采用。他曾担任ACM SIGKDD主席、IEEE Transactions of Knowledge and Data Engineering (TKDE)主编及许多会议的主办者。他获得过多个重要奖项,如2017 ACM SIGKDD Innovation Award、2015 ACM SIGKDD Service Award和2014 IEEE ICDM Research Contribution Award等。