微信里点“发现”,扫一下
二维码便可将本文分享至朋友圈
演讲摘要:算法、算力和数据是人工智能时代的三要素,目前很多研究都着眼于人工智能算法的提升,然而准备高质量的数据也是很重要的。数据准备往往离不开人的参与,但人不是免费的,并且人的质量也是不可控的,因此本报告聚焦于人机结合的数据准备,研究如何低成本、高质量地为模型提供训练数据。另外,在人工智能背景下,高质量的数据可以指能通过产生训练产生高质量模型的数据。因此我们还将探讨面向人工智能的数据准备,建立数据与模型效果直接的联系,包括面向人工智能的数据发现、数据清洗和数据标注。
讲者简介:柴成亮,清华大学博士后。研究方向为数据管理,数据库系统等方向。主持国家自然科学基金青年项目、博后面上项目,并在SIGMOD、VLDB、ICDE、VLDBJ、TKDE、计算机学报等国内外期刊和会议上发表学术论文20余篇。获得CCF优博、ACM CHINA优博、 百度奖学金、 清华大学优秀毕业生、北京市优秀毕业生等;2020年入选博士后创新人才计划,入选福布斯中国30 under 30 榜单。