微信里点“发现”,扫一下
二维码便可将本文分享至朋友圈
演讲摘要:随着云数据库技术的迅猛发展,越来越多的用户利用云数据库管理数据,这给数据库管理系统(DBMS)的测试带来新的难题。一方面,如何在保护数据隐私的前提下,生成与原始数据具有近似测试效果的合成数据十分重要;另一方面,需要研究如何适配用户不同场景下的多样化测试需求,生成语法正确且约束感知的SQL查询。针对这些新的挑战,本项目提出研究基于深度学习的数据库测试数据与查询生成技术,重点解决两个关键问题:其一是通过深度生成模型捕获数据的复杂分布,生成兼顾数据的隐私保护与测试效果的合成数据;其二是利用强化学习来生成约束感知的测试SQL查询,满足用户多样化的测试需求。在此基础上,本项目拟对关键技术进行集成,构建基于深度学习的数据库测试工具集。
讲者简介:范举,博士,中国人民大学数据工程与知识工程教育部重点实验室副教授,博士生导师,国家自然科学基金优秀青年基金获得者。2012年于清华大学计算机科学与技术系获得博士学位,随后在新加坡国立大学计算机学院进行博士后的研究工作,2015年入职中国人民大学,并入选学校杰出学者青年学者。目前的研究方向包括:基于人工智能的数据库技术(AI4DB)、人在回路的数据准备、大数据管理与分析等。近年来,作为负责人先后主持国家自然科学基金优秀青年基金项目、重点项目课题、面上项目、青年项目,以及多项产学研合作项目。相关研究成果在SIGMOD、VLDB、ICDE、TKDE等CCF-A类期刊和会议上发表论文40余篇。获得2017年度ACM中国新星奖、中国人民大学教学标兵等奖励。