“数据为王”的再思考与实践

简介

大数据时代催生出数字经济,各行各业都已经离不开数据,“数据为王”渐渐被人们所接受。数据对我们持 续产生的影响是什么?数据技术有些什么新进展?本论坛将以“数据为王”给我们社会带来的深刻影响为背景, 探讨多位重量级专家对于“数据为王”的再思考和实践,并展开富有建设性的对话。

直播


日程
时间:10月22日 16:00-18:00
地点:三层云南厅
主席

周可

个人介绍:博士,华中科技大学、武汉光电国家研究中心二级教授,博士生导师,中国计算机学会杰出会员、中 国电子学会高级会员,教育部新世纪优秀人才,武汉市创新岗位特聘专家。主要从事云存储、智能存储、 存储安全方向的研究。现任信息存储系统教育部重点实验室副主任、计算机学院存储研究所副所长, 华中科技大学 - 腾讯公司智能云存储技术联合研究中心主任。获国家技术发明二等奖 1 项、省部级一 等奖 3 项、二等奖 1 项、SC‘06 存储挑战赛 finalist award,主持制定国家标准 3 项、行业标准 1 项,获 授权发明专利 40 余项,在国内外学术刊物和会议上发表论文 100 余篇。

嘉宾

涂子沛

报告题目:数据智能和城市大脑的未来

演讲摘要:2016年以来,城市大脑的概念在中国引爆,此后这个名词在搜索引擎上不断攀升。而这个单词, 在 100 年前就在英文资料当中出现。在知网上,中文世界能追溯到的最早关于城市大脑的论述出现于 2001 年。在一篇介绍广东省南海市信息化建设经验的长文中,作者畅想了未来的“数字城市”,认为“一 条条相互勾连的光纤是城市的神经,各种各样的信息是其中流淌的血液,一个超级 CPU(中央处理器) 是城市的大脑”。本次演讲回顾了城市大脑概念在中国的兴起和演变,现阶段建设的概况进行了说明, 并对建设城市大脑的技术路径、步骤进行阐述。

个人简介:同时担任人民网独立董事、伊斯佳科技股份董事等职务,受聘为浙江省特聘专家、广东省“数 字政府”专委会委员、中山大学客座教授、中国人民大学客座研究员等,著有《大数据》、《数据之巅》、《数 文明》、《数商》、《给孩子讲大数据》、《给孩子讲人工智能》等书,著作受到了中央政治局常委、 全国政协主席汪洋,企业家柳传志,历史学家许倬云等政商学名人的高度评价,书中观点被中央及地 方政府文件多次引用。

嘉宾

谢长生

报告题目:“万物皆数”的哲科思考

演讲摘要:在认识自然的体系上,钱学森提出哲学、科学、技术、应用四个层次,而两千多年前我国 68 技术论坛 的道家就提出“道、法、术、器”四个层面,两者是高度契合的。由于历史原因,我国长期在“术、器”层 面高度发达,而在“道、法”层面十分缺乏,尤其缺乏科学思维。科学革命后,科学的引领和基础性作 用日益凸显,单靠“术、器”思维已步履艰难,数字技术及其革命更是如此。我国表面上看起来也是数 字技术(术)发展一日千里,数字应用(器)改变生活方式,但在哲学(道)和科学(法)层面的基 础都是西方人打下的。不论是二进制、数理逻辑、图灵机、信息论等基础理论,还是半导体、集成电 路的基础量子力学,互联网和云计算的宏观思想,甚至当今火热的深度学习算法及量子计算的提出, 都全然没有中国人的贡献。下一步走向何方,我们真的需要在哲科层面作深入思考,不能只在西方人 开辟的道路上做出了较大的“术、器”层面的进展就沾沾自喜,在西方人引领的学术道路上发表了比人 家数量多的文章就自以为已经超越。只有看清历史,才能面向未来。本报告试图从哲科层面梳理“万物 皆数”的历史脉络,并对其未来的发展进行探讨,希望抛砖引玉 , 使更多的人来思考信息领域哲科层面 的问题,期待我国年轻一代能在哲科层面作出引领未来的重要贡献。

个人简介:华中科技大学特聘教授,长期从事计算机系统结构及存储技术的教学与科研,是信息存储 系统教育部重点实验室首任主任。主持了国家自然科学重点基金等多项国家级项目,在国内外会议及 期刊上发表论文 200 余篇,拥有 50 多项专利,研究成果曾获得国际国内多项奖励。为学术界和工业界 培养了大批高层次人才。

嘉宾

李国良

报告题目:AI 原生数据库系统

演讲摘要:大数据时代下,数据库系统主要面临着三个方面的挑战。首先,基于专家经验的传统优化 技术(如代价估计,连接顺序选择,参数调优)已经不能满足异构数据、海量应用和大规模用户对性 能的需求。我们可以设计基于学习的数据库优化技术,使数据库更智能。其次,AI 时代很多数据库应 用需要使用人工智能算法,如数据库中的图像搜索。我们可以将人工智能算法嵌入到数据库,利用数 据库技术加速人工智能算法,并在数据库中提供基于人工智能的服务。再者,传统数据库侧重于使用 通用硬件(如 CPU),不能充分发挥新硬件(如 ARM、AI 芯片)的优势。 为了解决这些挑战,我们提出了原生支持人工智能(AI)的数据库系统。一方面,我们将各种人工智 能技术集成到数据库中,以提供自监控、自诊断、自愈、自优化、自安全和自组装功能。另一方面, 我们通过使用声明性语言让数据库提供人工智能功能,以降低人工智能使用门槛。我们定义了人工智 能原生数据库的五个阶段,给出了设计人工智能原生数据库的挑战。最后还以数据库自动调优、基于 深度强化学习的查询优化、基于机器学习的基数估计和自治索引 / 视图推荐为例,展示人工智能原生 数据库的优势。

个人简介:主要研究方向为数据库,大数据分析和挖掘,智能数据管理。在数据库、数据挖掘、信 息检索领域的顶级会议和期刊上发表论文 100 余篇,他引 8000 余次,入选爱思唯尔 2014-2020 年中国 高被引学者榜单。主持国家杰出青年基金、优秀青年基金、青年 973、自然基金重点等项目。获得了 VLDB 2017 Early Career Research Contributions Award(VLDB 青年贡献奖,亚洲首位获奖者)、IEEE TCDE Early Career Award(IEEE 数据工程领域杰出新人奖)、青年长江学者、“万人计划”青年拔尖、 计算机学会青年科学家奖等奖项。担任 VLDB Journal、IEEE TKDE 编委,SIGMOD21 大会主席、 VLDB21 演示主席。获得过 KDD、ICDE、CIKM 等顶级会议的最佳论文奖。获国家科技进步二等奖、 江苏省科技进步一等奖。

嘉宾

孙淩翔

报告题目:从华为存储看数据

演讲摘要:随着数据的指数级增长,数据存储逐渐成为 IT 产业中最重要的核心部分。从预研开始,华 为存储经过十余年不断积累,逐渐发展成为目前在国际上首屈一指的存储品牌。本报告将回顾研发团 队对多源异构数据存储逐渐加深的认识,介绍华为存储在存储产品上的设计思想和方法,并展望将来 数据存储产品的发展趋势。

个人简介:华为存储产品创始人之一,经历了华为存储从预研开始,第一代产品起步到现在业界竞争 力第一的辉煌过程。担任过产品的开发,设计,交付和研发部长等岗位。17-20 年期间去美国创建了波 士顿研究所,研究 IT 产业的新技术和解决方案。现在承担存储和机器视觉技术研发工作,构筑产品未 来的核心竞争力。

嘉宾

陈 妍

报告题目:多源数据融合技术的应用研究和平台化思路

演讲摘要:介绍腾讯用户研究团队在产品生命周期全流程研究时面对的多源数据类型和特点,以及在 多源数据融合技术上的基础研究成果和多个具体业务应用案例,并探讨多源数据融合的平台化思路与 对研究投入产出比的提升效益。

个人简介:主导设计过多款中国互联网成功产品及活动;并通过海量用户的产品研究项目(如微信等) 以及中国互联网网民基础研究项目,积累多年研究经验,打造具有互联网特色的研究工具和平台,建 立了“互联网银行用户体验实验室”、“互联网保险用户体验联合实验室”“社交广告品牌与用户体验研究 实验室”以及“互联网公益”“数字广东产品规划设计部”等方向的团队,培养人才及积累面向 C 端,B 端 及 G 端的服务设计经验。