语音对话与听觉前沿技术与社会使命

简介

语音、语言和听觉是人类沟通和获取信息最自然便捷的手段,言语交互带来了人机交互的根本性变革。在 IT 产业已经进入了全球第五次浪潮——移动互联网时代的今天,语音、语言及听觉信号与信息的处理已经成为 智能移动终端、智能教育、智能家电等众多产业发展所依赖的共性核心技术,是大数据和认知计算时代信息技 术产业未来发展的制高点,不仅具有广阔的市场前景,还在国家信息安全和民族文化传播方面具有重要的战略 意义。 

语音、语言及听觉信息处理是一个拥有集中、完整的科学问题体系的信息技术方向,主要涉及的研究方向 和科学问题包括:听觉感知和认知机理、听觉场景感知分析与重建、语音生成神经机理及其应用、智能语音交 互与应用、互联网言语的跨模态建模、言语技术中的深度学习与计算建模等。 

论坛将针对上述研究方向,围绕语音、语言与听觉研究的技术发展和社会使命,开展主题报告、panel 和 研讨思想秀三个交流环节。通过广泛邀请领域内学者与业界领袖参会,力求达到凝练领域内前沿科学问题、增 进学术界与工业界交流、展望学科发展未来的目的。

直播
日程
时间:10月24日 16:00-18:00
地点:二层四川厅
主席

党建武

个人简介:国家千人计划特聘专家、973 项目首席科学家 天津大学计算机学院教授,国家千人计划特聘专家、973 项目首席科学家、国立大学法人日本北陆先端 科学技术大学院大学信息科学学院教授、西北工业大学兼职教授,曾任清华大学计算机系讲席教授。 于 1982 和 1984 年在清华大学计算机科学与技术系获得工学学士和工学硕士,1992 年获得日本国立静 冈大学大学院工学博士。首次严谨地证明了梨状窝在人的语音生成及个性化中的作用,被誉为开拓性 的基础研究。

主席

陶建华

个人简介:中科院自动化所研究员 中科院自动化所模式识别国家重点实验室副主任、国家杰出青年基金获得者。1993 年和 1996 年分别获 得南京大学电子系学士和硕士学位,2001 年获清华大学计算机系博士学位。目前担任 IEEE Trans. on Affective Computing Steering Committee Member、ISCA SIG-CSLP 副主席、HUMAINE 学会执行理事、 中国计算机学会常务理事、中国人工智能学会理事、中国中文信息学会理事、中国声学学会理事等职务。 先后负责和参与国家级项目(863 重点、国家自然科学基金、发改委、科技部国际合作)20 余项。

主席

俞 凯

个人简介:上海交通大学计算机科学与工程系研究员 上海交通大学计算机系教授,思必驰公司首席科学家。清华大学本科、硕士,剑桥大学博士。长期从 事对话式人工智能、语音及语言处理的研究和产业化工作。入选国家级人才工程,NSFC 优青,上海市"东 方学者"特聘教授,IEEE Speech and Language Processing Technical Committee 委员(2017-2019)。中 国人工智能产业发展联盟学术和知识产权组组长,CCF 语音对话及听觉专业组副主任。发表论文 170 160 技术论坛 余篇,获得 ISCA 《Computer Speech and Language》 ,《Speech Communication》,InterSpeech Best Paper Award 等多篇国际期刊和会议优秀论文奖,以及多个国际研究评测冠军。曾获吴文俊人工智能科 技进步奖,《科学中国人》年度人物,CCF 青竹奖。 论坛讲者

嘉宾

吴玺宏

报告题目:从语音到发声姿态的反演:一种发声和听觉过程协同的自监督学习框架

报告摘要:在深度学习技术的推动下,随着语音标注数据规模的巨量化,机器语音识别取得了令人瞩目 的进展。种种迹象表明语音识别性能已显露出"天棚"现象,而且在方言和小语种语音识别方面尚无有效 的解决方案。 报告首先对语音识别任务的工作假设进行反思,在此基础上基于听觉的"肌动理论(Motor Theory)", 提出了一种结合发声物理模型的非监督自主学习方法,即具身学习(Embodied Learning)方法。该方法 通过正向物理模型和逆向听觉模型的迭代学习,实现了从任意非标注语音到声门激励信号和发声姿态参 数的推断,实现了对语音具有可解释性的描述;通过在线自适应实现了对新语音的发声姿态推断,解决 了模型学习的泛化问题。基于发声姿态可进一步实现任意语种的音系构建,为小语种和方言的语音识别、 个性化语音合成任务提供了一个新的解决思路。

个人简介:现任北京大学信息科学技术学院智能科学系副主任、视觉与听觉信息处理国家重点实验室 副主任、信息科学中心副主任以及北京大学言语听觉研究中心副主任等职务。近年来,吴玺宏教授先后 在国内外重要期刊会议上发表学术论文 100 余篇,其中多篇论文发表在国际重要杂志上,如《Hearing Research》等。先后主持国家级、省部级项目 20 余项,包括国家 863 项目、国家自然科学基金重点项目、 国家科技攻关项目、教育部"新世纪优秀人才"计划项目、北京市自然科学基金项目、教育部中央财政专项等; 作为主要参加者承担国家级、省部级科研项目 10余项,包括国家 973项目、国家自然科学基金重点项目(2 项)、国家自然科学基金面上项目、北京大学建设世界一流大学计划项目等,累计承担经费逾千万元。