自然语言处理前沿技术论坛
个人简介:张伟男,博士,哈尔滨工业大学计算学部社会计算与信息检索研究中心,副教授。研究兴趣包括人机对话及自然语言处理。在ACL、AAAI、WWW、IJCAI、IEEE TKDE等CCF A类国际会议及国际顶级期刊发表论文多篇,担任多个国际会议及期刊的程序委员会成员、审稿人及期刊编委。目前为中国计算机学会(CCF)术语工作委员会执委、哈尔滨分部秘书长、YOCSEF哈尔滨副主席,中国中文信息学会(CIPS)信息检索专委会委员、青年工作委员会委员,中国人工智能学会(CAAI)青年工作委员会委员,腾讯AI Lab学术顾问。主导研发了智能人机对话系统"笨笨",上线至今拥有6000多微信平台用户,积累百万级人机对话数据对,2019年3月"笨笨"中的开放域人机对话功能成功落地到科大讯飞AIUI智能交互平台,年均被调用7亿多次。曾获黑龙江省科技进步一等奖、中国人工智能学会最佳青年成果奖、中国人工智能学会"合创杯"第二届全国青年创新创业大赛三等奖。
报告摘要:任务型对话系统,是帮助用户完成具体任务的垂领域对话系统。由于有着较为清晰的落地场景,近年来无论是在学界还是在工业界,任务型对话都取得极大的进展和关注。然而实际应用中,由于需要频繁适应新的领域和需求,充足的、高质量的标注数据常常难以获得,这严重地限制实际应用落地。为了解决数据不足的挑战,我们从三个角度研究解决方案,并介绍我们的三篇相关工作:1)从模型架构出发:探索擅长从少量样本学习的模型架构。(Few-shot Slot Tagging; ACL2020)2)从数据自身出发:数据不够就创造数据(Seq2Seq Data Augmentation; COLING2018)3)从学习算法出发:研究抗过拟合的参数学习算法(Recall and Learn Fine-tuning; EMNLP2020)。
个人简介:车万翔博士,哈尔滨工业大学计算机学院教授,博士生导师,教育部青年长江学者,黑龙江省"龙江学者"青年学者,斯坦福大学访问学者,2019年入选黑龙江省首批"头雁计划"团队成员。现任中国中文信息学会计算语言学专业委员会委员、青年工作委员会副主任;中国计算机学会高级会员、曾任YOCSEF哈尔滨主席(2016-2017年度)。在ACL、EMNLP、AAAI、IJCAI等国内外高水平期刊和会议上发表学术论文50余篇,其中AAAI 2013年的文章获得了最佳论文提名奖,论文累计被引用3,500余次(Google Scholar数据),H-index值为32。出版教材 2 部,译著 2 部。目前承担国家自然科学基金、973等多项科研项目。负责研发的语言技术平台(LTP)已被600余家单位共享,提供的在线"语言云"服务已有用户1万余人,并授权给百度、腾讯、华为等公司使用。2018、2019连续两年获CoNLL国际评测第1名。2020年获黑龙江省青年科技奖;2015、2016连续两年获Google Focused Research Award(谷歌专注研究奖);2016年,获黑龙江省科技进步一等奖(排名第2);2012年,获黑龙江省技术发明奖二等奖(排名第2);2010年获中国中文信息学会"钱伟长"中文信息处理科学技术奖一等奖(排名第2)、首届汉王青年创新奖(个人)等多项奖励。2017年,所主讲的MOOC课程《高级语言程序设计(Python)》获国家精品在线开放课程。
报告摘要:如何让机器跟人一样具备学习与思考的能力,是人工智能研究的高级目标,当前人工智能在逻辑推理、常识运用、自学习等方面还存在相当不足,自然语言推理(Natura Language Reasoning)是认知智能非常热门的研究领域,当前主要研究集中在不同粒度语义表示之间的推理、相关性等,它可广泛应用于:对话问答、推荐、搜索、自动摘要等。本报告主要将介绍科大讯飞认知智能国家重点实验室在自然语言推理领域的两方面工作,分别是利用结构化数据中的信息进行推理以及利用神经网络进行符号化推理。
个人简介:陈志刚,中国科学技术大学博士,科大讯飞AI研究院副院长、认知智能国家重点实验室副主任。陈博士在语音合成、语音识别、自然语言理解、语音交互等方向有着多年的研究和产品化经验,目前分管科大讯飞认知智能技术研究及产品化,相关成果在科大讯飞的智能客服、智能汽车、家电、教育、医疗等众多行业领域有着广泛应用,获得省级科技进步奖项1项。目前担任的社会学术兼职有:中国人工智能学会理事、副秘书长,中国中文信息学会青年工作委员会委员。
报告摘要:当今主流神经机器翻译系统依赖多层神经网络,因此可以对双语文字进行更为有效的表示。但是深层神经网络给模型训练增加了难度,同时也降低了实际应用中的翻译速度。本报告将从小牛翻译的实践出发,分别从有效利用多层网络进行训练和多层信息共享两个角度探索神经机器翻译中多层网络的信息融合方法。基于这些尝试,我们成功的训练了超过40层的深度神经机器翻译系统,同时提高了翻译速度。以上方法已经被成功的应用于小牛翻译在线引擎(小牛翻译云)及离线引擎(翻译机)。同时,本次报告也会分享团队在开源系统方面的一些工作进展,以及在机器翻译系统研发中的一些经验及体会。
个人简介:肖桐,博士,副教授,博士生导师,东北大学自然语言处理实验室主任。2012年博士毕业于东北大学,中国中文信息学会首届优秀博士论文提名奖获得者,曾先后在日本富士施乐研究中心、微软亚洲研究院访问学习。2013-2014赴英国剑桥大学开展博士后研究。小牛开源项目的技术负责人(www.niutrans.com),并主持多套机器翻译评测(比赛)系统的研发,在WMT、CWMT等评测中取得多项任务的第一。至今,NiuTrans系统已经被来自全世界的两千多个机构下载注册使用,该系统也于2016年获得国内自然语言处理领域最高奖 – 钱伟长中文信息处理科学技术奖(一等奖)。在人工智能及自然处理语言领域重要期刊AI、JAIR、TASL及顶级会议AAAI、IJCAI、ACL发表论文30余篇。 社会学术兼职包括:中国中文信息学会青年工作委员会副主任、中国中文信息学会信息检索与内容安全专业委员会委员等、中国计算机学会中文信息技术专委会。
报告摘要:近年来,多人对话领域的研究有了长足的发展,诸如会议摘要等多人对话应用成为当前的热门研究点。与书面文本"相邻语句之间存在明显的顺序关系"不同,多人对话文本中存在复杂的跨句子联系,因此在对话任务中需要考虑到对话中复杂的图状语篇结构。为验证对话语篇结构的有效性,我们将其应用于对话阅读理解任务中,并构建了带语篇结构的多人对话阅读理解数据集Molweni。本次报告即介绍了多人对话语篇结构分析任务及其在多人对话阅读理解任务上的应用。
个人简介:刘铭,男,准聘岗副教授/博士生生导师, 哈尔滨工业大学计算机科学与技术学院. 先后主持国家自然科学基金、中国博士后科学基金特别资助、中国博士后科学基金面上资助一等资助、腾讯-CCF犀牛鸟创意基金、MSRA联合项目等多项基金项目. 获黑龙江省科学技术一等奖一项, 获哈尔滨市科技成果一项. 近年来以第一作者发表论文20余篇,包括TKDE、TOIS、KAIS、IJCAI、ACL等知名学术刊物或会议上, 英文译著一部.CCKS 2019出版主席,CCKS 2020,NLPCC 2020 领域主席。