演讲摘要:随着互联网与5G技术的不断发展,媒体的传播形式从传统纸质图文逐渐转向涵盖文本、图片、视频、语音的多模态形式。以深度学习为基础的人工智能技术在媒体内容的识别、融合、理解和生成等方面已显示出重要作用。通过对视频内容进行语音识别、字幕抓取、人脸识别、场景识别,获得多类别的特征信息并进行跨模态的融合理解,实现新闻视频多维度的自动编目入库、新闻短视频摘要生成等关键技术,最终构建面向多模态媒体内容理解与生成的技术生态。
讲者简介:俞定国,男,1976年出生,博士,教授,硕士生导师。现为浙江传媒学院媒体工程学院常务副院长、浙江省影视媒体技术研究重点实验室主任。主要从事媒体融合、媒体大数据与人工智能应用等领域的研究工作。近5年,先后主持省部级及以上项目6项;发表学术论文30多篇,其中20余篇被SCI/EI检索;授权发明专利2项,登记软件著作权11项。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn