演讲摘要:过去50多年来,文字识别的研究取得了巨大进展。深度学习技术使得大类别集手写汉字识别和多语言手写文本行识别精度大幅提高。但是,单字识别研究仍然有意义:一方面好的单字识别器有助于提升文本行识别精度,另一方面有些场合(比如古籍识别)很难对所有类别收集大量样本用于训练分类器。零样本识别技术在只有部分类别样本训练的情况下,可以识别没有训练样本的新类别样本,因而在大类别集、部分类别缺乏样本的情况下有很大的应用价值。本报告介绍一些零样本汉字识别的研究工作,包括基于部首检测的方法、基于树结构嵌入的方法、基于印刷体原型匹配的方法、基于跨模态度量学习的甲骨文字识别方法。这些工作显示了零样本识别的初步潜力,但还需要更多努力去提高识别精度。
讲者简介:无
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn