微信里点“发现”,扫一下
二维码便可将本文分享至朋友圈
演讲摘要:近年来,大模型在自然语言处理、计算机视觉、生物学等诸多领域展现出惊人的应用价值。大模型通过在大规模无监督数据上进行预训练,在复杂交互环境中展现出了非凡的理解、推理与决策能力。然而,大模型在特定领域的任务上仍存在一定的局限性。这些任务往往需要专业化的工具或领域知识才能有效解决。本报告的内容为大模型工具学习,介绍大模型如何能够理解和使用各种工具来完成任务,包括其统一框架、主要挑战和未来方向。
讲者简介:林衍凯,中国人民大学高瓴人工智能学院准聘助理教授。2014年和2019年分别获得清华大学学士和博士学位。主要研究方向为预训练模型、自然语言处理。曾在ACL、EMNLP、NAACL、AAAI、IJCAI、NeurIPS等自然语言处理和人工智能顶级国际会议上发表论文40余篇,Google Scholar统计被引用次数(至2023年2月)达到8000余次。其知识指导的自然语言处理研究成果获评教育部自然科学一等奖(项目名《结构化知识表示学习方法》,第三完成人)和世界互联网领先成果(项目名《大规模知识图表示学习的体系化基础算法及开源工具》,第三完成人)