由中国图像图形学学会(CSIG)主办、金山办公承办的“CSIG企业行”系列活动在珠海金山软件园成功举行。活动以“AI大模型时代文档识别和理解前沿技术探讨”为主题,特邀来自中科院、北京科技大学、华中科技大学、华南理工大学等院校的专家学者,与金山办公技术团队共同探讨文档识别领域的前沿技术研究及实践成果。
中国科学院自动化研究所副所长刘成林表示,大模型时代的开启为文档识别带来了新的机遇和挑战。从早期的单字识别到字符串整体识别,再到手写文档版面分析和自然场景、视频文本中的文本检测,文档识别目前已历经三个研究阶段。而近年来人工智能深度学习等技术的成熟,使大模型成为文档识别与理解的全新研究方向。
华中科技大学白翔教授针对视觉与语言模型的研究做了详细介绍,他认为这几年多模态和跨模态对各个领域都带来非常深远的影响,各行各业围绕大模型去做定制化方案,包括对大模型本身进行调整,都有重要意义。