视觉与语义融合的场景文字检测、识别与理解技术
发布华体会平台:2023-10-12阅读量:

主讲人:周宇

主要内容:

近年来,场景文字检测、识别与理解逐渐成为计算机视觉与多模态人工智能的热点问题之一。已有的场景文字检测、识别和理解工作,多将场景文字视作一种具有特别纹理的视觉物体进行处理。然而,场景文字作为二维/三维世界中的富含语义信息的语言这一特 点,尚未受到足够重视和充分挖掘。本次报告基于场景文字兼具视 觉与语义特性这一基本观察,介绍其在歧义文字检测、低质量文字 识别和容错问答三方面的应用。希望通过我们的前期工作,能促进 各位领域专家对场景文字的本质属性进行再思考,对最优的检测、 识别与理解研究路线再探索。

华体会平台:2023年10月13日上午10:50

地点:计算机与信息工程学院明理1-105