华体会平台-华体会(中国)

视觉与语义融合的场景文字检测、识别与理解技术

发布华体会平台：2023-10-12阅读量：

主讲人:周宇

主要内容:

近年来，场景文字检测、识别与理解逐渐成为计算机视觉与多模态人工智能的热点问题之一。已有的场景文字检测、识别和理解工作，多将场景文字视作一种具有特别纹理的视觉物体进行处理。然而，场景文字作为二维/三维世界中的富含语义信息的语言这一特点，尚未受到足够重视和充分挖掘。本次报告基于场景文字兼具视觉与语义特性这一基本观察，介绍其在歧义文字检测、低质量文字识别和容错问答三方面的应用。希望通过我们的前期工作，能促进各位领域专家对场景文字的本质属性进行再思考，对最优的检测、识别与理解研究路线再探索。

华体会平台:2023年10月13日上午10:50

地点:计算机与信息工程学院明理1-105