大模型时代下百度文档OCR技术的突破和应用
发布华体会平台:2023-10-12阅读量:

主讲人:章成全

主要内容:在大数据和大模型驱动的时代,研制领先的文档OCR 技 术和平台对于推动产业数字化转型和智能化升级具有至关重要 的作用。智能文档 OCR 技术不仅要准确识别各种复杂场景文 档图像中的文字信息,还要结合丰富的行业语言知识来理解和 提取文档中蕴含的高价值结构化信息。为了应对产业应用中的 诸多挑战,百度 OCR 团队研发了先进的视觉和语言联合的预 训练技术,充分挖掘大数据的价值,打造了一套涵盖文档图像 预处理、检测、识别和结构化理解等全面能力的 OCR 技术栈。 同时,还建设了面向千行百业服务的云端 OCR 引擎和多款面 向普通用户体验智能化升级的文档 AI 产品。

华体会平台:2023年10月13日上午11:20

地点:计算机与信息工程学院明理1-105