安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210072765.0 (22)申请日 2022.01.21 (71)申请人 北京有竹居网络技 术有限公司 地址 101299 北京市平谷区林荫北街13号 信息大厦802室 (72)发明人 毛晓飞 黄灿 (74)专利代理 机构 北京英创嘉友知识产权代理 事务所(普通 合伙) 11447 代理人 贾会玲 (51)Int.Cl. G06V 20/62(2022.01) G06V 30/10(2022.01) G06V 30/148(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01)G06K 9/62(2022.01) (54)发明名称 图像处理方法、 装置、 可读存储介质及电子 设备 (57)摘要 本公开涉及一种图像处理方法、 装置、 可读 存储介质及电子设备。 方法包括: 从目标图像中 提取文字行区域; 针对每一文字行区域, 对该文 字行区域进行切分, 得到该文字行区域对应的至 少一个单字符图像; 将该文字行区域对应的至少 一个单字符图像输入到预先训练好的字符识别 模型中, 得到该文字行区域对应的识别文本。 由 于是根据文字行区域对应的各单字符图像进行 文本识别的, 因此, 可以避免文字行区域中字符 空隙对文本识别结果的影 响, 从而可以提升文本 识别的准确度。 另外, 同时根据文字行区域对应 的各单字符图像进行文本识别, 而非是对每一单 字符图像分别进行识别, 从而能够捕捉到文字行 区域中相邻字符之间的关联特征, 从而进一步提 升文本识别的准确度。 权利要求书2页 说明书12页 附图4页 CN 114429628 A 2022.05.03 CN 114429628 A 1.一种图像处 理方法, 其特 征在于, 包括: 从目标图像中提取文字行区域; 针对每一所述文字行区域, 对该文字行区域进行切分, 得到该文字行区域对应的至少 一个单字符图像; 将该文字行区域对应的所述至少一个单字符图像输入到预先训练好的字 符识别模型中, 得到该文字行区域对应的识别文本 。 2.根据权利要求1所述的方法, 其特征在于, 所述对该文字行区域进行切分, 得到该文 字行区域对应的至少一个单字符图像, 包括: 将该文字行区域输入到预先训练好的特征提取模型中, 得到用于表征该文字行区域中 各像素列是否包含字符的目标序列, 其中, 所述 目标序列的长度等于该文字行区域包含的 像素列的个数; 根据所述目标序列, 对该文字行区域进行切分, 得到该文字行区域对应的至少一个单 字符图像。 3.根据权利要求2所述的方法, 其特征在于, 所述特征提取模型包括依次连接的特征提 取模块、 第一编码模块、 第一全连接层以及后处 理模块; 其中, 所述特征提取模块, 用于对该文字行区域进行特征提取, 得到该文字行区域对应 的第一特 征序列; 所述第一编码模块, 用于对所述第一特 征序列进行编码, 得到第一编码序列; 所述第一全连接层, 用于根据所述第一编码序列, 生成用于表征该文字行区域中各字 符的位置信息的第二特 征序列; 所述后处理模块, 用于对所述第二特征序列进行归一化, 并将归一化后所得的第二特 征序列的长度调整为目标长度, 得到用于表征该文字行区域中各像素列是否包含字符的目 标序列, 其中, 所述目标长度等于该文字行区域包 含的像素列的个数。 4.根据权利要求2所述的方法, 其特征在于, 所述特征提取模型通过如下方式训练得 到: 获取样本文字行区域和用于表征所述样本文字行区域中各像素列是否包含字符的标 注序列; 将所述样本文字行区域输入到所述特征提取模型中, 得到用于表征所述样本文字行区 域中各像素列是否包 含字符的训练序列; 根据所述训练序列和所述标注序列, 确定目标损失; 根据所述目标损失对所述特征提取模型进行参数更新, 并在所述目标损失小于或等于 预设阈值时结束训练, 以得到所述特 征提取模型。 5.根据权利要求4所述的方法, 其特征在于, 所述根据所述训练序列和所述标注序列, 确定目标损失, 包括: 根据所述训练序列和所述标注序列, 基于 CTC损失函数确定目标损失。 6.根据权利 要求2所述的方法, 其特征在于, 所述目标序列 为0‑1序列, 其中, 1表示该文 字行区域中与其对应的像素列包含字符, 0表示该文字行区域中与其对应的像素列不包含 字符; 所述根据所述目标序列, 对该文字行区域进行切分, 得到该文字行区域对应的至少一 个单字符图像, 包括:权 利 要 求 书 1/2 页 2 CN 114429628 A 2将该文字行区域中、 与所述目标序列中连续1对应的像素列确定为单字符区域; 将每一所述单字符区域从所述文字行区域中切分出来, 得到该文字行区域对应的至少 一个单字符图像。 7.根据权利要求1 ‑6中任一项所述的方法, 其特征在于, 所述字符识别模型包括依次连 接的预处 理模块、 第二编码模块、 解码模块以及第二全连接层; 其中, 所述预处理模块, 用于针对该文字行区域对应的所述至少一个单字符图像中的 每一所述单字符图像, 将该单字符图像归一化为预设尺寸的图像, 并将归一化后所得的单 字符图像拉直成预设长度的一维行向量, 之后, 将每一所述单字符图像对应的所述一维向 量组成多维矩阵; 所述第二编码模块, 用于对所述多维矩阵进行编码, 得到第二编码序列; 所述解码模块, 用于根据所述第二编码序列, 生成每一所述单字符图像对应的特征向 量; 所述第二全连接层, 用于根据每一所述特 征向量, 生成该文字行区域对应的识别文本 。 8.一种图像处 理装置, 其特 征在于, 包括: 提取模块, 用于从目标图像中提取文字行区域; 切分模块, 用于针对所述提取模块提取到的每一所述文字行区域, 对该文字行区域进 行切分, 得到该文字行区域对应的至少一个单字符图像; 识别模块, 用于将所述切分模块切 分得到的该文字行区域对应的所述至少一个单字符图像输入到预先训练好的字符识别模 型中, 得到该文字行区域对应的识别文本 。 9.一种计算机可读介质, 其上存储有计算机程序, 其特征在于, 该程序被处理装置执行 时实现权利要求1 ‑7中任一项所述方法的步骤。 10.一种电子设备, 其特 征在于, 包括: 存储装置, 其上存 储有计算机程序; 处理装置, 用于执行所述存储装置 中的所述计算机程序, 以实现权利要求1 ‑7中任一项 所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114429628 A 3
专利 图像处理方法、装置、可读存储介质及电子设备
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-03-03 12:06:38
上传分享
举报
下载
原文档
(652.8 KB)
分享
友情链接
QC-T 1162-2022 汽车外饰件用蜂窝夹层结构制品.pdf
GB-T 35392-2017 无损检测 电导率电磁 涡流 测定方法.pdf
GB-T 8630-2013 纺织品 洗涤和干燥后尺寸变化的测定.pdf
T-CSAE 111—2019 乘用车空气动力学性能术语.pdf
GB-T 34690.2-2017 印刷技术 胶印数字化过程控制 第2部分:作业环境.pdf
GB-T 32570-2016 集装箱用钢板及钢带.pdf
TTAF 180.3—2023 小程序个人信息保护规范 第3部分:全流程开发管理.pdf
DB32-T 3514.8-2019 电子政务外网建设规范 第8部分:运维服务 江苏省.pdf
GB-T 1859.3-2015 往复式内燃机 声压法声功率级的测定 第3部分:半消声室精密法.pdf
NY-T 395-2012 农田土壤环境质量监测技术规范.pdf
GB-T 19001-2016 ISO90012015 质量管理体系要求.pdf
GB 12955-2008 防火门.pdf
GB-T 30269.807-2018 信息技术 传感器网络 第807部分:测试:网络传输安全.pdf
JR-T 0002-2016 银行卡自动柜员机(ATM)终端技术规范.pdf
T-QGCML 1684—2023 LED大型广告牌制作工艺.pdf
GB-T 4333.4-2007 硅铁 铝含量的测定 铬天青S分光光度法、EDTA滴定法和火焰原子吸收光谱法.pdf
T-CASME 665—2023 乡村居住建筑节能设计规范.pdf
GB-T 25057-2010 信息安全技术 公钥基础设施 电子签名卡应用接口基本要求.pdf
T-ZZB 2928—2022 锥形磨浆机.pdf
T-CEC 611—2022 变电站设备声成像测试技术导则.pdf
1
/
19
评价文档
赞助2元 点击下载(652.8 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。