专利名称:一种基于深度学习的自然场景文本检测方法专利类型:发明专利发明人:刘发贵,陈成
申请号:CN201910270269.4申请日:20190403公开号:CN110135248A公开日:20190816
摘要:本发明公开了一种基于深度学习的自然场景文本检测方法。该方法使用CNN网络提取文本的多尺度特征,然后使用RNN编码这些特征以充分利用文本的上下文特性;接着,将特征图输入ROI池化层并输出一系列的文本提议。在经过非极大值抑制之后,最后通过一个文本连接器将生成的文本提议连接起来,从而灵活高效地实现多尺度、多方向的文本检测。本发明提升了多方向、变尺度条件下自然场景文本检测的准确率和召回率。
申请人:华南理工大学
地址:510640 广东省广州市天河区五山路381号
国籍:CN
代理机构:广州粤高专利商标代理有限公司
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容