支持从扫描仪或手机拍摄的PDF和图片中
检测文字区域并准确识别出文字,转化成计算机可处理的文本
在传统OCR技术基础上融合了NLP自然语言处理技术,
通过语义理解、语义还原技术进行字符修正,保证语句、语义的完整性
支持结构化的表单识别,帮助您快速便捷地完成纸质报表单据的电子化
通过融合NLP自然语言处理技术,
还可以恢复文档的自然段落,避免因缩进、换行导致的语义割裂
二值化、去噪、倾斜矫正
版面分析、字符切割提取、特征提取
特征高维化、特征矢量计算、
样本训练(基于OpenCV)
语义分析分析和语义理解、文字矫正、版面还原
结果格式化
打开微信扫一扫,关注公众号