IDC 的研究总监蒂姆・劳指出,OCR 技巧是实现生成式人工智能和智能体人工智能的重要基本。可以或许高效提取高保真度文本和嵌入式图像的组织,将有机会释放数据价值,从而在竞争中获得优势。

Mistral AI 比来宣布了其最新版本的文档辨认技巧 ——Mistral OCR3,标记住文档处理范畴的重大年夜进步。该技巧在处理各类文档时展示了卓越的精确性和高效性,特别是在表格、扫描文档、复杂表格以及手写辨认方面,相较于其前一版本 Mistral OCR2,整体表示晋升了74%。

Mistral OCR3的设计主旨在于从多种类型的文档中提取文本和嵌入式图像,以实现极高的精确度和出色的机能。它不仅支撑 Markdown 输出,还可以或许基于 HTML 重构表格,赞助下流体系更好地舆解文档的内容和构造。与市情上很多同类产品比拟,Mistral OCR3体积小巧且价格合理,每1000页的处理费用仅为2美元,经由过程批量 API 更能享受50% 的扣头,最终价格低至每1000页仅1美元。

为了确保产品的精确性,Mistral OCR3引入了更具挑衅性的内部基准,专注于真实营业场景中的表示。与前几代 OCR 模型比拟,该技巧在处理手写辨认、表单、扫描及复杂文档等方面进行了明显进级,适应了多种文档类型的需求。

Mistral OCR3特别合适高容量企业级流程以及交互式文档工作流程。开辟者可以经由过程该技巧将文本和图像提取为 Markdown 格局,主动解析发票、合规表格等各类文档,并实现手写或汗青文件的数字化处理。今朝,早期客户已经在发票处理、公司档案数字化以及技巧申报文本提取等方面取得了积极成果。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部