UiBot教程：UiBot：智能文档处理与OCR功能的使用指南

UiBot：智能文档处理与OCR功能的使用指南

在现代企业中，自动化已经不仅仅停留在规则化的流程执行上。随着AI技术的进步，越来越多需要认知和判断的业务场景也得到了自动化的可能。而UiBot，作为一款领先的RPA（机器人流程自动化）工具，将这些AI能力无缝集成，为用户提供了一站式的智能文档处理与OCR识别解决方案。

什么是智能文档处理？

简单来说，智能文档处理就是通过AI技术，将图片、文档中的非结构化信息转变为结构化数据的过程。在UiBot中，这项功能被称为“智能文档处理平台”，以前叫做UiBot Mage。这个平台提供了丰富的AI能力，帮助用户处理各种复杂的业务场景，比如合同处理、票据识别、卡证信息提取等等。

rpa_tutorial_uibot_advance_ai_function_1

在UiBot中，智能文档处理功能非常灵活，支持通过“流程创造者”来调用这些AI能力。无论你是使用社区版还是企业版，都可以通过联网来享受这项服务。而企业版还支持私有部署，即使在没有互联网连接的情况下，也可以继续使用。

rpa_tutorial_uibot_advance_ai_function_2

在智能文档处理平台中，AI功能大致分为两类：通用AI能力和定制化AI能力。通用AI能力主要是开箱即用的功能，比如标准化票据和卡证的识别。而定制化AI能力则需要用户进行一定的配置或训练，虽然使用起来稍微麻烦一些，但它能处理更加广泛的数据，适应性更强。

rpa_tutorial_uibot_advance_ai_function_3

例如，在处理一张身份证图像时，我们可以使用“通用卡证识别”功能。通过简单的步骤，先识别图像中的内容，再提取出具体的关键信息，比如姓名、身份证号码等。

假设我们要处理一张身份证图像，步骤如下：

这样一来，无论身份证图像多么复杂或倾斜，UiBot都能准确识别并提取所需的信息。

rpa_tutorial_uibot_advance_ai_function_6

除了智能文档处理，UiBot还集成了本地OCR和百度OCR两种光学字符识别功能，进一步拓展了图像文字识别的场景应用。

本地OCR功能无需联网即可使用，适用于从屏幕或图像中提取文字内容。这在处理一些无法获取界面元素的应用场景中非常有用，比如使用DirectUI技术绘制的应用界面。

rpa_tutorial_uibot_advance_ai_function_7

通过“屏幕OCR识别”命令，我们可以直接在屏幕上选择需要识别的区域，并将文字内容输出到指定变量中，方便后续操作。

rpa_tutorial_uibot_advance_ai_function_8

如果你已经购买了百度OCR的服务，可以直接在UiBot中调用百度OCR的功能。这些命令使用方法与本地OCR类似，但需要填写百度云的Access Key和Secret Key。

rpa_tutorial_uibot_advance_ai_function_9

比如，如果你需要识别一张火车票中的信息，可以使用“图像特殊OCR识别”命令，并选择合适的OCR引擎。这种方式特别适合处理特定格式的图像，如身份证、票据等。

rpa_tutorial_uibot_advance_ai_function_10

在我看来，UiBot的智能文档处理和OCR功能，极大地简化了复杂文档和图像处理的流程。无论是需要处理海量的合同文档，还是识别各类票据、卡证，UiBot都能提供快捷、准确的解决方案。如果你正在寻找一种能够帮助企业实现更多高价值业务场景自动化的工具，UiBot绝对是一个值得考虑的选择。

想深入了解DeepSeek的核心玩法扫描下方二维码加入微信群

阅读全文