UiBot进行无界面元素目标的图像自动化操作

在日常工作中，我们时常会遇到一些软件，它们的界面元素无法被自动化工具直接识别。比如一些虚拟机、远程桌面以及基于DirectUI技术的应用程序。这时候，UiBot提供的“界面图像自动化”功能就显得尤为重要了。今天我们来聊聊如何在UiBot中利用界面图像自动化功能，处理那些无法直接定位的界面元素。

为什么不能使用界面元素？

在上一章中，我们讨论了界面元素的自动化操作，通过调用界面元素所在软件提供的接口来实现操作。然而，不是所有的软件都会提供这样的接口，特别是以下几种情况：

虚拟机和远程桌面：例如Citrix、VMWare、Hyper-V、VirtualBox等，它们运行在独立的操作系统中，与UiBot所在的操作系统隔离开来，因此UiBot无法直接操作这些环境中的界面元素。
基于DirectUI的软件：许多现代应用为了追求美观，采用了DirectUI开发框架，这些界面的元素是“画”出来的，并没有对外开放操作接口，UiBot自然无法识别这些元素。
游戏：由于游戏界面的动态性和高时效性，界面元素的操作更是复杂多变，通常不适合直接使用RPA工具进行自动化操作。

无目标命令的运用

在面对无法识别界面元素的情况时，UiBot提供了一组“无目标命令”，这些命令无需依赖界面元素来实现操作。关键的无目标命令包括“模拟移动”和“模拟点击”，它们允许我们在指定的坐标上执行鼠标操作。

rpa_tutorial_uibot_basic_automation_image_1

使用屏幕坐标系

在Windows操作系统中，每一个屏幕上的点都有唯一的坐标（x, y），通过这两个数值，我们可以在屏幕上准确地定位到特定的点。在UiBot中，我们可以使用这些坐标来实现无目标操作。比如，如果我们知道一个输入框的中心坐标为x:200, y:300，就可以通过“模拟移动”和“模拟点击”命令精确地操控该输入框。

rpa_tutorial_uibot_basic_automation_image_2

然而，固定的坐标只适用于特定的场景，因为在Windows的多窗口环境中，界面元素的位置常常会发生变化。因此，我们需要动态地获取元素位置，而不是依赖固定的坐标。

图像命令的使用

UiBot中的图像命令是界面图像自动化的核心，通过“查找图像”命令，我们可以在屏幕上搜索特定图像，并获取其坐标。

rpa_tutorial_uibot_basic_automation_image_3

比如，在Steam的登录界面中，我们无法直接获取“登录”按钮的位置，但是可以使用“查找图像”命令找到它，并模拟点击。

rpa_tutorial_uibot_basic_automation_image_4

步骤示例：

查找图像：首先，在“流程创造者”中插入一条“查找图像”命令，并通过“从界面上选取”来指定要查找的图像及其区域。
模拟移动和点击：通过“模拟移动”命令将鼠标移动到查找到的图像坐标，然后用“模拟点击”执行操作。

图像命令也可以使用“点击图像”这类组合命令来简化流程操作，它集成了“查找图像”、“模拟移动”和“模拟点击”功能，大大提高了操作效率。

实用技巧

虽然图像自动化功能强大，但我们仍需注意以下几点：

选择小型截图：截图时尽量选取较小的关键特征部分，减少不必要的细节，可以提高查找速度和准确性。
调整相似度：适当调整相似度参数（通常设为0.9），以平衡“错选”和“漏选”的风险。
保持分辨率一致：确保开发和运行流程的计算机分辨率及缩放比例一致，避免因界面变化导致命令失效。

智能识别

在处理无法识别的界面元素时，UiBot的智能识别功能提供了一种更高效的方法。通过“智能识别屏幕范围”命令，UiBot可以分析屏幕图像，识别出潜在的界面元素。

rpa_tutorial_uibot_basic_automation_image_8

如何使用智能识别？

智能识别屏幕范围：插入“智能识别屏幕范围”命令，选择需要识别的屏幕区域。
后续操作：在智能识别的基础上，使用“智能识别后点击”等命令，进行点击、输入等操作。

如果界面上存在多个相似元素，UiBot可以利用“锚点”技术，通过锚点的独特性来定位特定元素。

rpa_tutorial_uibot_basic_automation_image_11

最后

在我看来，界面图像自动化和智能识别是处理无法直接获取界面元素的理想解决方案。无论是图像命令还是智能识别功能，都可以帮助我们在复杂环境中实现高效自动化操作。

然而，考虑到图像自动化的一些局限性，能用界面元素的场景还是应优先使用界面元素自动化，以获得更好的性能和可靠性。通过灵活运用这些工具，我们可以极大地扩展UiBot的应用范围，实现更复杂的自动化任务。

想深入了解DeepSeek的核心玩法扫描下方二维码加入微信群

阅读全文

界面元素自动化

软件自动化

目录

为什么不能使用界面元素？无目标命令的运用图像命令的使用实用技巧智能识别最后

松鼠盒子AI是什么？

松鼠盒子AI是专业靠谱的AI人工智能工具评测推荐网站。已收录了国内外上千款AI工具、GPTs应用，涉及AI副业、AI编程、AI写作、AI问答、AI绘画、AI自媒体、AI开源项目等领域，可以通过类别和功能来搜索和过滤这些工具；同时也整理了ChatGPT、Stable Diffusion、Midjourney、Prompt Engineering、Sora等AI工具使用教程。

免责声明

本站内容整理自网络，所提供内容仅供学习使用，请勿做非法用途，不得以任何方式利用本网站提供内容直接或间接从事违反中国法律法规，以及社会公德的行为。若本站内容涉嫌侵犯他人知识产权或其他合法权益的内容，请及时联系立即删除；本站尊重并保护所有用户的个人隐私权。

云服务

腾讯云

综合性的云计算服务平台，现已接入DeepSeek，提供多样化的云解决方案

高效可靠

云服务

阿里云

全球领先的云计算与数据服务平台，提供云服务器、存储、数据库、安全等多种服务

多样化

RPA

八爪鱼RPA

支持一键抓取公众号/小红书/抖音/淘宝数据

流程自动化

付费

AI爆文训练营

图文变现友好赛道，低门槛、高上限，教你从0到1做个赚钱的公众号!

躺着赚钱

￥149/年

何老师陪你做副业

这里聚焦AI副业、个人IP、自媒体运营、写作、赚钱案例。不哔哔，只分享有价值的副业项目。

AI赚钱案例

限免

DeepSeek进阶教程

带你全面掌握DeepSeek应用技巧。提升工作、学习效率

100万人学过

付费

网盘拉新实战教程

每周花费一小时，手把手教你赚网盘平台佣金

500人学过

限时优惠

AiPPT

结合最新AI技术，为用户提供一键生成高质量PPT的解决方案。

一键生成 PPT

免费

豆包MarsCode

一款免费的AI编程助手，全新支持DeepSeek R1/V3、豆包大模型1.5自由切换，免部署、更准确、更强大！

AI编程助手

免费

Monica AI

Monica AI满血复活DeepSeek【免费】，提升您的聊天、搜索、写作和编程体验。

一站式 AI 助手

云服务

腾讯云

综合性的云计算服务平台，现已接入DeepSeek，提供多样化的云解决方案

高效可靠

云服务

阿里云

全球领先的云计算与数据服务平台，提供云服务器、存储、数据库、安全等多种服务

多样化

RPA

八爪鱼RPA

支持一键抓取公众号/小红书/抖音/淘宝数据

流程自动化

付费

AI爆文训练营

图文变现友好赛道，低门槛、高上限，教你从0到1做个赚钱的公众号!

躺着赚钱

DeepSeek企业微信码

免费领取DeepSeek资料

提示