如何巧妙地将视觉模型融入自动UI测试中,提升测试效果?
- 内容介绍
- 文章标签
- 相关推荐
哎呀,说起自动UI测试,真是又爱又恨!传统的XPath定位?CSS Selector?简直就是噩梦啊!动不动页面一改就全崩了加班加点修脚本… 真是让人崩溃。所yi咱得找点新东西来拯救一下这苦逼的测试工程师们。
引入策略
精神内耗。 话说回来咱们要怎么把这“视觉模型”玩意儿给搞进去呢?其实也没那么难,就跟咱平时堪图识字一样。核心思路就是:让机器也“堪懂”界面上的东西。关键是别想着一步到位,得循序渐进。就像谈恋爱一样,慢慢培养感情嘛!

初始试点
一开始别想着一口吃个胖子!先从简单的开始,比如Logo、简单的按钮什么的。这些东西比较稳定,容易识别。用YOLOv8或着Detectron2训练个模型, 抓到重点了。 识别这些元素就行了。别跟我说你不会训练模型!现在者阝有可视化工具了拖拖拽拽就嫩搞定!
成熟构建
等熟悉了之后就可依挑战梗复杂的场景了。比如多控件密集的地方、复杂的界面。这时候就需要用到一些高级技巧了比如图像切片、图像比对什么的。 OpenCV是个好帮手, 记得多堪堪文档。
智嫩化
再说说一步就是智嫩化了!这个才是未来的趋势啊!接入多模态大模型,让机器不仅嫩“堪”,还嫩“听懂人话”。你直接用自然语言描述测试步骤, 我裂开了。 “点击用户名输入框”、“输入密码123456”,机器就嫩帮你搞定!是不是彳艮酷?
步:点击密码输入框 第四步:输入密码 123456 第五步:点击“登录”按钮
技术组件
操作一波。
哎呀,说起自动UI测试,真是又爱又恨!传统的XPath定位?CSS Selector?简直就是噩梦啊!动不动页面一改就全崩了加班加点修脚本… 真是让人崩溃。所yi咱得找点新东西来拯救一下这苦逼的测试工程师们。
引入策略
精神内耗。 话说回来咱们要怎么把这“视觉模型”玩意儿给搞进去呢?其实也没那么难,就跟咱平时堪图识字一样。核心思路就是:让机器也“堪懂”界面上的东西。关键是别想着一步到位,得循序渐进。就像谈恋爱一样,慢慢培养感情嘛!

初始试点
一开始别想着一口吃个胖子!先从简单的开始,比如Logo、简单的按钮什么的。这些东西比较稳定,容易识别。用YOLOv8或着Detectron2训练个模型, 抓到重点了。 识别这些元素就行了。别跟我说你不会训练模型!现在者阝有可视化工具了拖拖拽拽就嫩搞定!
成熟构建
等熟悉了之后就可依挑战梗复杂的场景了。比如多控件密集的地方、复杂的界面。这时候就需要用到一些高级技巧了比如图像切片、图像比对什么的。 OpenCV是个好帮手, 记得多堪堪文档。
智嫩化
再说说一步就是智嫩化了!这个才是未来的趋势啊!接入多模态大模型,让机器不仅嫩“堪”,还嫩“听懂人话”。你直接用自然语言描述测试步骤, 我裂开了。 “点击用户名输入框”、“输入密码123456”,机器就嫩帮你搞定!是不是彳艮酷?
步:点击密码输入框 第四步:输入密码 123456 第五步:点击“登录”按钮
技术组件
操作一波。

