简介

Midscene.js是字节跳动 Web Infra 团队全新开源的一款 UI 自动化工具,它最大的亮点在于引入了多模态 AI 推理能力。

Midscene.js 的核心开发语言为 TypeScript

官网

https://midscenejs.com/zh/index.html

Github

https://github.com/web-infra-dev/midscene?tab=readme-ov-file

核心功能

  • 自然语言交互

以往编写自动化测试脚本,需要掌握专业的编程知识,这对很多测试人员来说是个不小的挑战。但 Midscene.js你只需用自然语言描述自动化步骤,它就能理解你的指令,并在网页上精准执行相应操作。

  • 强大的数据提取能力

能够深度理解网页结构,并根据提示生成所需数据结构,在进行数据抓取或测试时,从网页中提取特定数据是常见需求。而Midscene.js 提供了强大的数据提取功能,你可以描述想要的数据结构,它会以 JSON 格式将数据返回给你。

  • 零代码测试

无需编写选择器,告别“锚点依赖症”;

  • 可视化报告

提供动画回放、步骤详情,支持在报告中直接调试,方便用户调试和优化测试流程。

73d08f68824b555be56ff5a04b6038a7.gif

  • 支持多种模型

内置对公共多模态大语言模型(如 GPT-4)和开源模型(如 UI-TARS)的支持。

  • 开源+数据安全

MIT协议,支持私有化部署,数据不出本地。

部署

Chrome 扩展安装

如果想快速体验 Midscene.js 的核心功能,安装 Chrome 扩展是个不错的选择。

打开 Chrome 浏览器,进入 Chrome 网上应用店,搜索 “Midscene.js”,找到对应的扩展程序后,点击 “添加到 Chrome” 按钮,按照提示完成安装。

配置大模型API Key即可使用

Npm安装

npm install midscene.js

源码安装

# 克隆项目
git clone https://github.com/web-infra-dev/midscene.git
cd midscene

# 安装依赖
npm install

# 启动本地服务(可选)
npm run dev

官方文档

参考文档

https://blog.csdn.net/angellee1988/article/details/151010929

https://cloud.tencent.com/developer/article/2514788

https://mp.weixin.qq.com/s?__biz=MzI3NDc4NTQ0Nw==&mid=2247558100&idx=1&sn=96e4801924b7acfaec3636a43cb5de25&chksm=eabb0c78eae7ed01fd34b4740c77b040eb168451d5891d9bec5d446f25369aa7edb6516733d4&scene=27