阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

开源项目利用browser-use-webui和DeepSeek把浏览器打造成一个AI Agent智能体!

705次阅读
没有评论

共计 3880 个字符,预计需要花费 10 分钟才能阅读完成。

开源项目利用 browser-use-webui 和 DeepSeek 把浏览器打造成一个 AI Agent 智能体!

大家好,我是星哥,之前介绍了几款开源的 AI Agent 的项目,比如 OpenManus、autoMate 今天继续给大家带来一个开源 AI Agent 的项目。

browser-use 和 browser-use-webui

开源项目利用 browser-use-webui 和 DeepSeek 把浏览器打造成一个 AI Agent 智能体!

browser-use

简介:Make websites accessible for AI agents 开源地址:https://github.com/browser-use/browser-use

Browser-Use 是一个开源的网页自动化库,它通过提供一个简单的接口,让 LLM 能够与网站进行互动。这个库支持多标签管理、XPath 提取和视觉模型处理,使得自动化网页操作变得更加简单和高效。支持所有 LangChain 聊天模型,包括但不限于 GPT-4o、GPT-4o Mini、Claude 3.5 Sonnet 和 LLama 3.1 405B。这些模型都是当前领先的大型语言模型,能够处理各种复杂的语言相关任务。

browser-use-webui

browser-use 开源地址: 简介:Run AI Agent in your browser. 开源地址:https://github.com/browser-use/web-ui

browser-use-webui 主要功能

提供了全新的网页界面,简单好用,方便操作。 支持更多大语言模型,比如 Gemini、OpenAI、Azure 等,哦,还有最近爆火的国产大模型 DeepSeek,未来还会加更多。 支持用自己的浏览器,不用再反复登录,还能录屏。 定制了更智能的 Agent,通过优化后的提示让浏览器使用更高效。

安装 browser-use-webui

这个项目已在 Github 开源,想玩的都可以试试,用 Python 写的,版本必须在 3.11 以上。

系统环境

系统:Windows11 专业版

CPU: 英特尔 I7-13700KF

内存:32G

硬盘:1T nvme SSD +4T 机械

显卡:RTX 4070 Ti

python 版本:Python 3.13.2

第 1 步:克隆项目

git clone https://github.com/browser-use/web-ui.git
cd web-ui

第 2 步:设置 Python 环境

我们建议使用 uv 管理 Python 环境。

uv venv --python 3.11

我这边不使用他的建议

用 Anaconda Prompt

(base) C:\Users\Administrator>cd C:\Users\Administrator\Desktop\AI\web-ui
(base) C:\Users\Administrator\Desktop\AI\web-ui>

conda create -n browser_use_webui python=3.11
conda activate browser_use_webui

第 3 步:安装依赖

安装 Python 包

pip install -r requirements.txt 

 或者:pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple

安装浏览器插件

playwright install --with-deps chromium

playwright install

开源项目利用 browser-use-webui 和 DeepSeek 把浏览器打造成一个 AI Agent 智能体!

第 4 步:修改配置

把 .env.example 文件复制一份重命名为.env,用编辑器打开.env 并添加 API 键和其他设置

默认的配置文件:

OPENAI_ENDPOINT=https://api.openai.com/v1
OPENAI_API_KEY=

ANTHROPIC_API_KEY=
ANTHROPIC_ENDPOINT=https://api.anthropic.com

GOOGLE_API_KEY=

AZURE_OPENAI_ENDPOINT=
AZURE_OPENAI_API_KEY=
AZURE_OPENAI_API_VERSION=2025-01-01-preview

DEEPSEEK_ENDPOINT=https://api.deepseek.com
DEEPSEEK_API_KEY=

MISTRAL_API_KEY=
MISTRAL_ENDPOINT=https://api.mistral.ai/v1

OLLAMA_ENDPOINT=http://localhost:11434

ALIBABA_ENDPOINT=https://dashscope.aliyuncs.com/compatible-mode/v1
ALIBABA_API_KEY=

MOONSHOT_ENDPOINT=https://api.moonshot.cn/v1
MOONSHOT_API_KEY=

# Set to false to disable anonymized telemetry
ANONYMIZED_TELEMETRY=false

# LogLevel: Set to debug to enable verbose logging, set to result to get results only. Available: result | debug | info
BROWSER_USE_LOGGING_LEVEL=info

# Chrome settings
CHROME_PATH=
CHROME_USER_DATA=
CHROME_DEBUGGING_PORT=9222
CHROME_DEBUGGING_HOST=localhost
# Set to true to keep browser open between AI tasks
CHROME_PERSISTENT_SESSION=false
CHROME_CDP=
# Display settings
# Format: WIDTHxHEIGHTxDEPTH
RESOLUTION=1920x1080x24
# Width in pixels
RESOLUTION_WIDTH=1920
# Height in pixels
RESOLUTION_HEIGHT=1080

# VNC settings
VNC_PASSWORD=youvncpassword

修改的配置

# 路径 Chrome 浏览器路径(检查下自己的路径),例如 
# Mac OS "/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
# Windows "C:\Program Files\Google\Chrome\Application\chrome.exe"
CHROME_PATH="/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"

# 浏览器的用户数据路径,例如 
# Mac OS "/Users/<YourUsername>/Library/Application Support/Google/Chrome"
# Windows "C:\Users\<YourUsername>\AppData\Local\Google\Chrome\User Data"
CHROME_USER_DATA="/Users/<YourUsername>/Library/Application Support/Google/Chrome"

# 还有一些大模型的 API Key 也要改 
...

我这边修改的 chrome 的地址,根据你电脑的环境填写。

CHROME_PATH="C:\Program Files\Google\Chrome\Application\chrome.exe"
CHROME_USER_DATA="C:\Users\Administrator\AppData\Local\Google\Chrome\User Data"

第 5 步:启动运行

python webui.py --ip 127.0.0.1 --port 7788

浏览器访问 http://127.0.0.1:7788/,看到如下界面就成功了

开源项目利用 browser-use-webui 和 DeepSeek 把浏览器打造成一个 AI Agent 智能体!

完成安装 browser-use-webui

使用 browser-use-webui

1、配置 Agent

注意,这里的“Use Vision”,默认是选中状态, 如果使用的 DeepSeek 不能勾选,因为 DeepSeek 不支持视觉输入 ,注意这里很多人踩坑,一定要注意。

开源项目利用 browser-use-webui 和 DeepSeek 把浏览器打造成一个 AI Agent 智能体!

2、配置大模型

单击“LLM Settings”,我这边设置的硅基流动的 deepseek,你也可以用其他的

Base URL 填写:https://api.siliconflow.cn/v1/chat/completions

API Key:填写自己申请到的 key

model Name 填写:deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

开源项目利用 browser-use-webui 和 DeepSeek 把浏览器打造成一个 AI Agent 智能体!

3、浏览器设置

设置一下分辨率

开源项目利用 browser-use-webui 和 DeepSeek 把浏览器打造成一个 AI Agent 智能体!

4、运行

点击,run agent

开源项目利用 browser-use-webui 和 DeepSeek 把浏览器打造成一个 AI Agent 智能体!

结果

结果是 [‘404 page not found’, ‘404 page not found’, ‘404 page not found’]

开源项目利用 browser-use-webui 和 DeepSeek 把浏览器打造成一个 AI Agent 智能体!

开源项目利用 browser-use-webui 和 DeepSeek 把浏览器打造成一个 AI Agent 智能体!

修改成 openai 的接口

用 deepseek 一直没有跑通,改成 ChatGPT 的接口再试试

开源项目利用 browser-use-webui 和 DeepSeek 把浏览器打造成一个 AI Agent 智能体!

git 动画

开源项目利用 browser-use-webui 和 DeepSeek 把浏览器打造成一个 AI Agent 智能体!

用命令执行中文:

打开新浪,检索最近的 10 条新闻

开源项目利用 browser-use-webui 和 DeepSeek 把浏览器打造成一个 AI Agent 智能体!

最后

感兴趣的大家可以试试哦,安装 browser-use-webui 打造成一个 AI Agent 智能体。

写文不易,如果你都看到了这里,请点个赞和在看,分享给更多的朋友;也别忘了关注星哥玩云!这里有满满的干货分享,还有轻松有趣的技术交流~点个赞、分享给身边的小伙伴,一起成长,一起玩转技术世界吧!😊

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2025-03-28发表,共计3880字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中

星哥玩云

星哥玩云
星哥玩云
分享互联网知识
用户数
4
文章数
19350
评论数
4
阅读量
7954323
文章搜索
热门文章
星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛 NAS-6:抖音视频同步工具,视频下载自动下载保存 前言 各位玩 NAS 的朋友好,我是星哥!...
星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛 NAS-3:安装飞牛 NAS 后的很有必要的操作 前言 如果你已经有了飞牛 NAS 系统,之前...
我把用了20年的360安全卫士卸载了

我把用了20年的360安全卫士卸载了

我把用了 20 年的 360 安全卫士卸载了 是的,正如标题你看到的。 原因 偷摸安装自家的软件 莫名其妙安装...
再见zabbix!轻量级自建服务器监控神器在Linux 的完整部署指南

再见zabbix!轻量级自建服务器监控神器在Linux 的完整部署指南

再见 zabbix!轻量级自建服务器监控神器在 Linux 的完整部署指南 在日常运维中,服务器监控是绕不开的...
飞牛NAS中安装Navidrome音乐文件中文标签乱码问题解决、安装FntermX终端

飞牛NAS中安装Navidrome音乐文件中文标签乱码问题解决、安装FntermX终端

飞牛 NAS 中安装 Navidrome 音乐文件中文标签乱码问题解决、安装 FntermX 终端 问题背景 ...
阿里云CDN
阿里云CDN-提高用户访问的响应速度和成功率
随机文章
星哥带你玩飞牛NAS-8:有了NAS你可以干什么?软件汇总篇

星哥带你玩飞牛NAS-8:有了NAS你可以干什么?软件汇总篇

星哥带你玩飞牛 NAS-8:有了 NAS 你可以干什么?软件汇总篇 前言 哈喽各位玩友!我是是星哥,不少朋友私...
【1024程序员】我劝你赶紧去免费领一个AWS、华为云等的主机

【1024程序员】我劝你赶紧去免费领一个AWS、华为云等的主机

【1024 程序员】我劝你赶紧去免费领一个 AWS、华为云等的主机 每年 10 月 24 日,程序员们都会迎来...
安装并使用谷歌AI编程工具Antigravity(亲测有效)

安装并使用谷歌AI编程工具Antigravity(亲测有效)

  安装并使用谷歌 AI 编程工具 Antigravity(亲测有效) 引言 Antigravity...
星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛 NAS-3:安装飞牛 NAS 后的很有必要的操作 前言 如果你已经有了飞牛 NAS 系统,之前...
【开源神器】微信公众号内容单篇、批量下载软件

【开源神器】微信公众号内容单篇、批量下载软件

【开源神器】微信公众号内容单篇、批量下载软件 大家好,我是星哥,很多人都希望能高效地保存微信公众号的文章,用于...

免费图片视频管理工具让灵感库告别混乱

一言一句话
-「
手气不错
150元打造低成本NAS小钢炮,捡一块3865U工控板

150元打造低成本NAS小钢炮,捡一块3865U工控板

150 元打造低成本 NAS 小钢炮,捡一块 3865U 工控板 一块二手的熊猫 B3 工控板 3865U,搭...
恶意团伙利用 PHP-FPM 未授权访问漏洞发起大规模攻击

恶意团伙利用 PHP-FPM 未授权访问漏洞发起大规模攻击

恶意团伙利用 PHP-FPM 未授权访问漏洞发起大规模攻击 PHP-FPM(FastCGl Process M...
你的云服务器到底有多强?宝塔跑分告诉你

你的云服务器到底有多强?宝塔跑分告诉你

你的云服务器到底有多强?宝塔跑分告诉你 为什么要用宝塔跑分? 宝塔跑分其实就是对 CPU、内存、磁盘、IO 做...
开发者福利:免费 .frii.site 子域名,一分钟申请即用

开发者福利:免费 .frii.site 子域名,一分钟申请即用

  开发者福利:免费 .frii.site 子域名,一分钟申请即用 前言 在学习 Web 开发、部署...
还在找免费服务器?无广告免费主机,新手也能轻松上手!

还在找免费服务器?无广告免费主机,新手也能轻松上手!

还在找免费服务器?无广告免费主机,新手也能轻松上手! 前言 对于个人开发者、建站新手或是想搭建测试站点的从业者...