browser_use 自动化浏览器agent使用案例

发布于:2025-03-19 ⋅ 阅读:(18) ⋅ 点赞:(0)

参考:
https://github.com/browser-use/browser-use/tree/577e15c963f7e3c499aac312ecb8da6e1f4733fe

浏览器启动后,页面一直空白问题解决:
https://github.com/browser-use/browser-use/issues/986

安装:

pip install browser-use

playwright install  ##安装浏览器模拟工具

使用:

主要使用deepseek模型没有图像能力,需要设置use_vision=False浏览器才不会是空白
在这里插入图片描述

from langchain_openai import ChatOpenAI
from langchain_deepseek import ChatDeepSeek

from browser_use import Agent
import asyncio
from dotenv import load_dotenv
load_dotenv()

async def main():
    agent = Agent(
        task="Compare the price of gpt-4o and DeepSeek-V3",
        # llm=ChatDeepSeek(model="deepseek-chat",base_url="https://api.deepseek.com",api_key="sk-***"),
        llm=ChatOpenAI(model="deepseek-chat",base_url="https://api.deepseek.com",api_key="sk-****"),
        use_vision=False
    )
    await agent.run()

asyncio.run(main())

在这里插入图片描述
运行结果
在这里插入图片描述

测试中文
需要更改系统prompt, extend_system_message版本还没更新肯呢个需要先设置https://github.com/browser-use/browser-use/blob/main/browser_use/agent/system_prompt.md
在这里插入图片描述

在这里插入图片描述

测试百度搜索引擎
task直接这里提示用baidu.com即可

from langchain_openai import ChatOpenAI
from langchain_deepseek import ChatDeepSeek

from browser_use import Agent
import asyncio
from dotenv import load_dotenv
load_dotenv()

async def main():
    agent = Agent(
        task="用baidu.com查询,介绍下智能体的MCP协议",
  
        llm=ChatOpenAI(model="deepseek-chat",base_url="https://api.deepseek.com",api_key="sk-8888"),
        use_vision=False,
        # extend_system_message="请全部使用中文回答。"
    )
    await agent.run()

asyncio.run(main())

在这里插入图片描述>在这里插入图片描述