WebBrain推出开源本地优先浏览器助手,实现页面阅读与任务自动化

12 阅读4分钟开源

背景概述

在生成式AI快速渗透日常工作流的当下,浏览器插件成为最直接的落地形态。多数插件依赖云端大模型,用户数据随请求外泄,隐私风险显著。WebBrain由Emre Sokullu团队开源发布,旨在提供本地优先安全可控的AI助手,帮助用户在浏览器侧栏完成信息抽取、摘要生成以及跨页面自动化任务。

关键特性

  • 双模式交互
    • Ask 模式(只读)通过内容脚本读取页面,不触发任何交互;
    • Act 模式基于 Chrome DevTools Protocol(CDP)发送可信输入事件,实现点击、输入、滚动等操作,Firefox 通过 sidebar_action 提供相对弱化的 Act 能力。
  • 本地模型兼容:支持 llama.cpp、Ollama、LM Studio、vLLM、SGLang 等本地推理后端,推荐模型为 Qwen 3.6 35B,在 RTX 4090‑INT4 量化下即可流畅运行。
  • 多语言界面:插件内置英文、中文、法文、西班牙文、土耳其文等五种语言,首次启动自动匹配浏览器语言。
  • 安全防护:默认以 Ask 模式启动,任何可能导致页面状态改变的操作均需用户确认;对突变类行为(提交、购买等)强制走可视化 UI,杜绝直接调用 REST/GraphQL 接口。
  • 成本控制:截图在离开本机前会压缩 JPEG,降低视觉 token 消耗;对话历史采用 FIFO 策略,防止上下文窗口膨胀。

使用场景

  1. 数据抽取:打开商品列表页,指令“提取所有商品名称和价格”,插件返回结构化表格,支持 PDF 文档读取。
  2. 文献总结:在学术页面使用 Ask 模式让模型生成摘要,随后可继续提问细节,插件会自动跳过付费墙并关闭 cookie 横幅。
  3. 表单填充:在注册页面开启 Act 模式,插件可自动填入本地保存的简历信息,提升重复性任务效率。
  4. 多步导航:指令“前往 github.com 并列出 trending 仓库”,插件在 Act 模式下完成页面跳转、内容抓取、结果展示。

部署与费用

  • 完全免费:MIT 许可证下的源码托管于 GitHub,用户可自行编译或直接安装。
  • WebBrain Cloud:提供托管版,每台设备每月 $5,适用于不愿自行部署的用户,仍遵循公平使用政策。
  • 本地部署示例(llama.cpp):
    llama-server -m your-model.gguf -c 16384 --port 8080
    
    在插件设置中填写 http://localhost:8080/v1 即可对接。

市场定位与竞争

WebBrain 位于浏览器插件与完整代理框架之间。相较于仅提供文本交互的 Claude 插件,它支持本地模型,数据不出本机;相较于 OpenClaw 等开发者 SDK,它面向终端用户,直接在侧栏提供可视化对话。此种折中让隐私敏感的企业和个人用户拥有更高的可控性,同时保留了云模型的强大能力。

“安全第一、可本地化、开源免费”是 WebBrain 设计的核心原则,未来团队计划加入插件市场评分系统与社区插件生态,进一步提升可扩展性。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。