OpenClaw推出iOS、Android伴随节点应用 为本地AI代理赋能摄像头与语音

2 阅读5分钟开源

背景与意义

OpenClaw 是一套开源的个人 AI 代理系统,核心采用 TypeScript 编写,运行于 Node.js 环境。此前,代理的所有计算与工具调用都必须在服务器或本机的 Gateway 上完成,缺乏直接接入手机硬件的能力。此次发布的 iOS 与 Android 伴随节点 App,填补了这一空白,使得本地 AI 代理能够实时利用手机的摄像头、位置、语音合成以及 Canvas 渲染等功能,进一步推动了 本地‑优先(local‑first) 的智能体生态。

Gateway‑Node 架构概览

  • Gateway:单一控制平面,负责会话管理、路由、渠道(WhatsApp、Telegram、Discord 等)以及工具调用。运行在 macOS、Linux 或 Windows(WSL2)上。
  • Node(手机):通过 WebSocket(默认端口 18789)向 Gateway 注册,角色标记为 node。所有硬件指令都通过 node.invoke 调用相应的命令族(camera.*device.*canvas.* 等)。
  • 配对安全:配对请求必须经 Gateway CLI 明确批准,支持一次性令牌和角色不可升级的约束,防止未经授权的设备提升权限。
  • 网络发现:局域网内使用 mDNS/Bonjour 自动发现;远程访问推荐 Tailscale + wss:// 加密通道。

移动应用功能对比

功能iOS 版Android 版
配对方式QR 码或手动输入QR 码或手动输入
聊天模式实时 Talk(ElevenLabs/TTS)实时 Talk(系统 TTS)
多媒体支持文本、链接、图片、视频文本、链接、图片、视频
硬件权限摄像头、屏幕捕获、定位、相册、日历、提醒摄像头、屏幕捕获、定位、相册、短信、运动传感器
Canvas支持 Live Canvas 渲染仪表盘支持 Live Canvas 渲染仪表盘
后台运行受限于前台授权前台服务保持连接

典型使用场景

  • 现场数据采集:在工地使用 iOS 摄像头拍照,自动附加 GPS 坐标并上传至代理进行分析。
  • 情境提醒:当手机进入预设地点时,代理触发提醒或执行后续任务。
  • 通知处理:Android 读取来电或消息通知,代理生成回复草稿并返回给用户。
  • 实时仪表盘:通过 Canvas 将监控数据推送至手机屏幕,形成交互式仪表盘。
  • 免手持对话:Talk Mode 在背后持续语音交互,适用于驾驶或厨房等双手不便的场景。

快速配对步骤(示例)

# 在 macOS/Linux/WSL2 上启动 Gateway
npm install -g openclaw@latest
openclaw onboard --install-daemon

# 在手机 App 中扫描 QR 码或手动输入 host:port
# 手机发送配对请求,随后在终端执行:
openclaw devices list
openclaw devices approve <device-id>
openclaw nodes status

配对成功后,手机即成为 Gateway 的外设节点,所有硬件调用均需在 gateway.nodes.allowCommands 中显式列出,默认的隐私敏感指令(如 camera.snapscreen.record)均被拒绝。

优势与局限

优势

  • 完全本地化,密钥、配置与数据不离开用户机器。
  • 单一 Gateway 可统一管理多渠道消息与多部手机节点。
  • 丰富的硬件接口让 AI 代理能够感知真实世界,打开“AI+IoT”新场景。

局限

  • 移动端必须依赖运行中的 Gateway,单独的手机无法离线使用。
  • 摄像头、屏幕捕获等功能需在前台授权,后台调用受限。
  • Android 版下载量仍然有限,生态成熟度有待提升。

展望

OpenClaw 的节点化设计为 私有化生成式 AI 提供了灵活的硬件扩展路径。随着更多社区插件与技能的加入,未来可以期待更复杂的现场自动化、跨设备协同以及在企业内部署的完整 AI 助手解决方案。开发者只需关注安全配置与权限把控,即可在自有数据安全边界内,充分发挥 AI 代理的潜能。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。