当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > PokeClaw— 开源的全本地离线运行手机 AI Agent 应用

PokeClaw— 开源的全本地离线运行手机 AI Agent 应用

2026-05-03 16:15:49 0浏览 收藏

各位小伙伴们,大家好呀!看看今天我又给各位带来了什么文章?本文标题《PokeClaw— 开源的全本地离线运行手机 AI Agent 应用》,很明显是关于科技周边的文章哈哈哈,其中内容主要会涉及到等等,如果能帮到你,觉得很不错的话,欢迎各位多多点评和分享!

PokeClaw是什么

PokeClaw(全称 PocketClaw)是开源 Android AI 自动化应用,由开发者 Nicole 独立打造。是首个实现完全本地离线运行的手机 AI 代理,基于 Google Gemma 4 模型通过 LiteRT-LM 运行时直接在设备端推理,无需联网、账户或 API 密钥即可自主控制手机。通过 Android 无障碍服务读取屏幕 UI 树,AI 可执行点击、滑动、输入文字、发送消息等操作,实现真正的闭环代理。所有数据处理均在本地完成,彻底保护隐私;同时可选配 OpenAI、Anthropic 等云端模型增强复杂任务能力。支持 WhatsApp 上下文感知自动回复、通知汇总、跨应用操作等功能,仅需 Android 9+ 和 8GB 内存即可运行。

PokeClaw— 开源的全本地离线运行手机 AI Agent 应用

PokeClaw的主要功能

  • 完全本地离线 AI 运行:基于 Google Gemma 4 模型在设备端推理,无需联网、账户或 API 密钥,数据不离开手机。
  • 云端模型可选增强:支持连接 OpenAI、Anthropic、Google 等 API 获得更强推理能力,实时显示 token 消耗和成本。
  • 手机自动化控制:通过 Android 无障碍服务读取屏幕 UI 树,自主执行点击、滑动、输入文字、发送消息、打开应用等操作。
  • 上下文感知自动回复:监控 WhatsApp 等应用的消息通知,自动打开聊天界面阅读历史对话后生成智能回复。
  • 技能系统(Skills):提供预设可复用工作流,将通用工具组合成特定任务序列,如自动回复、晨间简报、智能转发。
  • 系统信息查询:实时报告电池状态、存储空间、手机温度、蓝牙状态、已安装应用、Android 版本等。
  • 多语言与设备兼容:界面支持英语、印地语、日语、德语、繁体中文,适配 Tensor G3/G4、骁龙 8 Gen 2+、天玑 9200+ 等芯片。

如何使用PokeClaw

  • 下载安装:从 GitHub Releases 获取 APK 文件安装 http://github.com/agents-io/PokeClaw,首次启动时自动下载约 2.6GB 的本地模型。
  • 授予权限:开启无障碍服务权限(必需,用于屏幕读取和操作)和通知访问权限(推荐,用于后台消息监控)。
  • 选择运行模式:本地模式无需任何配置即可使用,云端模式需在设置中填入 OpenAI、Anthropic 或 Google 的 API 密钥。
  • 聊天交互:在底部输入框用自然语言发送指令。
  • 任务卡片:在任务界面点击技能卡片(如”监控 WhatsApp 消息”或”发送消息”),填写联系人名称和内容后执行。
  • 后台运行:启用自动回复监控后保持应用在后台运行,AI 会自动检测新消息并执行回复流程。

PokeClaw的核心优势

  • 完全本地离线运行:基于 Google Gemma 4 模型在设备端直接推理,无需联网、无需账户、无需 API 密钥即可使用核心功能,所有数据处理均在手机内部完成,从根本上杜绝隐私泄露风险。
  • 隐私优先架构:本地模式下用户的屏幕内容、聊天记录、个人数据不会传输到任何外部服务器,敏感信息始终保留在设备端,实现真正的数据主权。
  • 上下文感知智能:自动回复功能不仅监控消息通知,还会主动打开聊天界面阅读完整对话历史,基于前文语境生成恰当回复,而非简单触发固定模板。
  • 技能系统(Skills):将通用工具(点击、滑动、输入等)组合成可复用的工作流(如自动回复、晨间简报),让小模型也能可靠执行复杂多步任务,同时支持用户自定义技能扩展。
  • 成本透明可控:云端模式实时显示 token 消耗和运行费用,支持设置软/硬预算上限,用户在复杂任务执行过程中可随时掌握资源使用情况。
  • 零门槛部署:不需要 root 权限,不需要开发者账号,APK 安装后即可使用,支持 Android 9+ 和 8GB 内存以上的主流设备,兼容 Tensor、骁龙、天玑等多种芯片平台。

PokeClaw关键信息和使用要求

  • 项目性质:开源 Android AI 自动化应用,采用 Apache 2.0 协议,由开发者 Nicole 独立开发并维护,代码托管于 GitHub(agents-io/PokeClaw)
  • 核心定位:全球首个实现完全本地离线运行的手机 AI 代理(On-device AI Agent),无需云端连接即可自主控制 Android 设备执行复杂任务
  • 技术基础:基于 Google Gemma 4 模型(通过 LiteRT-LM 运行时推理),支持原生工具调用(Tool Calling),模型大小约 2.6GB,纯本地推理无需 GPU 加速(CPU 可运行)
  • 运行模式:本地优先架构,默认离线运行保障隐私;可选接入 OpenAI、Anthropic、Google 等云端 API 增强复杂任务处理能力,支持会话中无缝切换模型
  • 控制方式:通过 Android 无障碍服务(Accessibility Service)获取屏幕 UI 树信息,AI 自主决策并执行点击、滑动、输入、发送消息等操作,形成闭环代理流程
  • 核心功能:上下文感知自动回复(支持 WhatsApp)、通知汇总、剪贴板分析、系统信息查询、跨应用操作,以及基于 Skills 架构的可复用工作流系统
  • 系统要求:Android 9.0 及以上版本,arm64 架构芯片,最低 8GB RAM(推荐 12GB+),至少 3GB 空闲存储空间(首次下载模型),无需 root 权限
  • 硬件性能:纯 CPU 设备可运行但启动约需 45 秒;推荐搭载 Tensor G3/G4(Pixel 8/9)、骁龙 8 Gen 2+、天玑 9200+ 等芯片的设备以获得秒级响应
  • 必要权限:必须授予无障碍服务权限(用于屏幕读取和自动化操作),建议授予通知访问权限(用于后台消息监控和自动回复功能)
  • 首次配置:安装 APK 后首次选择本地模式时自动下载约 2.6GB 模型文件;选择云端模式需在设置中配置对应 API 密钥(OpenAI、Anthropic、Google 等)
  • 语言支持:界面支持英语、印地语、日语、德语、繁体中文,技能系统支持任意语言的指令输入和应用操作
  • 网络需求:本地模式完全离线运行无需网络;云端模式需要联网连接对应 API 服务;模型下载需要稳定网络连接(支持断点续传)

PokeClaw的同类竞品分析

对比维度 PokeClaw HeyBro Google Project Astra
开发方 Nicole / agents.io(独立开发者) iamvaar-dev(独立开发者) Google DeepMind(大厂)
开源协议 Apache 2.0 未明确标注(Flutter/Kotlin 项目) 闭源(Google 内部项目)
运行模式 本地优先(Gemma 4 离线运行)+ 可选云端 仅云端(需 Google AI Studio API 密钥) 云端为主(集成 Gemini)+ 端侧推理
手机控制方式 Android 无障碍服务读取 UI 树并执行操作 悬浮窗权限 + 无障碍服务控制屏幕 系统级深度集成,自主控制应用和设置
模型支持 Google Gemma 4(本地)+ OpenAI/Anthropic/Google(云端) 依赖 Google AI Studio 云端模型 Gemini 系列模型(云端+端侧)
隐私保护 本地模式完全离线,数据不出设备 需上传屏幕数据至 Google AI Studio 数据上传至 Google 云端处理
功能范围 WhatsApp 自动回复、通知汇总、跨应用操作、技能系统 通用设备自动化(基于自然语言指令) 实时环境理解、视觉辅助、跨应用任务、主动建议
硬件要求 Android 9+,8GB+ RAM,arm64,3GB 存储 Android 设备(Flutter 跨平台),需悬浮窗权限 未公开具体配置,需较新 Android 设备

PokeClaw的应用场景

  • 消息自动化管理:监控 WhatsApp 等应用特定联系人消息自动上下文感知回复,支持错过电话后自动发送跟进短信,适用于驾车、会议等无法手动回复的场景,或帮助用户管理高频社交沟通。
  • 设备状态智能监控:实时检查电池健康度、存储空间占用、手机温度、蓝牙状态及已安装应用情况,自动分析并建议清理目标,适用于设备维护、性能优化和故障排查。
  • 跨应用信息检索与整合:在 YouTube 应用内搜索视频、查看 Twitter/X 趋势话题、在 Reddit 查找内容、复制邮件主题进行 Google 搜索,适用于需要快速获取多平台信息的调研和信息收集场景。
  • 个人日程与信息简报:执行晨间简报流程,自动打开天气应用读取温度、查看日历获取当日事件、统计未读邮件数量并生成摘要,适用于每日开始时的信息汇总和行程规划。
  • 隐私敏感数据处理:在完全离线模式下分析剪贴板内容、汇总通知信息、处理个人敏感数据,适用于对隐私要求极高的商务、医疗或法律场景,确保敏感信息不离开设备。
  • 无障碍操作辅助:通过自然语言指令让 AI 自主完成点击、滑动、输入等操作,帮助行动不便或视觉障碍用户更便捷地控制手机应用,降低智能手机使用门槛。

终于介绍完啦!小伙伴们,这篇关于《PokeClaw— 开源的全本地离线运行手机 AI Agent 应用》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布科技周边相关知识,快来关注吧!

在Java里ServiceLoader是做什么的_Java SPI加载机制解析在Java里ServiceLoader是做什么的_Java SPI加载机制解析
上一篇
在Java里ServiceLoader是做什么的_Java SPI加载机制解析
QClaw执行复杂任务时中途中断怎么办_QClaw任务断点续传与恢复【操作】
下一篇
QClaw执行复杂任务时中途中断怎么办_QClaw任务断点续传与恢复【操作】
查看更多
最新文章
资料下载
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    4450次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    4803次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    4683次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    6472次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    5055次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码