GitHub - kellyvv/PhoneClaw: PhoneClaw: On-device AI Agent for Phone powered by Gemma 4

本地运行的私人 iPhone AI Agent，不联网，不上传，完全离线。

核心能力 · 内置 Skill · 技术文章 · 快速开始 · Mac 远程 · 自定义 Skill · 常见问题 · 后续计划

演示视频

DemoNew.MOV

PhoneClaw 是一个运行在 iPhone 上的本地私人 Agent。内置 Gemma 4 和 MiniCPM-V 多个本地模型，在端侧完成推理和 Skill 调用，无需云端 API 或外部模型接入，不上传聊天内容。

核心能力

本地私人 Agent：在 iPhone 上完成推理和 Skill 调用，可用自然语言处理日历、提醒事项、通讯录、剪贴板、健康数据等本机任务。

Mac 远程推理：可选配对同一局域网内的 Mac，通过 PhoneClaw Gateway 使用 Mac 上的 Ollama、Codex CLI 或 Antigravity CLI 模型，让手机端保留原生体验，同时把重模型推理放到 Mac 上执行。

图片理解与 LIVE 视觉：拍照或从相册选图后直接提问，也可以在 LIVE 模式下开启摄像头，让模型实时理解当前画面。

个人数据分析：读取日程、健康数据、联系人、提醒事项等本机数据，生成摘要、忙闲分析和下一步建议。数据默认只在设备端处理。

实时信息获取：用户明确要求时，可联网搜索公开网页、读取网页正文，并把实时信息整理成可用回答。

语音交互：支持语音输入和 LIVE 实时对话，适合免打字的日常问答、记录和操作。

技术与体验特性

基于文件的 Skill 系统：每项能力对应一个 Markdown 文件（SKILL.md），新增或修改能力不需要重新编译 App。Skill 描述语言无关，任何人都可以直接编写和分发。

模型管理与断点续传：Gemma 主模型和 LIVE 语音模型支持手机端下载、取消、继续下载和失败重试，也可以在构建时打包进 App。

默认离线与隐私边界：推理和本机 Skill 调用默认在设备端完成；只有用户明确使用联网搜索、读取网页或配对 Mac 远程推理时才离开 iPhone。聊天内容、图片和个人数据不上传到 PhoneClaw 服务器；Mac 远程推理会把本轮请求发送到你配对的 Mac，后续是否访问外部服务取决于 Mac 端所选 provider。

移动端内存优化：内置模型切换、System Prompt 编辑、缓存清理和历史裁剪，针对 iPhone 本地推理的内存限制做了优化。

中英文双语体验：配置页可选择自动、中文或 English。切换语言会同步 UI、默认系统提示词、内置 Skill、工具结果和权限文案。

技术文章

内置 Skill 示例

日历：用自然语言创建日历事件，支持指定标题、时间、地点。

"明天下午两点，在高科技园区约了个会，帮我加到日历"

"我今天有哪些日程?"

"帮我分析一下这周忙不忙"

提醒事项：创建定时提醒，准时弹出系统通知，不会遗漏。

"提醒我今晚八点发给老板那份文件"

通讯录：查询、保存、更新或删除联系人，支持姓名、手机号、公司、邮箱、备注，按手机号自动去重。

"帮我存一下王总的电话 13812345678，字节跳动的"

"检查下联系人张晓霞的电话多少"

剪贴板：读写系统剪贴板，可作为多步任务的数据中转。

"把刚才那段文字复制到剪贴板"

翻译：任意语种互译，自动识别源语言。

"把刚才那段话翻译成日语"

健康数据：读取 HealthKit 步数、距离、卡路里、心率、睡眠、运动记录。用户授权后在本地处理，不上传。

"我今天走了多少步"

"昨晚睡了多久"

"本周步数怎么样"

"我的静息心率是多少"

联网搜索：用户明确要求时搜索公开网页或读取 URL，把实时信息整理成回答。

"联网搜索今天的 AI 新闻"

"读取这个网页并总结: https://example.com"

快速开始

推荐安装方式：TestFlight。安装后在「模型设置」下载模型，再按需开启 Skill 权限。

源码构建环境要求：macOS + Xcode 16，iOS 17+，CocoaPods，真机 + Apple ID

模型	适用场景
Gemma 4 E2B	轻量款，聊天 / 翻译 / 单轮查询，A16 及以上
Gemma 4 E4B	完整款，多轮工具对话 + 复杂 agent 能力，建议 iPhone 15 Pro 及以上
MiniCPM-V 4.6	多模态款，图片问答 / LIVE 摄像头实时识别，建议 A17 Pro 及以上

1. 克隆项目

git clone https://github.com/kellyvv/phoneclaw.git
cd phoneclaw

2. 安装依赖

pod install

3. 选择模型安装方式

方案 A（推荐）— 空壳安装，手机端下载

直接用 Xcode 把 App 安装到手机，打开后进入「模型设置」，在手机上直接下载 E2B 或 E4B。默认工程不会把 Models/ 里的文件打入包，安装包更小，安装更快。

方案 B — 打包 E2B 进 App

Gemma 4 现在用 LiteRT-LM 推理，模型是单个 .litertlm 文件（不再是 MLX 权重目录）。

先在电脑下载模型文件到 Models/（推荐用 Hugging Face CLI）：

brew install hf
mkdir -p ./Models
hf download litert-community/gemma-4-E2B-it-litert-lm gemma-4-E2B-it.litertlm --local-dir ./Models

在 Xcode 里把 Models/gemma-4-E2B-it.litertlm 拖进工程，确认它出现在 Build Phases > Copy Bundle Resources（作为单个文件加入，不是 folder reference）
修改 LLM/Models/PredefinedModels.swift 里的 allModels，只保留要分发的模型

E2B 约 2.4 GB，E4B 约 3.4 GB。国内用户可设 HF_ENDPOINT=https://hf-mirror.com 加速，或从 ModelScope 镜像下载同名文件。Models/ 已在 .gitignore 中忽略，不会提交到仓库。

方案 C — 同时打包 E2B + E4B

下载两个模型文件：

brew install hf
mkdir -p ./Models
hf download litert-community/gemma-4-E2B-it-litert-lm gemma-4-E2B-it.litertlm --local-dir ./Models
hf download litert-community/gemma-4-E4B-it-litert-lm gemma-4-E4B-it.litertlm --local-dir ./Models

然后把 gemma-4-E2B-it.litertlm 和 gemma-4-E4B-it.litertlm 两个文件都加入 Xcode 的 Copy Bundle Resources。

LIVE 模式（语音交互）额外模型

如果你需要使用 LIVE 模式的语音识别和语音合成，需要额外下载 ASR 和 TTS 模型：

# ASR — 中文流式语音识别 (zipformer, int8, ~160MB)
hf download csukuangfj/sherpa-onnx-streaming-zipformer-zh-int8-2025-06-30 \
  --local-dir ./Models/sherpa-asr-zh \
  --exclude "test_wavs/*" "*.md" ".gitattributes"

# TTS — 中文语音合成 (keqing, ~125MB)
hf download csukuangfj/vits-zh-hf-keqing \
  --local-dir ./Models/vits-zh-hf-keqing \
  --exclude "*.py" "*.sh" ".gitattributes"

下载后在 Xcode 中将 Models/sherpa-asr-zh 和 Models/vits-zh-hf-keqing 以 folder reference 方式添加到 Copy Bundle Resources。不下载也不影响编译和基础聊天功能，LIVE 模式会自动 fallback 到系统语音。

4. 打开工程

open PhoneClaw.xcworkspace

请始终打开 .xcworkspace，不要打开 .xcodeproj

5. 配置签名并运行

选择 PhoneClaw target → Signing & Capabilities
选择 Team，把 Bundle Identifier 改成你自己的唯一值
连接 iPhone，按 ⌘R

首次安装后如系统提示信任证书：设置 → 通用 → VPN 与设备管理 → 信任

6. 首次使用

右上角拼图：Skill 管理
右上角滑杆：模型设置 / 系统提示词 / 权限
空壳安装时，先在模型设置页下载模型，再开启权限，然后试试：

提醒我今晚八点发文件
帮我存一下王总的电话 13812345678
把刚才那段话翻译成英文

7. 使用 Mac 客户端远程推理

Mac 客户端用于把同一局域网内的 Mac 作为 iPhone 的远程推理源。手机端仍然使用 PhoneClaw 的聊天界面和 Skill 系统，模型推理请求会发到你配对的 Mac。

方式 A：下载 release（推荐）

下载 PhoneClawGateway-macOS-v0.1.0.zip
解压后打开 PhoneClawGateway.app
首次打开时，macOS 会询问「本地网络」权限，请选择允许
如果 macOS 阻止首次启动，请在 Finder 里右键 PhoneClawGateway.app，选择「打开」

Gateway 默认监听 18080 端口，并通过 Bonjour 广播 _phoneclaw-llm._tcp 服务。

方式 B：从源码构建

cd PhoneClawGateway
bash build-app.sh
open PhoneClawGateway.app

从源码构建后同样需要允许 macOS 的「本地网络」权限。

配置 Mac 端运行源

打开 PhoneClawGateway.app
在主窗口里选择运行源：Ollama、Codex CLI 或 Antigravity CLI
如果使用 Ollama，先安装并启动 Ollama，再下载一个模型，例如：

ollama pull gemma3:4b

回到 Gateway 点扫描，确认模型出现在列表里

在 iPhone 上配对并使用

确保 iPhone 和 Mac 在同一个局域网
打开 PhoneClaw → 右上角滑杆 →「Mac 远程推理」
点局域网内的 Mac，在 Mac 客户端弹窗里点「允许」
配对成功后选择 Mac 上的模型，回到聊天页即可使用

远程模型会出现在模型选择器的「远程模型」分组里。若手机搜不到 Mac，优先检查：Mac 客户端是否正在运行、本地网络权限是否允许、两台设备是否在同一 Wi-Fi、系统防火墙是否允许 PhoneClawGateway.app 接收局域网连接。

自定义 Skill

新增一个 Skill 的最小成本方式，是在 Skills/Library/<skill-id>/ 下增加一个 SKILL.md，或者运行时写到应用沙盒：

Application Support/PhoneClaw/skills/<skill-id>/SKILL.md

---
name: MySkill
name-zh: 我的能力
description: 这个 Skill 的作用
version: "1.0.0"
icon: star
disabled: false
type: device          # device = 调系统 API; content = 纯 prompt 类; network = 访问公开互联网

triggers:
  - 关键词1

allowed-tools:
  - my-tool-name      # device 类必填; content 类可留空数组 []

examples:
  - query: "用户会怎么说"
    scenario: "什么场景会触发"
---

# Skill 指令

告诉模型何时调用工具、如何组织参数、何时直接回答。

type 字段决定 Skill 的执行模式：

device：模型先 emit <tool_call> 调用真实 iOS API；典型例子有 calendar / clipboard / contacts
content：模型直接根据 SKILL.md 指令处理用户输入并输出最终答案，不走任何 tool；典型例子是 translate
network：模型只在用户明确要求实时信息、联网搜索或读取网页时调用网络工具；典型例子是 web-search

如果这个 Skill 需要真正调用系统能力，再去 Tools/ToolRegistry.swift + Tools/Handlers/<Name>.swift 注册对应工具。框架会在启动时自动校验 allowed-tools 与 ToolRegistry 是否同步，写错的 tool 名会立刻在控制台暴露。

常见问题

为什么安装后看不到权限弹窗？通常是因为对应 Skill 还没有真正执行到系统 API。如果之前已经拒绝过一次，iOS 也不会反复弹框，需要到系统设置里手动开启。

为什么切模型后加载失败？先确认：模型文件名和 LLM/Models/PredefinedModels.swift 里的 allModels 一致；如果你走的是空壳安装，模型已经在手机端下载完成；如果你走的是内置分发，该模型确实被打进了 App 包；设备内存足够。

为什么提醒事项创建失败？最新代码会先尝试复用现有提醒列表；如果系统里没有可写列表，会再尝试自动创建一个 PhoneClaw 提醒列表。如果这一步仍失败，通常是系统提醒源本身不可写。

为什么 iPhone 搜不到 Mac 客户端？先确认 PhoneClawGateway.app 正在运行，并且 macOS 已允许本地网络权限；iPhone 和 Mac 需要在同一个局域网。若仍搜不到，检查 macOS 防火墙是否允许该 App 接收连接，或者重新运行 bash PhoneClawGateway/build-app.sh 后再打开生成的 App。

后续计划

PhoneClaw 接下来的方向，不只是"多加几个工具"，而是把它逐步做成一个真正可用的本地 iPhone Agent。

1. 扩展更多 iOS 原生 API

2. 扩展更多 Skill

后续会继续把能力拆成更清晰的 Skill，而不是把所有逻辑都堆在一个大 Prompt 里。适合继续追加的方向：

3. 串联更多本地模型

除了主聊天模型之外，后续适合接入的本地模型：

这会让 PhoneClaw 从"一个大模型做所有事"，逐渐演进成"多个本地模型协同工作"的架构。

4. 跨 App 自动化

PhoneClaw 不会假设自己能像桌面系统那样任意操控所有 App，而是优先走 iOS 真正允许的能力：

更现实的目标是：在 App 之间传递内容、拉起指定 App 到指定页面、把多步操作压缩成一条自然语言命令。

5. 外部硬件与视觉扩展

LIVE 摄像头实时识别
外部视频输入
屏幕画面理解
外部硬件联动

探索把外部视频输入、屏幕画面理解和本地模型串起来，让 PhoneClaw 不只是"在手机里回答问题"，而是逐步具备更强的现实世界感知与调度能力。

参考链接

License

Apache 2.0

Name		Name	Last commit message	Last commit date
Latest commit History 449 Commits
.githooks		.githooks
Agent		Agent
App		App
Assets.xcassets		Assets.xcassets
AudioTest		AudioTest
Frameworks		Frameworks
LLM		LLM
Live		Live
LocalPackages/PhoneClawEngine		LocalPackages/PhoneClawEngine
Packages		Packages
PhoneClaw.xcodeproj		PhoneClaw.xcodeproj
PhoneClaw.xcworkspace		PhoneClaw.xcworkspace
PhoneClawGateway		PhoneClawGateway
Shared		Shared
Skills		Skills
Tests		Tests
Tools		Tools
UI		UI
assets		assets
doc		doc
docs		docs
ja.lproj		ja.lproj
scripts		scripts
zh-Hans.lproj		zh-Hans.lproj
.gitattributes		.gitattributes
.gitignore		.gitignore
Info.plist		Info.plist
LICENSE		LICENSE
PhoneClaw-Bridging-Header.h		PhoneClaw-Bridging-Header.h
PhoneClaw.entitlements		PhoneClaw.entitlements
Podfile		Podfile
Podfile.lock		Podfile.lock
PrivacyInfo.xcprivacy		PrivacyInfo.xcprivacy
README.md		README.md
README_EN.md		README_EN.md

Folders and files

Latest commit

History

Repository files navigation

演示视频

最新更新

2026-06-01

2026-05-17

2026-05-12

2026-05-07

2026-04-25

2026-04-23

2026-04-20

2026-04-18

2026-04-17

2026-04-10

2026-04-09

2026-04-08

2026-04-07

2026-04-06

核心能力

技术与体验特性

技术文章

内置 Skill 示例

快速开始

1. 克隆项目

2. 安装依赖

3. 选择模型安装方式

4. 打开工程

5. 配置签名并运行

6. 首次使用

7. 使用 Mac 客户端远程推理

自定义 Skill

常见问题

后续计划

1. 扩展更多 iOS 原生 API

2. 扩展更多 Skill

3. 串联更多本地模型

4. 跨 App 自动化

5. 外部硬件与视觉扩展

参考链接

License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 8

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages