AI Agent 操作系统:OpenFang 项目概览
近期个人助手类 Agent 层出不穷,除了 OpenClaw,还有 NanoBot 等一众"大虾",阿里也刚推出了 Copaw。今天无意间看到 OpenFang 这个项目,于是用 AI 快速调研了一把。
1. 背景
1.1. 项目基本信息
- 项目名称: OpenFang
- 定位: 生产级 Agent 操作系统(Agent Operating System)
- 开发公司: RightNow AI
- 创始人: Jaber Jaber(RightNow AI 创始人)
- 开源时间: 2026 年 2 月
- GitHub 仓库: https://github.com/RightNow-AI/openfang
- 官方网站: https://openfang.sh / https://openfang.cc
- 当前版本: v0.2.7(截至 2026 年 3 月)
- GitHub Stars: 8,600+
- 许可证: MIT + Apache-2.0 双许可证
1.2. 项目规模
- 代码规模: 137,728 行 Rust 代码
- 模块化: 14 个 Crate(Rust 模块化组织单位)
- 测试覆盖: 1,767+ 自动化测试用例
- 代码质量: 零 Clippy 警告(Rust 社区高质量标准)
- 二进制大小: ~32MB(单文件,零外部依赖)
1.3. 创始团队理念
创始人 Jaber 表示:
“我尝试过的每个 Agent 框架基本上都是聊天机器人的包装器。你输入内容,它回应,你再输入。这不是自主性,这是对话。我想要的 Agent 是能够按计划唤醒、完成工作并在无需我守候的情况下报告结果。”
这体现了 OpenFang 的核心设计理念:从被动响应到主动执行的范式转变。
2. 核心概念:Hands
2.1. 核心创新
Hands 是 OpenFang 的核心创新——预构建的自主能力包,能够独立运行、按计划执行,无需用户持续提示。每个 Hand 包含:
| 组件 | 说明 |
|---|---|
| HAND.toml | 声明工具、设置、需求和 Dashboard 指标的清单文件 |
| System Prompt | 多阶段操作手册(500+ 词的专家级流程) |
| SKILL.md | 运行时注入上下文的领域专业知识 |
| Guardrails | 敏感操作的审批门(如 Browser Hand 购买前需人工确认) |
2.2. 七大内置 Hands
| Hand 名称 | 功能描述 | 技术栈 |
|---|---|---|
| Clip | 视频处理:下载 YouTube 视频、识别精彩片段、剪辑竖屏短片、生成字幕和封面、发布到 Telegram/WhatsApp | FFmpeg + yt-dlp + 5 个 STT 后端 |
| Lead | 线索挖掘:每日发现匹配 ICP 的潜在客户、丰富信息、评分(0-100)、去重、输出 CSV/JSON/Markdown | 网络研究 + 数据库 |
| Collector | 情报监控:OSINT 级持续监控目标(公司/人物/话题)、变更检测、情感追踪、知识图谱构建、关键警报 | 多源数据聚合 |
| Predictor | 趋势预测:超级预测引擎、多源信号收集、校准推理链、带置信区间的预测、Brier 分数自追踪、逆向模式 | 统计建模 |
| Researcher | 深度研究:跨来源交叉验证、CRAAP 可信度评估、生成带 APA 格式的引用报告、多语言支持 | 学术标准研究 |
| 社媒管理:自主 Twitter/X 账号管理、7 种轮换格式内容创建、最佳互动时间排期、提及回复、性能指标追踪 | 社交媒体 API | |
| Browser | 网页自动化:网站导航、表单填写、按钮点击、多步骤工作流、Playwright 桥接、会话持久化、强制购买审批门 | Playwright |
2.3. 技术特性
2.3.1. 运行时性能
- 冷启动时间: < 200ms(对比 OpenClaw 的 ~6s)
- 空闲内存占用: ~40MB(对比 OpenClaw 的 394MB)
- 安装包大小: ~32MB(单二进制文件)
- 最低内存要求: ≥ 64MB(推荐 256MB)
2.3.2. 平台支持
- 操作系统: Linux / macOS / Windows / 树莓派 / VPS
- 架构: x86_64 或 ARM64
2.3.3. 渠道适配器(40 个)
支持目前所有 Agent 框架中最广泛的通讯渠道:
| 类别 | 平台 |
|---|---|
| 核心 | Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Email |
| 企业 | Microsoft Teams, Mattermost, Google Chat, Webex, 飞书/Lark, 钉钉, Zulip |
| 社交 | LINE, Viber, Facebook Messenger, Mastodon, Bluesky, Reddit, LinkedIn, Twitch |
| 社区 | IRC, XMPP, Guilded, Revolt, Keybase, Discourse, Gitter |
| 隐私 | Threema, Nostr, Mumble, Nextcloud Talk, Rocket.Chat, Ntfy, Gotify |
2.3.4. LLM 提供商支持(27 个,123+ 模型)
- 原生驱动: Anthropic, Google Gemini, OpenAI-compatible API
- 支持列表: Anthropic, Gemini, OpenAI, Groq, DeepSeek, OpenRouter, Together, Mistral, Fireworks, Cohere, Perplexity, xAI, AI21, Cerebras, SambaNova, HuggingFace, Replicate, Ollama, vLLM, LM Studio, Qwen, MiniMax, Zhipu, Moonshot, Qianfan, Bedrock 等
2.3.5. 安全系统(16 层纵深防御)
| 层级 | 安全系统 | 功能说明 |
|---|---|---|
| 1 | WASM 双计量沙箱 | 工具代码在 WebAssembly 中运行,燃料计量 + 周期中断,看门狗线程终止失控代码 |
| 2 | Merkle 哈希链审计追踪 | 每个操作加密链接到前一个,篡改一条记录会破坏整个链条 |
| 3 | 信息流污点追踪 | 标签通过执行传播,从源头到汇聚点追踪密钥 |
| 4 | Ed25519 签名代理清单 | 每个代理身份和能力集都经过加密签名 |
| 5 | SSRF 防护 | 阻止私有 IP、云元数据端点和 DNS 重绑定攻击 |
| 6 | 密钥零化 | Zeroizing |
| 7 | OFP 双向认证 | HMAC-SHA256 基于 nonce 的恒定时间验证,用于 P2P 网络 |
| 8 | 能力门 | 基于角色的访问控制——代理声明所需工具,内核强制执行 |
| 9 | 安全头 | CSP, X-Frame-Options, HSTS, X-Content-Type-Options |
| 10 | 健康端点脱敏 | 公共健康检查返回最少信息,完整诊断需要认证 |
| 11 | 子进程沙箱 | env_clear() + 选择性变量传递,进程树隔离,跨平台终止 |
| 12 | 提示注入扫描器 | 检测覆盖尝试、数据渗出模式和 shell 引用注入 |
| 13 | 循环守卫 | 基于 SHA256 的工具调用循环检测,带断路器,处理乒乓模式 |
| 14 | 会话修复 | 7 阶段消息历史验证,自动从损坏中恢复 |
| 15 | 路径遍历防护 | 规范化 + 符号链接逃逸防护,../ 无效 |
| 16 | GCRA 速率限制器 | 成本感知令牌桶速率限制,每 IP 追踪,过期清理 |
3. 技术架构
3.1. 为什么选择 Rust?
| 优势 | 说明 |
|---|---|
| 内存安全 | 编译时保证,无运行时空指针或数据竞争 |
| 并发性能 | 无 GIL 限制,真正的并行执行 |
| 运行效率 | 接近 C/C++ 的性能,适合长期运行的后台服务 |
| 类型安全 | 静态类型系统在大型系统中减少运行时错误 |
| 生态成熟 | 丰富的异步运行时(Tokio)和 Web 框架 |
对比 Python 框架(AutoGen, CrewAI, LangGraph)的解释执行开销和 GIL 并发限制,Rust 在 24/7 不间断运行的 Agent 系统中具有显著优势。
3.2. 核心 Crate 说明
| Crate | 功能 | 依赖 |
|---|---|---|
| openfang-kernel | 编排、工作流、计量、RBAC、调度器、预算追踪 | types, memory, runtime, skills, hands, extensions, wire, channels |
| openfang-runtime | Agent 循环、3 个 LLM 驱动、53 个工具、WASM 沙箱、MCP、A2A | types, memory |
| openfang-api | 140+ REST/WS/SSE 端点、OpenAI 兼容 API、Dashboard | kernel, runtime |
| openfang-channels | 40 个消息适配器、速率限制、DM/组策略 | types, runtime |
| openfang-memory | SQLite 持久化、向量嵌入、规范会话、压缩 | types |
| openfang-types | 核心类型、污点追踪、Ed25519 清单签名、模型目录 | - |
| openfang-skills | 60 个捆绑技能、SKILL.md 解析器、FangHub 市场 | types |
| openfang-hands | 7 个自主 Hands、HAND.toml 解析器、生命周期管理 | runtime, skills |
| openfang-extensions | 25 个 MCP 模板、AES-256-GCM 凭证库、OAuth2 PKCE | types |
| openfang-wire | OFP P2P 协议、HMAC-SHA256 双向认证 | types |
| openfang-cli | CLI、守护进程管理、TUI Dashboard、MCP 服务器模式 | kernel, api |
| openfang-desktop | Tauri 2.0 原生应用(系统托盘、通知、全局快捷键) | api |
| openfang-migrate | OpenClaw、LangChain、AutoGPT 迁移引擎 | kernel |
3.3. 系统架构
┌─────────────────────────────────────────────────────────────┐
│ OpenFang Agent OS │
├─────────────────────────────────────────────────────────────┤
│ 用户界面层: Desktop(Tauri) / CLI / Web Dashboard │
├─────────────────────────────────────────────────────────────┤
│ API 层: 140+ REST/WS/SSE 端点, OpenAI 兼容 API │
├─────────────────────────────────────────────────────────────┤
│ 内核层: Workflow Engine / Scheduler / Metering / RBAC │
├─────────────────────────────────────────────────────────────┤
│ 运行时层: Agent Loop / LLM Drivers / Tools / WASM Sandbox │
│ MCP Client/Server / A2A Protocol │
├─────────────────────────────────────────────────────────────┤
│ 能力层: 7 Hands (Clip/Lead/Collector/Predictor/ │
│ Researcher/Twitter/Browser) │
├─────────────────────────────────────────────────────────────┤
│ 记忆层: SQLite / Vector Embedding / Canonical Sessions │
├─────────────────────────────────────────────────────────────┤
│ 渠道层: 40 Channel Adapters (Telegram/Discord/飞书/钉钉...) │
├─────────────────────────────────────────────────────────────┤
│ 网络层: OFP P2P Protocol / HMAC-SHA256 双向认证 │
└─────────────────────────────────────────────────────────────┘关键设计模式:
模块化内核设计
- 14 个独立 Crate,通过 Cargo workspace 管理
- 清晰的依赖关系,避免循环依赖
- 每个 Crate 可独立测试和发布
异步优先
- 基于 Tokio 的异步运行时
- 所有 I/O 操作非阻塞
- 支持高并发 Agent 执行
安全内建
- 16 层安全系统独立运行
- 无单点故障
- 每个组件可独立测试
配置驱动
- TOML 配置文件(openfang.toml)
- Hands 通过 HAND.toml 声明
- 环境变量覆盖支持
4. 与 OpenClaw 的详细对比
4.1. 核心差异概览
| 特性 | OpenFang | OpenClaw |
|---|---|---|
| 开发语言 | Rust | TypeScript |
| 核心定位 | Agent 操作系统(内核级) | 个人 AI 助手(Gateway 为中心) |
| 内存占用 | ~40MB | ~394MB |
| 冷启动时间 | < 200ms | ~6s |
| 安装包大小 | ~32MB | ~500MB |
| 安全层数 | 16 层 | 3 层基础 |
| 自主调度 | 7 个内置 Hands | 无 |
| 渠道适配器 | 40 个 | 13 个 |
| LLM 提供商 | 27 个 | ~10 个 |
| Agent 沙箱 | WASM 双计量 | 无 |
| 审计追踪 | Merkle 哈希链 | 日志 |
| 桌面应用 | Tauri 2.0 | 无 |
| 存储方式 | SQLite + 向量嵌入 | 文件系统 |
| 适用场景 | 生产级 7×24 自主运行 | 个人使用和探索实验 |
4.2. 架构哲学对比
OpenClaw
- 设计目标: 个人 AI 助手,强调多渠道兼容和隐私可控
- 交互模式: 用户触发 → Agent 响应(被动式)
- 扩展方式: 通过 Skills 和插件扩展功能
- 部署方式: 单 Gateway 架构,支持自托管
OpenFang
- 设计目标: Agent 操作系统,强调生产级可靠性和自主运行
- 交互模式: 按计划自主唤醒 → 执行任务 → 报告结果(主动式)
- 扩展方式: 通过 Hands 预构建能力包,激活即用
- 部署方式: 单二进制文件,内核级调度
4.3. 性能对比
| 指标 | OpenFang | OpenClaw | ZeroClaw | LangGraph | CrewAI |
|---|---|---|---|---|---|
| 冷启动 | 180ms ★ | 5.98s | 10ms | 2.5s | 3.0s |
| 空闲内存 | 40MB ★ | 394MB | 5MB | 180MB | 200MB |
| 安装大小 | 32MB ★ | 500MB | 8.8MB | 150MB | 100MB |
| 安全层数 | 16 ★ | 3 | 6 | 2 | 1 |
| 渠道适配器 | 40 ★ | 13 | 15 | 0 | 0 |
4.4. 迁移支持
OpenFang 提供一键迁移命令:
# 迁移所有内容:代理、记忆、技能、配置
openfang migrate --from openclaw
# 从特定路径迁移
openfang migrate --from openclaw --path ~/.openclaw
# 先试运行查看变更
openfang migrate --from openclaw --dry-run5. 总结
OpenFang 的愿景是好的。我一直认为,个人助手类智能体就是下一代操作系统。OpenFang 给自己的定位也是 The Agent Operating System。从被动响应到主动执行,这个转变符合人们对"真正智能助手"的期待。
Hands 的设计算是在 Skills 上又包了一层。官方提供了 7 个内置 Hand,看起来覆盖了视频处理、线索挖掘、情报监控等常见场景。但实际效果还得跑起来才知道——能不能稳定跑 7×24,遇到异常情况怎么处理,这些文档里不会写得太细。
Rust 的执行效率确实高,40MB 内存对比 OpenClaw 的 394MB,差距摆在那儿。但生态这块不如 Python 也是事实。出了问题能不能快速找到解决方案,第三方库够不够丰富,这些都会影响长期使用的体验。
说到底,打铁还需自身硬。OpenFang 目前才 v0.2.7,在一众"龙虾"的包围中生存下来,获得用户认可,最终还是要靠产品实力。
参考链接:
- GitHub:https://github.com/RightNow-AI/openfang
- 官网:https://openfang.sh
- 中文官网:https://openfang.cc