当 AI Agent 开始承担越来越复杂的任务时,如何让它们安全、稳定地操作真实世界的应用,成为一个关键难题。OpenCLI 给出了一种极具想象力的解法:将任何网站、Electron 桌面应用、本地 CLI 工具,全部转化为 AI 可调用的命令行接口

它无需 API Key,复用你已登录的 Chrome 会话,甚至能让 AI 自己控制自己。开源仅数日便收获数千 Star,正在重塑人机交互的边界。

一、项目核心亮点

OpenCLI 不仅是一个“网站转 CLI”的工具,更是一个 全能 CLI 枢纽。它的核心亮点可以概括为以下四点:

  1. CLI All Electron

  • 最强大的更新:支持将所有 Electron 应用(如 Antigravity Ultra)CLI 化,让 AI 可以直接控制桌面应用,实现“AI 控制自己”的闭环。

  1. 零风控,复用登录态

  • 通过 Chrome 扩展直接复用现有浏览器的登录状态,无需存储任何账号密码或 API 凭证,既安全又避免了平台限流。

  1. 外部 CLI 枢纽

  • 统一发现、自动安装、透传执行 gh、docker、kubectl 等本地命令行工具,成为所有 CLI 的统一入口,告别工具散落与路径混乱。

  1. AI 原生开发工作流

  • 内置 explore、synthesize、generate、cascade 等命令,可自动探测网站 API、生成适配器、降级认证策略,让 AI 自主扩展能力。

二、技术架构与设计理念

OpenCLI 的设计围绕“低门槛、高扩展、AI 友好”展开,底层基于以下关键技术:

  • Playwright + Chrome 扩展桥接

通过轻量级 Browser Bridge 扩展与后台 daemon 通信,实现与浏览器的深度集成,稳定、高效。

  • MCP 协议支持

支持 Model Context Protocol,可无缝集成到 Claude Code 等 AI 工具链中,为 AI 提供标准化的操作接口。

  • 自修复配置

opencli doctor 可自动诊断扩展、daemon 与浏览器的连接状态,并尝试修复,大幅降低配置门槛。

  • 多格式输出

支持 table、json、yaml、md、csv 等输出格式,便于人类阅读与 AI 解析,适配不同使用场景。

三、内置命令覆盖范围

OpenCLI 已内置 50+ 站点与工具的适配器,覆盖以下主要类别:

类别

代表平台

国内主流

B站、知乎、小红书、微博、微信、BOSS直聘、携程、即刻、豆瓣

国际平台

Twitter/X、Reddit、YouTube、Instagram、TikTok、Facebook、LinkedIn、Medium

开发者工具

GitHub CLI (gh)、Docker、Kubectl、HackerNews、Stack Overflow、arXiv

桌面应用

Cursor、Codex、Antigravity、ChatGPT、ChatWise、Notion、Discord、豆包

金融资讯

Bloomberg、Reuters、Yahoo Finance、雪球、新浪财经

完整列表可通过 opencli list 实时查看,并支持动态添加自定义适配器。

四、外部 CLI 枢纽:统一入口,智能代理

OpenCLI 可作为所有本地命令行工具的智能代理,实现统一调用与自动管理:

# 透传执行,自动安装缺失工具
opencli gh pr list --limit 5
opencli docker ps
opencli kubectl get pods
opencli obsidian search query="AI"

如果系统中缺少对应的二进制文件,OpenCLI 会尝试通过系统包管理器自动安装,并重试命令,真正做到“开箱即用”。

五、桌面应用适配器:AI 控制一切

OpenCLI 对 Electron 应用的支持尤为强大。以 Antigravity 为例:

# 查看应用状态
opencli antigravity status

# 发送消息到当前会话
opencli antigravity send "请帮我写一个 Python 脚本"

# 读取最近对话内容
opencli antigravity read --last 10

每个桌面应用均有详细文档(位于项目目录 docs/adapters/desktop/),支持状态查询、消息发送、内容读取、代码提取、截图等丰富操作,真正实现“AI 操作桌面应用”。

六、强大的下载支持

OpenCLI 内置了多平台内容下载能力,无需额外配置:

项目示例

# 下载小红书笔记中的图片/视频
opencli xiaohongshu download abc123 --output ./xhs

# 下载B站视频(需要 yt-dlp)
opencli bilibili download BV1xxx --output ./bilibili
opencli bilibili download BV1xxx --quality 1080p  # 指定画质

# 下载 Twitter 用户的媒体
opencli twitter download elonmusk --limit 20 --output ./twitter

# 下载单条推文的媒体
opencli twitter download --tweet-url "https://x.com/user/status/123" --output ./twitter

# 导出知乎文章为 Markdown
opencli zhihu download --url "https://zhuanlan.zhihu.com/p/xxx" --output ./zhihu

# 导出并下载图片
opencli zhihu download --url "https://zhuanlan.zhihu.com/p/xxx" --download-images

# 导出微信公众号文章为 Markdown
opencli weixin download --url "https://mp.weixin.qq.com/s/xxx" --output ./weixin

七、AI 原生开发工作流:自动生成新适配器

OpenCLI 最独特的能力之一,是允许 AI 自主扩展自身的功能边界。如果你想为某个网站快速创建 CLI 适配器,无需手写代码:

项目示例

# 1. Deep Explore — 网络拦截 → 响应分析 → 能力推理 → 框架检测
opencli explore https://example.com --site mysite

# 2. Synthesize — 从探索成果物生成 evaluate-based YAML 适配器
opencli synthesize mysite

# 3. Generate — 一键完成:探索 → 合成 → 注册
opencli generate https://example.com --goal "hot"

# 4. Strategy Cascade — 自动降级探测:PUBLIC → COOKIE → HEADER
opencli cascade https://api.example.com/data

探索结果会输出到 .opencli/explore/<site>/,供进一步分析与定制。这套工作流让 AI 能够自主“学习”新平台的接口,真正实现自我进化。

八、代码示例

前置要求:

安装与基础使用
# 1.全局安装
npm install -g @jackwener/opencli

# 2.安装 Chrome 扩展(从 Releases 下载或加载源码)
# 打开 chrome://extensions,启用开发者模式,加载扩展

# 3.验证安装与连通性
opencli doctor # 自动诊断扩展与 daemon 状态

# 4.查看所有可用命令
opencli list -f table

# 5.使用示例:获取 B 站热门视频
opencli bilibili hot --limit 5 -f json | jq ".[].title"

# 6.使用示例:获取知乎热门问题(复用登录态)
opencli zhihu hot -f yaml

# 7.使用示例:注册自定义本地 CLI
opencli register mycli
常见问题排查
  1. “Extension not connected” 报错

  • 请确认 Chrome 已安装并启用 OpenCLI Browser Bridge 扩展,可在 chrome://extensions 中检查。

  1. “attach failed” 报错

  • 某些扩展(如新标签页替换、AI 助手类)可能与 OpenCLI 冲突,可尝试暂时禁用其他扩展后重试。

  1. 返回空数据或 Unauthorized 报错

  • 说明 Chrome 中的登录态已过期,请重新登录目标网站。

实战操作

验证安装与连通性

获取 B 站热门视频

总结

OpenCLI 的出现,标志着“万物皆可 CLI”从理念走向了实用。它不仅将数百个网站与桌面应用纳入命令行生态,更通过 AI 原生工作流,让大型语言模型能够自主探索、适配并操作任何 Web 或桌面环境。

  • 对开发者而言,它是一个强大的效率工具,可以在终端中完成原本需要频繁切换浏览器的操作;

  • 对 AI Agent 开发者而言,它提供了一套标准化的接入框架,让 AI 能够安全、可控地执行真实世界任务;

  • 对普通用户而言,它展示了未来人机交互的另一种可能—— 让 AI 替你操作一切,而你只需敲下命令

Github OpenCLI 项目:https://github.com/jackwener/opencli/