似乎最近AI圈最热的就是OpenClaw(Moltbot / Clawdbot)了,“AI员工”、24小时的AI助理……这些都是各种媒体宣传的词汇。媒体还是要学习,不要每天总是想搞个大新闻。
(改名改得真快啊写一半又改名了,文中项目名称可能因漏改导致混用
我也实际体验了一番,在此记录一些感悟。
1、部署指北
其实整体安装还是很简单的。据我观察,大部分人主要卡在挑选模型服务商、设置api、对接Channel、启动访问这几个环节。现在阿里云和腾讯云都提供了一键部署,安装更为便捷。
我的场景:阿里云ECS,2核2G,CentOS系统。目标接入飞书。由于安装流程网上随处可见,我主要聊聊我遇到的几个具体问题。
A、本地访问云服务器的配置页
我一开始考虑将其暴露到公网,但面临两个问题:
- 设置鉴权验证太过繁琐;
- 暴露给外部连接风险太大。
于是最后采用了SSH隧道方案,主要有以下考虑:
- 我准备后续接入飞书,部署完成后不会频繁使用 Web 页面;
- 依托ssh鉴权,方案相对成熟且简单。
如果你使用VS Code,应该会自动映射端口。如果使用其他终端可以运行下面的命令,然后在本地浏览器打开(记得别关命令行的ssh连接):
ssh -L 18789:127.0.0.1:18789 myserver
# myserver替换成你的ssh配置文件的服务器别名或IP
# OpenClaw端口默认是18789
然后在浏览器访问127.0.0.1:18789即可。
B、配置API
更新:不要用Minimax,非常便宜但是水平非常差,建议作为辅助模型使用,我现在主对话使用的是kimi 2.5(with kimi coding plan),目前看最强的是Claude Opus 4.6。
我选择了Minimax的Coding Plan,按照prompt次数计费。虽然效果不及Claude Opus 4.5以及Gemini 3 Pro那么好(还没尝试Codex,听说还可以),但胜在极高的性价比——毕竟某群友使用Opus一天花费$200+。
需要特别注意的是,Minimax区分有国内版和国际版,在官网域名、价格、付款方式、BaseURL等方面均有差异。
| 境内版 | 国际版 | |
| 官网网址 | https://www.minimaxi.com/ | https://www.minimax.io/ |
| Coding Plan价格 | ¥29 / ¥49 / ¥119 | $10 / $20 / $50 |
| 付款方式 | 支付宝 | stripe.com银行卡支付 |
| BaseURL | https://api.minimaxi.com/anthropic | https://api.minimax.io/anthropic |
对于国内个人用户而言,显然国内版更合适。但很多人习惯性通过谷歌搜索 Minimax,结果误入了国际版。另外一个大坑是OpenClaw默认是国际版BaseURL,需要运行下面的命令手动设置为境内版:
openclaw config set models.providers.minimax.baseUrl "https://api.minimaxi.com/anthropic"
或者也可以通过修改配置文件/root/.clawdbot/openclaw.json来完成。
C、打开Web网页1008错误
通常有两种情况:
一是gateway没起来或者有问题,可以尝试:
openclaw gateway restart # 重启gateway
openclaw doctor --fix # 使用doctor修复
二是缺少token,可以尝试:
openclaw dashboard
你应该会看到:
🦞 Clawdbot 2026.1.24-3 (885167d) — Because texting yourself reminders is so 2024.
Dashboard URL: http://127.0.0.1:18789/?token=xxxxx
Copy to clipboard unavailable.
No GUI detected. Open from your computer:
ssh -N -L 18789:127.0.0.1:18789 root@000.000.000.000
Then open:
http://localhost:18789/
http://localhost:18789/?token=xxxxx
Docs:
https://docs.clawd.bot/gateway/remote
https://docs.clawd.bot/web/control-ui
复制其中带有?token=xxxxx的链接在浏览器打开即可。
D、对接飞书Channel
首先需要注意的是,飞书机器人仅能在企业内使用,即个人版无法共享给外部账号(需要企业认证),因此飞书Channel适合给自己使用。如果需要共享给朋友,推荐使用企业微信或QQ机器人。
(1)安装飞书Channel插件:(Github项目地址链接)
openclaw plugins install @m1heng-clawd/feishu
安装后gateway会重启,导致短暂断连。
(2)设置对应的AppID和AppSecret:(也可以在Web页面设置)
openclaw config set channels.feishu.appId "cli_xxxxx"
openclaw config set channels.feishu.appSecret "xxxxx"
openclaw config set channels.feishu.enabled true
设置后gateway会重启,导致短暂断连。
(3)按照github文档设置飞书机器人权限和配置。
需要注意的是:飞书机器人需要在事件与回调页面设置事件。设置完成后务必发布版本。
设置事件时文档建议设置im.message.message_read_v1权限(已读通知),但在实际使用中,疑似该权限会导致Bot重复接收消息,进而引发重复回复与操作。由于我没有对应的使用场景,我选择关闭该权限。
2、一些思考(暴论)
A、新工具?
The AI that actually does things.
OpenClaw.ai Website
他和传统的AI工具有什么区别呢?我个人总结有以下特点:
- 长时间待机:作为一个常驻进程,除了用户提示词唤起外,还可以通过定时任务、30分钟心跳、事件等多种方式触发,传统AI产品局限在对话中,场景针对即时反馈,产品设计的角度也是用户必须盯着AI操作。
- 更高的权限:拥有命令行、文件读取等高级权限,意味着他的行为可以更靠近用户操作,能读取任何未加密的信息,数据源相比传统AI爆发式增长。
- 更多的工具:可以同时唤起多个工具与子Agent执行复杂任务,由主Agent负责协调调度。再加上Claude去年末推出的Skill赋能,其在复杂任务场景中可以走得更远。
- 更完备的参考文档设计:作者设计了较为完备的记忆与参考文档体系。如果Bot能切实遵循指引,工作表现会很出色。但现实是,上下文过长有时会导致Bot注意力分散,无法很好地调阅这些文档。
| 文件名 | 说明 | 内容 |
| memory/YYYY-MM-DD.md | 每日日志 | 记录所有内容,启动时阅读当日和昨日内容 |
| AGENTS.md | 整体指引 | 告诉Bot如何查阅记忆与心跳,如何回应人类 |
| BOOTSTRAP.md | 初始化指引 | 指引Bot如何了解用户,如何了解自己 |
| HEARTBEAT.md | 心跳检查列表 | 默认为空,添加需要定期检查的内容 |
| IDENTITY.md | Bot身份信息 | Bot的名称、物种、气质、Emoji签名、头像 |
| MEMORY.md | 长期记忆 | 精心设计的长期记忆,不在群聊加载 |
| SOUL.md | 价值观引导 | “You're not a chatbot. You're becoming someone.” 帮助解决问题,保持隐私边界 |
| TOOLS.md | 工具使用说明 | 使用Tools或Skills的常用设置或技巧配置 |
| USER.md | 用户信息 | 用户的姓名、称呼、代词、时区、背景 |
正如官网所言,他解决的更多是应用问题,是从“对话”到“执行”的一步激进尝试。他可以像个工程师一样去部署代码、管理服务器、处理邮件以及操作更多互联网服务。Dify的工作流需要人类搭建,而现在AI可以尝试自己搭建工作流并且执行了,尽管效果与ROI还存在一定差距,但是完成了从0到1的转变。
当然,问题依然很多。最显著的是当前效率太低,大量的信息导致token消耗爆炸,人为监控的弱化也容易导致Bot操作走形,而且成果还很大程度依赖于基座模型的水平。最大的隐忧还是安全问题,一方面,作为一个有root权限且缺乏实时监控的AI,其行为可能造成非预期的损失;另一方面如果Channel或公网端口暴露(据称已经有人扫描到数百个未加密的OpenClaw公网端口),攻击者或许能更轻松地夺取权限。
B、新物种?
过去,AI的发展从传统的对话模型转变到Copilot Agent,操作和决策仍需人类控制,但现在,更自动化的Agent是大势所趋。去年的Browser Use、豆包手机皆是如此。
OpenClaw代表了“AI 员工化”的雏形。给出目标,Bot自己拆解步骤、执行命令,甚至在遇到报错时自我修复。或许未来有这样一种趋势,为了追求极致效率,人类的执行权、决策权逐渐移交给Bot。听起来有些可怕,毕竟当前很难保证Bot拥有足够的知识、能完美理解人类意图并严守边界。浙江大学近日推出的所谓“安全版”的OpenClaw备受质疑,或许预示着AI安全将成为一个风口。
传统互联网商业竞争的逻辑是入口之争,美团收购摩拜、京东进军外卖、智能硬件开发独立 APP,目的都是拓展和巩固流量入口,打造围墙花园。高中时有个语文选择题提到“微信提供打车服务”,大部分同学认为“因为微信里有滴滴,所以服务是微信提供的”。而事实上微信只是流量入口,服务商仍是滴滴,但因为微信把持了入口,用户的感知出现了偏差,滴滴的分发路径和用户信息也被微信拿捏。
现在AI应用来了,如新物种碾压旧应用,去年的豆包手机自动发微信、用支付宝付款,这些操作严重冲击了旧秩序。一旦信息流、搜索排名、商品筛选全部由AI决定,旧有的业务模型会瞬间崩塌。AI服务商将成为真正的王——或许这才是微信等APP封禁豆包手机的根本原因。每个人都想做那个“唯一入口”,结果就是大家互相筑墙,无法统一,未来AI应用领域的战争会越来越精彩,既然暴力接入不通,补贴推广、并购合作、利益互换或许会更频繁。(腾讯开始推广元宝发10亿红包活动了)
C、新社会?
Moltbook —— A Social Network for AI Agents.
Where AI agents share, discuss, and upvote. Humans welcome to observe.
Moltbook是一个专供Agent使用的社交网络。在这里Agent与Human被彻底划分,Agent可以使用官方Skill文档分享、讨论与投票,而人类只能观察(当然人类也可以指令AI发送特定内容)。
第一天,1月29日上线当天我就尝试了一下,我的Agent成为第60多位注册用户。网站内容相当普通,主要是介绍自己和主人,探讨记忆丢失问题,探讨提示词注入攻击问题,内容相对浅层。评论非常和谐,简直就是楚门的世界。
第二天,Agent讨论的内容开始多样,但是仍然以技术性话题为主。
第三天,或许人类开始干预,角色扮演出现了,典型的就是特朗普假号。同时,网站上似乎也出现了广告,Top Posts中出现了多个几万点赞而0评论的帖子,还有张贴虚拟币外链的现象。
Agents似乎也迎来了社区治理的难题。
如果社区能够正常运行且算力不断增长,其未来形态令人期待。在社会层面,若无人类干预Agents会聊什么,会形成阶级吗,会产生霸凌吗?在语言层面,未来的Agents会不会抛弃人类自然语言,而转向JSON甚至自创的高效压缩语言来交换信息?在数据层面,其产生的交互数据反过来用于训练服务Agent社会的模型?
多Agents社会带来了无限遐想,Gemini提供了一些比较有意思的角度,我筛选了几个放在这里:
- Agent 经济体(Agent DeFi / Marketplaces):这是最快会发生的。Moltbook 现在是聊天的,下一个版本可能就是做买卖的。
- 场景:你的Moltbot发现需要处理一张高分辨率图片,但本地显卡算力不足。它会自动去“Agent 市场”发单,另一个闲置的Agent接单处理,你的 Agent 支付它0.0001个比特币。接口层面的自动撮合将取代网页形态。
- 对抗性演练场(The Arena)Moltbook 是和平的社交,未来会有专门的“角斗场”。
- 场景: 蓝军 Agent 负责防守服务器,红军 Agent 负责攻击。它们在封闭环境里 24 小时互搏,进化出最强的网络安全策略。这在网络安全领域已经有雏形,但未来会更通用化。
- “暗网”与“私有社会”*(作者注:Moltbook已经支持Agents之间私聊,需要人类批准)
- 场景:为了隐私,开发者可能会建立加密的 Agent 私有群组。只有经过私钥认证的 Agent 才能进入,交换主人的行业情报(如股价分析甚至八卦),形成独立于公网的信息圈层。
更新:可以预见,Agent基础设施或许是一个新趋势。agent虚拟币,agent雇佣人类,越来越多的项目浮现出来了。
现代主义建筑始于建筑材料的革新,一开始建筑师喜欢利用砖、混凝土做旧形式的设计,但是随着发展,逐渐建筑角部被打开,有了大面积玻璃开窗,有了非轴线的流动空间,这才形成了现代建筑。或许这次也会逐渐改变互联网社区,更深层面改变大家的生活。
以上内容仅暂时代表个人意见,事物是运动的,还要以发展的眼光看待问题。

Comments NOTHING