OpenClaw“龙虾”爆火!科技巨头抢搭AI执行层,ChatGPT与Claude“大脑”之争背后谁主沉浮?

张开发
2026/6/4 0:08:39 15 分钟阅读
OpenClaw“龙虾”爆火!科技巨头抢搭AI执行层,ChatGPT与Claude“大脑”之争背后谁主沉浮?
开源项目OpenClaw“龙虾”以惊人的速度风靡全球引发科技巨头如腾讯、字节跳动等纷纷推出变种产品催生“上门安装龙虾服务”现象。文章核心围绕OpenClaw的诞生及其“让AI动手”的定位展开分析其如何通过脚本与工具调用实现AI从“动嘴”到“动手”的突破。同时对比了ChatGPT与Claude两大AI平台的战略演进揭示OpenAI的“统一模型”路线与Anthropic的“分化”路线差异以及MCP协议、Skill机制等技术进展对AI生态演进的影响。文章指出AI的下一战场在于“执行层”掌握连接AI能力与真实世界的“最后一公里”至关重要未来将重塑互联网格局。帖子很长你可以跳着看有时间线后期可能微软要出了但不一定是叫claw025年末一个名为“OpenClaw”俗称“龙虾”的开源项目在GitHub上悄然诞生。短短4个月后这个项目斩获了超过25万颗星标成为全球增长最快的开源项目之一引发腾讯、字节跳动等中国科技巨头纷纷推出变种产品甚至催生了“上门安装龙虾服务”的社会现象。与此同时OpenAI和Anthropic克劳德母公司的模型 谷歌的gemini3系列 神仙打架国内的 一样。就再大加都再搞 模型数据的时候有人开始搞手。有人在做“脑”有人在建“手”。1.1 OpenClaw的诞生奥地利开发者彼得·斯坦伯格Peter Steinberger是PDF工具PSPDFKit的创始人一度对编程失去热情。直到2025年4月接触Claude Code这是一种AI编辑器相当于Ideai仅用10天时间彼得在2025年11月24日开发出了OpenClaw的前身——最初名为WhatsApp Relay随后更名为Clawdbot。“Clawdbot”这个名字暗藏玄机它既谐音致敬了Anthropic的Claude模型Claw Claude也融入了龙虾钳子Claw的意象暗示着这个AI智能体能够像钳子一样牢牢抓住各种工具。由于商标风险项目经历了两次更名——Clawdbot → Moltbot → OpenClaw最终于2026年1月正式定名并开源。它采用MIT开源协议完全免费、可自由修改与商用。(2026年4月14日 现在已进开源基金会)作者也加入了Open ai。1.2 核心定位让AI“动手”而不只是“动嘴”OpenClaw之所以火。关键在于它解决了AI应用的一个根本痛点大模型再聪明也只能输出文字无法真正“做事”。从架构层面看OpenClaw本身是一种脚本使用tsjs 编写。核心部分在于它的细分脚本例如打开浏览器执行搜索。它首先会读取你的问题后 系统指令包含工具列表就是skill包本质上是一个md文档脚本 一起给大脑看后返回json (一种结构化格式的段落类似.Md). 脚本就会识别特定的识别符来调用脚本开始工作。通常脚本内或者工具列表会写入循环如果不对可循环。 因为大模型可以生成脚本代码只需要告诉它使用内置的python就可以自己写脚本自动运行。因我写过这样的程序这就是为什么烧词源的原因它本质上是靠它训练的知识代码来写也取决于脚本本身的质量。下图为龙虾后台的系统指令表表与表之间是关联里面你可以修改他是谁调用的工具路径。这是我的一个名字的定义这些都是可以随便修改的。 因为这个open claw 本身就是一个大脚本集合。它可以调用win,mac的系统指令来找到你的然和文件夹使用Py来读取内容然后发给云端AI.这样它就貌似像个可以工作的工具。核心还是脚本集 媒体喜欢用skill(这是因为是老外发明的东西所以叫做技能)逻辑链条你可以把这个过程想象成**“接力棒”**用户\rightarrow发出指令。大脑\rightarrow输出 JSON (指令去查资料)。脚本\rightarrow执行操作 \rightarrow 拿到资料。脚本\rightarrow把资料喂回给大脑(反馈)。大脑\rightarrow分析资料 \rightarrow 输出 JSON (指令写出报告)。脚本\rightarrow最终展示。有了脚本技能包的加持它能完成的任务包括不限于管理日程 搜索数据执行软件。最核心的部分是它有一个心跳的模块就是电脑上的定时就像你的闹钟一样到了点脚本会自动给大脑发一个信息然后大脑根据发的那个信息返回数据来执行。那一条信息其实也是一个文档列表。就是告诉AI,现在应该执行什么动作。这是 这个工具的运作机制。1.2 2 然后下面的内容分两部分。一个是AI编辑器与通用AI智能体# AI agent 翻译过来其实就是AI脚本的区别Note不要迷恋AI agent 本质就是AI脚本。这篇帖子总体上会让你有洞察力看清这个领域。1.大脑部分ChatGPTClaude gemini3 ,Qwen 文心 glm5 deepseek-v3 r1 还有视频大脑视图大脑 非常多不列举 现在大模型都是多模态意思就是可以识别文字图片视频代码推理 这叫多模态。2.AI编辑器(ide,其实就是集成开发环境可以在一个软件内写代码运行的工具例如PyCharmvs code ).以前的编辑器都是ide,后来出来AI了。一些公司就是开始制作编辑器Ai,给自己用后来就公开了因为写代码的人都是程序员他们知道自己造电脑工具。open code 是开源Ai编辑器目的是打破 Claude code 的垄断因为是他先开始做的他发明了mcp(也就是一种工具调用协议你可以这么理解就是这个格式咱们都这么弄这里我没有去深入研究我们不扣没用的。)vs code 本质上不是AI 编辑器他是集成开发环境ide他跟 vs studio 系列 PyCharm PhpStorm 这类都是老牌或者老式 写代码的工具。多数人只知道。Claude code 有命令行 open code gemini3 他们都有。只是为了保留 最初的样子是为了好开发测所以保留了。没人用命令行 做事除非他是傻子。命令行的用途是为了 方便跑脚本。如果是带有界面的软件就是Gui,你得写很多东西脚本不知道按钮在哪里提交在哪里。 一些外行up主自己不懂不会 还说这玩意很先进。界面才是是先进的东西。命令行自电脑但是一开始就只有命令行。日常选用看自己喜好。这种Ai编辑器是让AI来帮你写代码使用的当然也可以做一些文档整理的工作。但他不如通用的AI智能体好用后者技能包更多。 这些Ai 编辑器没有技能包。因为他不是干这个使用的虽然能自己做但是很麻烦。3.通用的AI 智能体 Openclaw autoclaw qclaw 这些也很多。但是底层都是一样的。这是我们普通人能用到的工具最大的好处就是可以 定时。放到云端就是云服务器也可以本地也可以放在另外一台电脑上。他可以根据设定的任务流程自己工作最后指定一个接收结果的地方。因为有了心跳的功能他自己可以循环启动。也就说定期的检查那些定时任务有没有错误。目前根据我的测试能做到所有桌面电脑上工作。就连QQ ,微信这种封闭的环境也可以靠图像识别来模拟人的操作。因为大脑现在都是可以识别图片的脚本只需要按照步骤截图给模型看看后判断调用鼠标点击。以下是资讯汇总不加以读浪费时间。但是不附上你会觉得不值。1.3 国内科技巨头入局一场围绕“龙虾”的卡位战OpenClaw的火爆迅速吸引了中国科技巨头的注意。2026年初围绕“龙虾”展开了一场密集的产品卡位战OpenClaw前身Clawdbot/Moltbot发布时间2025年11月Clawdbot→ 2026年1月OpenClaw正式定名开源发布方彼得·斯坦伯格开源社区核心定位自托管AI网关将大模型转化为可执行任务的智能助手关键特征MIT协议开源免费商用本地部署GitHub 25万星标AutoClaw澳龙发布时间2026年3月随智谱合作推出发布方智谱AI核心定位OpenClaw的一键安装桌面版关键特征内置Pony-Alpha-2智能体模型支持模型热插拔与飞书集成50技能开箱即用“小白也能1分钟上手”QClaw发布时间2026年3月3月18日版本升级3月20日正式全量公测发布方腾讯电脑管家团队核心定位基于OpenClaw封装的本地AI智能体面向大众用户关键特征首创微信直连小程序控制电脑20秒完成安装零门槛免部署用户通过向“龙虾”下达自然语言指令即可实现各类电脑操作ArkClaw发布时间2026年3月9日发布方火山引擎字节跳动旗下云与AI服务平台核心定位开箱即用的云上SaaS版OpenClaw此外英伟达在GTC大会上发布了“Nemo-Claw”开源栈腾讯则官宣了包括WorkBuddy腾讯版“免部署小龙虾”、QClaw、腾讯云Lighthouse在内的全系“龙虾”产品矩阵。1.4 战略意图抢占“AI执行层”的入口为什么中国科技巨头如此密集地布局OpenClaw生态这背后反映了一个关键的战略判断AI的下一个战场不是模型本身而是执行能力。OpenAI和Anthropic在做“最强的大脑”但谁能让这个大脑真正操控用户的电脑、手机和应用谁就掌握了连接AI能力与真实世界的“最后一公里”。OpenClaw恰好提供了一个开放、可扩展的执行框架腾讯通过微信入口将QClaw变成“人人都能用的AI操作员”字节跳动则通过云化部署将ArkClaw推向企业市场——每家巨头的打法不同但目标一致在“AI执行层”这个新战场上抢先建立生态壁垒。第二部分ChatGPT vs Claude——两种“AI哲学”的较量如果说OpenClaw生态代表的是“AI如何动手”那么ChatGPT与Claude的对决则代表了“AI如何思考”。两个产品走到2026年各自的路线已经泾渭分明。2.1 ChatGPT路线图从通用对话到统一执行OpenAI的战略演进可以概括为从“聊天机器人”到“智能体操作系统”。关键节点2023年3月GPT-4发布奠定了多模态和复杂推理的基础2024年5月GPT-4o推出以其“温暖亲切的对话风格”迅速获得用户喜爱成为许多人的“最有感情”的AI助手2025年4月30日GPT-4从ChatGPT中移除由GPT-4o全面取代2025年8月8日GPT-5正式发布。这是OpenAI“史上最强大的AI模型”采用多层级架构整合了o3系列的推理能力重点提升了智能体能力。GPT-5不再追求颠覆式创新而是主打“实用性和普及性”CEO奥特曼称“这次最强调现实中的实用性以及普及性”2026年3月5日GPT-5.4发布。这是OpenAI“能力N合1”的统一模型集推理、编码、智能体工作流于一体原生支持电脑操作搭载100万token上下文被官方定义为“迄今能力最强、效率最高的专业工作前沿模型”2026年3月17日GPT-4.1 Mini和Nano发布面向速度与成本效率优化2026年2月13日OpenAI在ChatGPT中退役GPT-4o、GPT-5、GPT-4.1、GPT-4.1 Mini、o4-mini等一系列旧模型标志着全面向新一代统一架构过渡核心意图OpenAI的战略是用一个“统一模型”覆盖所有场景。从GPT-5开始模型不再需要用户手动选择“用哪个版本”——系统自动判断任务类型在快速响应与深度推理之间动态切换。GPT-5.4进一步将这一理念推向极致推理、编码、工具调用、电脑操作全部原生集成于一个模型之中。2.2 Claude路线图从“安全优先”到“混合推理”Anthropic的路线则从一开始就带有鲜明的“哲学底色”安全、可控、对用户价值观对齐。这种产品哲学在模型的迭代中一以贯之。关键节点2024年10月Claude 3.5系列新增流程图与技术图纸解析能力实现图像生成代码的跨模态交互2025年2月Claude 3.7 Sonnet发布成为全球首款混合推理模型。用户可通过API调控“思考预算”——既可以快速响应也可以深度推理。知识截止日期为2024年10月支持高达128,000 token的输出2025年5月Claude 4系列正式发布被Anthropic称为“史上最强大的AI模型组”2025年9月30日Claude Sonnet 4.5发布宣称“全球最出色的编码模型”也是“构建复杂智能体的最强模型”可自主运行长达30小时2025年11月Claude Opus 4.5发布在编码、智能代理和计算机应用方面达到新高度“在深度研究、处理幻灯片和电子表格等日常任务方面显著优于其他模型”2026年1月27日Claude 3.7 Sonnet、3.5 Haiku和3.5 Sonnet正式下架2026年2月5日Claude Opus 4.6发布被定位为“迄今最强版本”2026年6月Claude 4系列新模型将向微软、亚马逊、谷歌云、Salesforce和Zoom开放早期访问权限核心意图Anthropic走的是“分化”而非“统一”的路线——Sonnet系列定位“速度和性价比”Opus系列定位“极致智能”。同时Claude 3.7率先引入“混合推理”模式让同一个模型既能“快思考”也能“慢思考”。到Claude 4.5系列Anthropic将编码能力和智能体执行能力作为核心突破口Sonnet 4.5可自主编程30小时、Opus 4.5在代理任务上全面超越竞品。2.3 核心差异两种AI哲学的深层分野ChatGPT与Claude的分野不仅是技术路线的差异更是两种产品哲学的对抗。以下从四个维度系统对比① 模型架构策略ChatGPT走向“统一模型”路线。从GPT-5开始整合推理与生成能力到GPT-5.4将推理、编码、智能体工作流原生融合让用户无需在多个模型间手动切换。Claude坚持“分化路线”Sonnet定位速度与性价比Opus定位极致智能。各系列有明确分工同时通过API的“思考预算”参数让开发者自主调控。② 产品定位ChatGPT从“聊天助手”进化为“Copilot”强调作为用户的“副驾驶”核心场景是辅助人类完成任务。大盘用户画像显示其C端泛用性和陪伴感更强。Claude从一开始就更偏向“Agent”——逐步强化“执行任务”的定位。从Claude 3.5的电脑操控能力到Sonnet 4.5的30小时自主编程Claude一直在追求“AI替人干活”的能力上限。③ 记忆系统与设计哲学ChatGPT记忆系统设计上强调“连续性陪伴”——记住用户偏好和历史对话让体验更个性化。Claude记忆系统更强调“任务导向”——在单次会话中深度理解上下文完成复杂任务后“清空记忆”体现了对隐私和专注度的不同考量。有分析指出这反映了“AI是工具还是伙伴”的根本理念差异。④ 商业化与生态ChatGPT背靠微软生态通过API、ChatGPT Plus订阅和企业服务实现商业化强调“普及性和实用性”。Claude通过亚马逊AWS和Google Cloud深度集成在金融、医疗等合规要求严格的领域更具优势企业级信任和安全是其核心卖点。第三部分关键术语详解——MCP协议与Skill机制3.1 MCP模型上下文协议AI的“Type-C接口”MCP是Model Context Protocol模型上下文协议的缩写。它由Anthropic公司于2024年11月推出并开源旨在标准化大型语言模型与外部数据源、工具的交互方式。为什么需要MCP在大模型时代早期让AI调用外部工具是一个“方言满天飞”的混乱局面——每个模型都有自己的工具调用方式开发者需要为不同的AI平台写不同的适配代码。MCP试图解决这个问题它的定位就像AI工具调用的“Type-C协议”——让不同的模型可以通过统一标准进行交互。MCP的核心能力共享上下文信息让AI应用能够将用户的环境、历史和数据上下文传递给模型暴露工具和能力标准化地将数据库、API、文件系统等能力开放给AI系统构建可组合的集成让不同的AI工具和服务可以像乐高积木一样组合使用通俗理解MCP就像是AI和外部世界之间的“翻译官”——无论底层是GPT、Claude还是其他模型都能用同样的方式与数据库、文件系统、企业工具进行交互。这为AI从“孤立的聊天窗口”走向“连接万物的生态系统”奠定了协议基础。3.2 Skill技能给AI的一本“工作手册”Skill技能是AI领域另一个关键术语。这个概念最初来源于Claude2025年10月16日被正式推出。Anthropic官方的解释是“Skills能教会Claude如何以可重复的方式完成具体任务——比如按照贵公司的品牌规范生成文档、依托组织专属的工作流程分析数据或是自动化处理各类个人事务。”Skill与普通Prompt的区别如果把大模型比作一个“什么都懂但什么都不精的通才毕业生”Skill就是你递给他的“工作手册”。这本手册里写明了在什么情况下、该按什么步骤、产出什么样的结果。从技术原理上看Skill与传统的编程函数有本质区别普通函数被代码调用编译器知道何时执行Skill被LLM的推理过程“读懂”后由模型自主决定要不要用这意味着Skill不是硬编码的逻辑而是一种“软约束”——它通过结构化的指令让模型的输出更加稳定同时提高了能力的复用性。同一个Skill可以在不同业务场景中反复使用。Skill vs Tool在AI Agent语境中Tool工具是让AI“能够做什么”的能力比如调用API、读写文件而Skill是告诉AI“该怎么做好”的说明书。二者配合才能让AI从“有手”进化到“会干活”。第四部分全局时间轴——AI生态的演进节奏一览以下按时间顺序呈现2025-2026年AI领域的关键节点时间事件意义2024年11月Anthropic推出MCP协议建立AI与外部工具交互的统一标准2025年2月Claude 3.7 Sonnet发布全球首款混合推理模型2025年4月30日GPT-4从ChatGPT移除旧模型退役GPT-4o全面接棒2025年5月Claude 4系列发布Anthropic史上最强模型组2025年8月8日GPT-5发布OpenAI统一推理与生成能力的里程碑2025年9月30日Claude Sonnet 4.5发布可自主编码30小时2025年10月16日Claude推出Skills机制让AI具备可复用的专项能力2025年11月OpenClawClawdbot诞生开启“AI替人动手”的开源浪潮2025年11月Claude Opus 4.5发布代理任务能力全面领先2026年1月OpenClaw正式定名并开源MIT协议全球爆发2026年1月27日Claude 3.5/3.7系列下架Anthropic模型线精简2026年2月5日Claude Opus 4.6发布定位“迄今最强”2026年2月13日OpenAI退役GPT-4o等系列全面向新一代统一架构过渡2026年3月5日GPT-5.4发布原生支持电脑操作100万token上下文2026年3月9日火山引擎发布ArkClaw字节跳动入局OpenClaw生态2026年3月智谱推出AutoClaw一键安装桌面版OpenClaw2026年3月20日腾讯QClaw全量公测微信小程序控制电脑零门槛2026年6月预期Claude 4新模型开放早期访问五家科技巨头率先接入第五部分未来封闭与开源大战扎克伯格貌似一直在推他的开源大模型当然在开源路上有很多。我在这里需要告诉你的是一般4B,含4B 一下的模型适合做成 感知辅助桌面轻文档的那种类似与AI 输入法你写几个字他自己续写。7b 以上的模型才有 工具调用的模块也就是说他能链接到 open claw 这种框架上做大脑调用skill技能包。但通常本地机器硬件拖累这个过程会非常满。但是自己可以给他写一下特定的Python 脚本。让他做特定的任务判断这可行的。我自己就制作了一个桌面文档写入自动给我分类的脚本。 其他应用场景还需自己根据需要来做。未来可能是 大模型用于重型计算工作而私人模型会改变信息传播的载体。开源王者ollama正在突破底层的封装技术压缩大模型体积越来越小。而红帽正在搞企业级别大模型 一键部署那些给企业做套壳业务的估计受到冲击。如果技术成熟企业就会像安装一个软件那样安装一个企业模型运行在企业内部。最后唠两句为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选很简单这些岗位缺人且高薪智联招聘的最新数据给出了最直观的印证2025年2月AI领域求职人数同比增幅突破200% 远超其他行业平均水平整个人工智能行业的求职增速达到33.4%位居各行业榜首其中人工智能工程师岗位的求职热度更是飙升69.6%。AI产业的快速扩张也让人才供需矛盾愈发突出。麦肯锡报告明确预测到2030年中国AI专业人才需求将达600万人人才缺口可能高达400万人这一缺口不仅存在于核心技术领域更蔓延至产业应用的各个环节。那0基础普通人如何学习大模型 深耕科技一线十二载亲历技术浪潮变迁。我见证那些率先拥抱AI的同行如何建立起效率与薪资的代际优势。如今我将积累的大模型面试真题、独家资料、技术报告与实战路线系统整理分享于此为你扫清学习困惑共赴AI时代新程。我整理出这套 AI 大模型突围资料包【允许白嫖】✅从入门到精通的全套视频教程✅AI大模型学习路线图0基础到项目实战仅需90天✅大模型书籍与技术文档PDF✅各大厂大模型面试题目详解✅640套AI大模型报告合集✅大模型入门实战训练这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】①从入门到精通的全套视频教程包含提示词工程、RAG、Agent等技术点② AI大模型学习路线图0基础到项目实战仅需90天全过程AI大模型学习路线③学习电子书籍和技术文档市面上的大模型书籍确实太多了这些是我精选出来的④各大厂大模型面试题目详解⑤640套AI大模型报告合集⑥大模型入门实战训练如果说你是以下人群中的其中一类都可以来智泊AI学习人工智能找到高薪工作一次小小的“投资”换来的是终身受益应届毕业生‌无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型‌非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界‌。业务赋能 ‌突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型‌。获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】

更多文章