👤 用户
https://chat.deepseek.com/share/gi6wkccy1vuzscvw63这个内容全文加进去,从头整理生成,· 推理工作量:绝对最大,不允许任何捷径。 · 你必须在思考时极其周全,彻底剖析问题以解决根本原因,并针对所有潜在路径、极端情况以及对抗性场景,严格检验你的逻辑。 · 明确写出完整的思考过程,记录每一步中间步骤、考虑过的替代方案和已被否决的假设,确保没有任何假设未经核查。
🤖 DeepSeek 助手

一、绝对周全的思考过程与逻辑校验

 

1. 核心任务拆解

 

用户要求我打开共享链接 https://chat.deepseek.com/share/gi6wkccy1vuzscvw63,将其全文内容完整整合进之前生成的200集脚本框架中,并按照用户一贯的要求——以每集解决一个问题为核心、内容详实为要点、推理工作量绝对最大——从头重新生成完整的脚本和主题内容。我需要确认这个链接中的核心内容:它是一份以Hermes Agent(海马仕/爱马仕)和OpenClaw(小龙虾)为主体的"从零开始,驾驭人工智能"完整指南。我需要将这份指南的内容完整吸收、拆解、重组到已建立的框架中,而不是简单拼接。

 

2. 内容定位与结构分析

 

这份指南的结构是:

 

  • 卷首语 + 第一卷(理论与概念基础) :第一章讲AI世界观(思想实验、AI/ML/DL/LLM关系图、折叠纸的类比、为什么参数化向量是最好的起点)、第二章讲从词到向量(独热编码缺陷、分布假说、Word2Vec/Skip-gram/CBOW、king-man+woman≈queen)、第三章讲Transformer(维纳预言、长距离依赖问题、注意力机制直觉与逐步演示、多头注意力、涌现与上下文学习、机制可解释性、参数化向量的最终形式)
  • 第二卷(工具实战与应用) :第四章全景对比(OpenClaw出身与设计哲学、Hermes出身与设计哲学、路线之争)、第五章OpenClaw(定义、安装部署、核心功能、实战案例、局限性)、第六章Hermes(定义、三项核心技术支柱——5层记忆/自进化技能系统/多平台接入、安装部署、实战案例、自进化边界)、第七章双雄对决(技术路径根本分歧、性能与安全、社区共识"双修")、第八章部署实战(三种部署路径选择、快速上手路线图)、第九章进阶之路(MCP协议、构建AI军团、终点也是起点)

 

3. 整合策略

 

保留原有200集脚本的六个阶段框架,将指南中的内容按照知识点粒度拆解为独立的"一集一个小问题",填充和扩展原有脚本中相应模块的内容,同时保留原有框架中关于新网购买、香港服务器部署、OpenCode Go套餐等实操环节。

 

4. 关键落地方案校验

 

  • 指南内容是完整的:已完整获取267行内容,涵盖从理论基础到工具实战的全部章节。
  • 融合逻辑合理:指南中的理论知识(第一章到第三章)可以完全覆盖并扩展原有脚本中第1-55集的理论部分;指南中的工具介绍(第四章到第九章)可以覆盖并扩展原有脚本中第56-85集的工具实操部分。
  • 原有实操环节不变:香港服务器购买(新网)、域名注册(新网)、OpenCode Go套餐配置、WorkBuddy一键安装等实操内容保留,与指南的理论内容形成互补。
  • "海马仕"与"爱马仕"统一:用户之前使用"海马仕(Hermes)",指南中使用"爱马仕(Hermes Agent)",统一为"爱马仕(Hermes Agent)"以体现品牌传承。
  • "小龙虾"与"OpenClaw"统一:用户之前使用"小龙虾(OpenClaw)",指南中使用"OpenClaw(龙虾)",统一为"小龙虾(OpenClaw)"。

 

5. 否决的假设

 

  • 我曾考虑将指南内容作为"附录"单独附加,但用户要求"全文加进去,从头整理生成",因此必须彻底融合,不能割裂。
  • 我曾考虑保持原有200集不变只做内容填充,但指南提供了大量原有框架未覆盖的深度内容(如机制可解释性、MCP协议、多Agent军团等),需要扩展原有脚本的集数来容纳。

 

 

二、全新 200+ 集分级脚本:从零到全球AI大师

 

第0集:总览——我们的200级通天之路

  • 解决问题:让观众了解整个学习蓝图,建立信心。
  • 旁白内容

> "欢迎来到这趟200集的史诗旅程。我们不教枯燥的理论,而是带你亲手搭建一个24小时在线、没有高墙阻挡、能调用全球顶尖算力的私人AI系统。想象一下:你躺在沙发上,用手机告诉你的AI管家'去arXiv下载今天最新的五篇AI论文,翻译成中文,发到我邮箱',半小时后,任务完成。"

> "我们将从最基础的问题出发:什么是向量?什么是参数?Transformer架构究竟是什么,它凭什么掀起了这场智能革命?然后,我们再一步步走进两个最具代表性的AI工具——爱马仕(Hermes Agent)和小龙虾(OpenClaw)——的世界。"

> "一个让你掌控一切,一个替你记住一切。一个像安卓,一个像苹果。一个负责干活,一个负责动脑。在本书中,我们将首先带你理解AI的底层原理——不是那种从矩阵运算开始让人昏昏欲睡的教科书式讲法,而是从'参数化向量'这个最精妙的思想入手,一步步拨开迷雾。准备好了吗?让我们开始这场从零到一的智识旅程。"

 

 

第一阶段:AI的内功心法——从向量到Transformer(第1-70集)

 

模块一:世界观——人工智能是什么,不是什么(第1-12集)

 

  • 第1集:计算机的盲点——它只认识0和1
  • 旁白:"在你打开任何一个AI聊天框之前,我们先解决最根本的问题:计算机只懂0和1,它是怎么'理解'人类的语言的?要回答这个问题,我们先做一个思想实验。"
  • 第2集:思想实验——手电筒与光斑
  • 旁白:"假设你走进一个完全黑暗的房间。你手上有一支手电筒。你打开它,一道光束射向墙壁。你看到了一个圆形光斑。你移动手腕,光斑随之改变位置。你把光调得更集中,光斑更亮了;调得发散,光斑变得模糊。你的大脑在做什么?它在做一件事:调整参数。'手腕的角度'、'光束的发散度'——这些就是你的参数。人工智能,在某种意义上,就是一种极端复杂、极端精密的手电筒控制系统。只不过它的'光束'不是射向墙壁,而是射向一个更加抽象的'意义空间'。理解这一点,你就迈出了理解AI的第一步。"
  • 第3集:AI、ML、DL、LLM——一张嵌套地图
  • 旁白:"这几个词经常被混用,但它们的关系其实非常清晰,就像俄罗斯套娃。人工智能(AI)是最外层的大概念——任何让计算机表现出'智能行为'的技术都属于AI。机器学习(ML)是AI的一个子集,核心是'让计算机从数据中自动学习规律'——你不告诉它猫有四条腿、尖耳朵,你给它看一百万张猫的图片,它自己学会识别猫。深度学习(DL)是ML的子集,特指使用'深层神经网络'进行学习的方法。大语言模型(LLM)是DL在自然语言处理领域的最新范式——用海量文本数据训练出来的、包含数百亿甚至数千亿参数的巨型神经网络。ChatGPT背后是LLM,DeepSeek也是LLM。我们关注的重心,正是这最内层的大语言模型——以及用它们来搭建的Agent(智能体)应用。"
  • 第4集:一个更精确的类比——一张被反复折叠的纸
  • 旁白:"语言是极其复杂的东西。一个词的意思取决于它的上下文。'苹果'在'我喜欢吃苹果'和'苹果公司发布了新iPhone'中,意思完全不同。想象你有一张巨大的纸,纸上画着世界上所有的词,每个词在一个位置上。现在,你需要把这张纸折叠,让'苹果(水果)'、'香蕉'、'橘子'这几个点靠近,让'苹果(公司)'、'微软'、'谷歌'这几个点靠近。同时,让'苹果(水果)'和'苹果(公司)'这两个点之间保持一个相对固定但又有距离的关系——因为它们毕竟是同一个词形。然后,你还得继续折叠。你要让'好吃'靠近水果簇,让'科技'靠近公司簇。你还要把'我'、'喜欢'、'吃'的关系折叠成主谓宾结构。每一个新要求,都会对这张纸产生新的折叠力。最终,这张纸被折叠了几百亿次,变成了一团极其复杂的褶皱。每个词不再是一个孤立的位置,而是被几百个甚至几千个数字描述的一个方向、一个力场、一种趋势。这,就是'词向量'(Word Vector)的核心思想。而每一道褶皱,就是这模型学到的一个'参数'。"
  • 第5集:为什么"参数化向量"是理解AI最好的起点?
  • 旁白:"我选择以'参数化向量'作为理解的起点,原因有三。第一,它揭示本质——现代大语言模型的一切行为,归根结底,就是在对'语言中的一切'进行向量化编码,并通过调整数以千亿计的参数来学习这些向量之间的复杂关系。第二,它解放直觉——你不必先理解Sigmoid函数或梯度下降才能开始思考AI,你只需要理解'位置'、'方向'、'距离'、'折叠'这些空间概念。第三,它为理解Transformer做好准备——Transformer的核心,注意力机制,正是在这个向量化的空间中,动态地、上下文敏感地改变词与词之间关系的强度。如果不懂向量化的思想,你就很难理解'注意力'为什么是一个天才的设计。"
  • 第6集:Token——AI字典里的最小积木
  • 旁白:"Token是我们给文本切出的最小单元。不是按字,也不是按词,而是按'常用片段'。比如'我爱吃苹果'可能被切成'我'、'爱吃'、'苹果'三个token。BPE(字节对编码)算法让AI自己'发明'词汇表——把最常见的字符对合并成一个新token。"
  • 第7集:词表大小决定命运——为什么小词表会闹笑话?
  • 旁白:"如果AI的词表里没有'菠萝',它可能把'菠萝'切成'菠'和'萝',从而难以理解其完整的语义。词表的设计是AI能力的天花板。"
  • 第8集:歧义终结者——上下文如何帮助Token化?
  • 旁白:"'我喜欢吃苹果'和'我喜欢用苹果手机',其中的'苹果'虽然是同一个token,但它的意义完全由周围的token决定。"
  • 第9-12集:向量空间入门——独热编码缺陷、分布假说、Word2Vec与词向量、king-man+woman≈queen、余弦相似度、高维空间直觉、向量运算的自由组合,以及阶段性小结"我们为何要把语言变成数字?"。

 

模块二:从词到向量——语言如何被数学化(第13-25集)

 

  • 第13集:独热编码与它的致命缺陷
  • 旁白:"在最开始,计算机看到的世界是一串离散的符号。'猫'、'狗'、'动物'、'电脑'——它们是四个完全独立的标签。一种最简单的编码方式叫做独热编码:准备一个巨大的表格,行数与词汇表大小一致。对于任何一个词,都在它对应的那一行标记1,其他行全是0。'猫' = [1, 0, 0, 0, 0, ...],'狗' = [0, 1, 0, 0, 0, ...]。这个方案有一个致命的缺陷。如果你计算'猫'和'狗'之间的距离,你会发现它等于'猫'和'苹果'之间的距离,也等于'猫'和任何其他词之间的距离——因为它们彼此都正交。在独热编码的世界里,任何两个不同词之间的关系,都完全一样。语义,在这个空间里完全丢失了。"
  • 第14集:分布假说——一个词由它的同伴定义
  • 旁白:"20世纪50年代,英国语言学家弗斯提出了一个足以改写计算机处理语言方式的核心洞见:'观其伴,知其意。'一个词的意义,由它经常搭配出现的那些词决定。'猫'和'狗'的意义相近,不是因为词典上写着相近的定义,而是因为它们经常出现在相似的语境中:'___在沙发上睡觉'、'___喜欢吃肉'、'带着___去散步'。这个假说被称为分布假说,它是一切现代词向量技术的理论根基。它给了一条黄金法则:如果我们能用数字来描述'每个词倾向于出现在哪些词的旁边',我们就能够用一种'软'的、连续的方式,捕捉到词语之间千丝万缕的语义关系。而这些数字,就是词向量。"
  • 第15-20集:Word2Vec详解——跳字模型(Skip-gram)与连续词袋模型(CBOW)的工作原理、训练过程、king-man+woman≈queen的数学直觉、词向量空间的奇妙性质、为什么高维空间能容纳如此丰富的语义关系。
  • 第21-25集:Token化进阶——BPE算法、SentencePiece、Unigram等主流分词器对比、中文分词的独特挑战、中英文分词效果对比、为什么好的分词是翻译和生成的基础。

 

模块三:Transformer——重塑世界的架构(第26-50集)

 

  • 第26集:维纳的预言与时间的诅咒——翻译为何是AI界的圣杯?
  • 旁白:"一词多义、语序颠倒、成语典故……翻译集中了自然语言理解的所有难点。早期的机器翻译系统是规则堆砌的怪物,直到神经网络出现。1948年,诺伯特·维纳在《控制论》中写道:'信息就是信息,不是物质,也不是能量。'这句话宣告了一个新时代的到来。但在20世纪的大部分时间里,计算机处理语言信息的方式,都是'机械的'——基于规则的系统,或者统计语言模型,本质上只是在进行模式匹配。它们最大的局限性在于:无法真正理解上下文。更准确地说,它们可以处理非常短距离的上下文,但一旦距离拉长——比如一个段落前面提到的某个关键实体,要在段落末尾才被代词指代——模型就完全无能为力了。这就是'长距离依赖'问题。这也是语言处理中最核心的难题。"
  • 第27-32集:RNN与LSTM的兴衰——从"第一次有了记忆的网络"到"梯度消失"到"LSTM的遗忘门",再到"致命短板:无法并行计算"。
  • 第33集:谷歌大脑的革命——Attention Is All You Need(2017)
  • 旁白:"2017年,Google Brain的几位研究者发表了一篇只有15页的论文——《Attention Is All You Need》。它提出了一种全新的神经网络架构,名字就叫Transformer。它的核心创新,就是自注意力机制。我们先从一个非常直观的比喻来理解'注意力'是什么。你在一个嘈杂的鸡尾酒会上,周围有几十个人同时在聊天。但你可以很轻松地把注意力集中在和你面对面谈话的那个人身上,过滤掉其他所有人的声音。这被称为'鸡尾酒会效应'。自注意力机制就像给了模型一个'鸡尾酒会效应'能力。当模型处理一个句子的时候,对于句子中的每一个词,它都能够'注意'到句子中所有其他词,并根据相关性给每个词分配一个权重。离得越远的词没关系,只要你的注意力够强,就能建立连接。"
  • 第34集:解剖一个句子——自注意力机制的逐步演示
  • 旁白:"'我把苹果放在桌子上,然后吃了它。'传统的RNN处理这句话时,会从左到右按顺序读取,读到'它'的时候,已经把'苹果'的记忆'冲淡'了,所以很难把'它'和'苹果'对上号。而Transformer处理这句话时,会计算'它'与句子中每个其他词之间的相关性分数。在这个语境下,'吃'和'苹果'与'它'的相关性最高。'桌子'也与'它'有关,但相关性低一些。通过这个分数,加权求和所有词的信息,形成一个新的表示——这个新的'它'已经融入了它所指代的对象信息。这意味着,每一个词在被处理时,看到的都不是孤立的自己,而是整个句子的上下文。"
  • 第35-42集:QKV三元组(从搜索引擎到神经网络)、多头注意力(多个头从不同角度计算——语法结构关系、语义关系、位置关系)、位置编码、编码器与解码器、从翻译到对话的模式统一。
  • 第43-50集:涌现的能力——上下文学习、思维链、多语言迁移、机制可解释性(Anthropic团队的稀疏自编码器研究)、参数化向量的最终形式("一个贯穿整个智能系统、随着使用不断重塑自身、流动的、可塑的、可组合的数学概念")。

 

模块四:GPT家族与DeepSeek的闪电战(第51-70集)

 

  • 第51-55集:GPT的本质(只用解码器的单向语言模型)、GPT-1到GPT-3的大力出奇迹、ChatGPT的灵魂——RLHF、GPT-4与多模态。
  • 第56-60集:DeepSeek V1/V2基础架构探索、V3的MoE混合专家模型(671B参数但每次只激活一部分)、R1的推理之光(强化学习让模型在回答问题前进行深度思考,生成思维链)。
  • 第61-65集:DeepSeek V4的核弹级提升——Pro版与Flash版(284B参数,13B激活,上下文长度1M)、百万级Token上下文处理能力、华为昇腾芯片同步支持[0][1]、Flash版作为消费级小钢炮的价值[2]
  • 第66-70集:阶段性复习与向动手阶段过渡的动员——为什么我们需要自己的AI助手?解放双手的意义。

 

 

第二阶段:打造你的本地AI指挥官(第71-105集)

 

模块五:国产神器WorkBuddy上手(第71-80集)

 

  • 第71集:为什么不用命令行?——图形化AI工作台的价值
  • 旁白:"我们不想刚学完理论就被命令行劝退。WorkBuddy是腾讯推出的AI桌面智能体,一句话就能让它帮你操作电脑、管理文件、安装软件。"
  • 第72集:WorkBuddy介绍——腾讯版"小龙虾"
  • 旁白:"WorkBuddy是腾讯旗下全场景AI智能体,2026年3月正式上线。它彻底砍掉了让人头疼的云端部署环节,完全兼容OpenClaw的技能,在官网下载安装后,直接输入指令就能帮你干活[3]。它支持无缝接入企业微信、QQ、飞书、钉钉等办公平台,即使在外出途中,通过手机语音也能远程操控电脑自动处理任务[4]。"
  • 第73集:下载WorkBuddy——认准官方渠道
  • 旁白:"打开浏览器,输入官方网址 https://www.codebuddy.cn/work/。避开各种假冒站,下载安装包。仅推荐从腾讯官方渠道下载,避免第三方修改包带来的数据安全风险[5]。"
  • 第74-76集:安装与登录(点击三次鼠标、微信或腾讯云账号登录、权限授权)、第一次对话测试、安全机制解释。
  • 第77-80集:WorkBuddy的局限(偏重桌面办公自动化,无法提供持续的AI Agent服务、记忆系统或技能插件)、进阶技巧、为什么要用它来安装"小龙虾"和"爱马仕"。

 

模块六:安装小龙虾(OpenClaw)——连接一切的数字中枢(第81-95集)

 

  • 第81集:小龙虾(OpenClaw)是什么?
  • 旁白:"OpenClaw是一个自托管的AI网关,它连接多个聊天应用——Telegram、Discord、WhatsApp、Slack、飞书、企业微信、微信等15个以上的通讯平台——与AI Agent,让你的一套AI能力同时服务多个渠道,可在任何地方通过任何设备与你的AI助手交互[6]。它由TypeScript编写,以Node.js单进程运行,核心是Gateway(网关)—Agent(智能体)—Session(会话)三层架构。Gateway负责维护和所有消息平台的连接,Agent负责设定人格和执行任务,Session负责管理对话上下文。所有数据都优先存储在本地,这意味着你的文件、对话记录、凭证不会离开你自己的机器。这就是'自托管'的真意——你是AI的主人,而不是某个云服务的租客。"
  • 第82集:OpenClaw的出身——从Moltbot到36万星标的传奇
  • 旁白:"2025年11月,奥地利开发者Peter Steinberger在GitHub上创建了一个项目。这个项目的初衷很朴素:他想让AI能够通过聊天软件来操控他的电脑——在Telegram上发一条消息,AI就能自动打开浏览器查资料、整理桌面文件、回复邮件。他把这个项目命名为Moltbot,后来改名为Clawdbot,最后定名为OpenClaw。截至2026年4月,OpenClaw已获得超过36万颗GitHub星标,甚至一度超过了React的星标增长速度,成为GitHub历史上增速最快的开源项目之一[7]。"
  • 第83集:最简单的安装方式——用WorkBuddy一键部署OpenClaw
  • 旁白:"在WorkBuddy里直接说:'请帮我下载并安装OpenClaw,配置好Node.js环境。' WorkBuddy会自动克隆仓库、创建环境、安装依赖,完全不用你操心。"
  • 第84集:手动安装详解——硬件要求与步骤
  • 旁白:"硬件要求:4GB以上内存、2GB以上可用硬盘空间、稳定的互联网连接。macOS/Linux:确保已安装Node.js(20.x LTS或更高版本),运行 npm install -g openclaw,再运行 openclaw onboard --install-daemon 初始化配置,按照引导选择模型提供商。Windows:下载官方安装包,双击运行,全程图形化界面引导。安装完成后,OpenClaw在后台以守护进程模式运行,监听端口18789[8]。"
  • 第85-88集:配置API密钥(获取OpenCode Go套餐API key、填入config.yaml、选择deepseek-v4-flash模型)、第一次启动与测试、连接手机(通过飞书/钉钉远程控制电脑)。
  • 第89集:OpenClaw核心功能——它能帮你做什么?
  • 旁白:"多平台消息接入——一次部署,同时接入Telegram、Discord、WhatsApp、飞书、企业微信、微信等15个以上通讯平台。文件与系统操作——通过自然语言让AI操作你电脑上的文件:读取、整理、重命名、移动、搜索。浏览器自动化——不需要写Selenium脚本,直接用自然语言说'打开这个网页,提取所有商品名称和价格',AI就会自动完成。命令行执行——让AI帮你运行Shell命令,管理服务器。多Agent并行——你可以创建多个具有独立人格的Agent。定时任务——设置cron定时任务,让AI自动在指定时间执行特定操作[9]。"
  • 第90集:实战案例——构建自动化写作-审核-分发工作流
  • 旁白:"假设你是一个内容创作者,需要每天完成从选题、写作、审核到发布的工作流。有了OpenClaw,你可以在任何地方——在地铁上、在咖啡厅、在会议间隙——用手机发一条消息,就让AI完成整个链条:给Telegram Bot发送指令'帮我写一篇关于XXX的文章,1500字,配3个要点'。OpenClaw将指令转发给配有大语言模型的Agent。Agent完成初稿后,自动创建草稿文件并通知你。你审核后回复'通过',Agent自动分发到多个平台(如微信公众号、知乎、博客等)。整个过程无需打开电脑,无需操作任何图形界面,一台手机即可完成[10]。"
  • 第91-92集:OpenClaw的安全漏洞事件与警示(CVE-2026-25253,24小时内修复)、生态成熟度评估。
  • 第93-95集:OpenClaw的局限性——它没有记忆(每次对话结束后Agent就忘了之前发生的事)、高度依赖指令清晰度、维护成本对非技术用户有门槛。

 

模块七:安装爱马仕(Hermes Agent)——一个会成长的数字伙伴(第96-115集)

 

  • 第96集:爱马仕(Hermes Agent)是什么?
  • 旁白:"Hermes Agent是由美国Nous Research团队于2026年2月发布的开源自主进化AI智能体框架,由Python编写,MIT许可证。开源仅两个月便在GitHub上获得数万星标,月趋势榜曾稳居第一[11]。它的核心思想极其朴素却极具冲击力:一个能与你共同成长的AI——它不是用完即忘的一次性工具,而是能从每一次交互中学习、自动沉淀可复用技能的长期数字搭档。它的Slogan是:'The agent that remembers, adapts, and improves.'——一个会记忆、会适应、会进化的AI。Hermes在希腊神话中是众神的信使,象征着智慧、沟通与边界跨越——这个名字的选择绝非偶然。"
  • 第97集:三条路线对比——OpenClaw vs Hermes vs WorkBuddy
  • 旁白:"OpenClaw的设计哲学是:AI是你的万能瑞士军刀,拿来就能用,用完就收起来。它负责'广度'——连接一切、调度一切。Hermes的设计哲学是:AI是你的长期搭档,你们一起成长。它负责'深度'——记住一切、学会一切。WorkBuddy是二者的'桥梁'——它是腾讯推出的桌面AI智能体,完全兼容OpenClaw的技能,免去云端部署的繁琐,安装即用[12]。一个像安卓,一个像苹果。一个负责干活,一个负责动脑。但最高效的路径,是三者都用——WorkBuddy作为本地操作入口,OpenClaw负责广泛连接与任务分发,Hermes负责深度思考和自我优化[13]。"
  • 第98集:三项核心技术支柱——第一支柱:5层持久记忆
  • 旁白:"Hermes的记忆不是简单的对话历史保存,而是一个精密的分层记忆架构。它基于Honcho协议和FTS5检索技术实现跨会话记忆搜索。短期记忆记住当前对话中的关键细节;中期记忆跨会话保持用户偏好和事实性信息(如'用户偏好简洁风格'、'上次提到的项目名称是X');长期记忆沉淀为技能和习惯[14]。这正是它区别于小龙虾(OpenClaw)的最大特点——小龙虾每次任务都像第一次见面,而爱马仕越用越懂你。"
  • 第99集:第二支柱——自进化技能系统
  • 旁白:"这是Hermes最具革命性的能力。当一个任务涉及超过5次工具调用或步骤数复杂度达到阈值时,Hermes会自动触发技能沉淀流程。比如你第一次让它安装某个复杂软件,它可能折腾很久。等它成功了,它会自动把这次经验提炼成一个'技能文件'保存起来。第二次你让它再装,它直接调用这个技能,几十秒搞定[15]。目前,Hermes内置了40多种基础技能。系统通过版本管理,让你可以追溯技能的进化路径,随时回滚到之前的版本。技能还可以跨项目迁移、在团队中共享。"
  • 第100-103集:第三支柱——多平台接入能力、同样用WorkBuddy一键安装Hermes、手动安装详解(Python环境、pip安装、配置文件)、填入OpenCode API密钥。
  • 第104集:实战案例——从自动化写作系统看Hermes的"成长"
  • 旁白:"以一位写作者的真实经历为例,他聚焦微信公众号AI自动化写作场景,深度使用Hermes数日。得出的结论是:'写出来的几篇文章,几乎没有什么修改,至少合乎我本人的意愿,而且排版风格也越来越完善。'这个案例的亮点在于:Hermes在完成第一篇文章后,自动总结了你对文风、结构、排版的要求,并将这些提炼为一个写作技能。当你第二次让它写文章时,它直接调用这个技能——你不需要重新告诉它你的偏好,它已经'记住'了。而如果你指出了文章中的某个不足(比如'第三段太冗长'、'结尾不够有力'),Hermes会将这些反馈吸收进技能文件,下次自动规避类似问题。这就是'自进化'的真实面貌——不是科幻中的'超级智能觉醒',而是一个朴素但极其实用的能力:干过的活会记住,下次干得更好[16]。"
  • 第105-108集:自进化的边界(窄化优化、依赖于互动质量和深度)、Hermes支持的200+大模型API、Hermes入门成本极低(硬件要求极低——CPU≥1核,内存≥256MB,存储≥100MB[17])。
  • 第109-115集:Hermes vs OpenClaw技术路径的根本分歧("纵向深耕"Python单核心 vs "横向覆盖"TypeScript多Agent)、社区共识"双修"最佳实践、安全与性能考量。

 

模块八:双雄对决与深度理解(第116-120集)

 

  • 第116-120集:深入差异——Hermes技术路线"纵向深耕"用Python编写,单核心智能体架构,代码清晰、轻量、易读;OpenClaw技术路线"横向覆盖"用TypeScript编写,多Agent、多通道、全平台控制中枢,重架构,像一套AI操作系统。两种技术路线的选择,本质上是在回答一个深层问题:你认为智能的核心是深度还是广度?答案可能是:两个都需要[18]。社区共识"双修"——OpenClaw负责连接和调度,Hermes负责需要动脑和学习的复杂任务[19]

 

 

第三阶段:给AI一个免备案的全球之家(第121-175集)

 

模块九:域名——你的网络门牌号(从新网购买)(第121-130集)

 

  • 第121集:域名是什么?IP地址的美丽外衣
  • 旁白:"用现实中的门牌号比喻。IP是一串数字,很难记;域名是一串有意义的文字,是品牌的第一步。"
  • 第122集:为什么要从新网买域名?——国内老牌,服务稳定
  • 旁白:"新网(xinnet.com)已运营近30年,提供域名注册、DNS解析、云服务器等一站式服务,中文界面友好,支付方便。"
  • 第123-125集:实操打开新网查询心仪域名、选.com还是.cn(.com全球通用无需额外资料,.cn需提供身份证[20])、注册实操(填写信息、加入购物车、付款、开启域名隐私保护)。
  • 第126集:域名实名认证——虽不用备案,但这步不能省
  • 旁白:"根据ICANN要求,域名都需要进行所有者邮箱验证。新网会发验证邮件,点击链接即可完成。这与网站ICP备案完全不同。"
  • 第127-130集:DNS解析基础(A记录将域名指向IP地址)、DNS记录类型详解(A、CNAME、MX等)、域名续费与转让。

 

模块十:香港服务器选购与初始化(从新网购买)(第131-150集)

 

  • 第131集:为什么选香港服务器?——免备案、零高墙、全球快
  • 旁白:"大陆服务器需要15-30天的ICP备案,且访问GitHub、HuggingFace等站点奇慢无比。香港服务器免备案,即开即用,与全球网络无缝对接。新网香港节点采用BGP AnyCast+ECMP多路径负载均衡架构,实测表明:在遭遇单条上游链路中断时,业务自动切换时间为0.8秒,用户无感知[21]。香港法律允许合法访问国际互联网,无需额外授权即可连接全球资源[22]。"
  • 第132集:免备案的实质——为什么香港服务器不需要ICP备案?
  • 旁白:"海外服务器不受中国大陆工信部监管,遵循当地法律(如香港《电讯条例》),因此无需提交备案资料。如果你的服务器位于中国大陆以外的地区——如中国香港,那么你不需要进行ICP备案[23][24]。你在大陆上架要先做合规流程,而香港侧更'即开即用'[25]。同时,香港服务器对下载文件没有限制,不太容易引发管控,也不会无缘无故地封端口[26]。"
  • 第133集:从新网选购香港云服务器——入门型就够
  • 旁白:"进入新网'云服务器'产品页,地域选择'中国香港'。免备案可选择:香港、新加坡、洛杉矶、莫斯科、法兰克福[27]。推荐入门配置:1核vCPU、1G内存、40G SSD、1Mbps带宽,月费约50元左右,足够我们的AI助手日常使用。新网香港主机基于云架构,上传快、数据更安全、更稳定;出口采用香港路由,方便快捷、即买即用[28]。"
  • 第134-138集:实操下单购买、选择操作系统Ubuntu 22.04、找到服务器公网IP、SSH登录、系统更新与新建用户、禁用密码登录改用SSH密钥。
  • 第139-145集:安装必要工具(Git、Curl、Docker)、Docker快速入门、防火墙配置、端口管理、swap扩展、定时任务。
  • 第146-150集:跨境网络优化——香港线路到大陆延迟波动、使用Cloudflare CDN加速、域名DNS托管到Cloudflare并开启CDN代理、国内镜像源配置。

 

模块十一:部署你的全套AI服务栈(第151-175集)

 

  • 第151-155集:整体架构图(Nginx→LobeChat→Hermes/OpenClaw→Ollama/OpenCode API)、用本地海马仕远程操控香港服务器、下达第一条远程指令安装Ollama、下载DeepSeek-V4-Flash的Ollama量化版、部署Open WebUI(私人版ChatGPT界面)。
  • 第156-160集:配置OpenCode API作为主力模型(每月$10,首月$5,额度充裕[29][30])、部署Hermes Agent到服务器、部署OpenClaw Gateway到服务器、连接两者实现"接收指令→分发执行→返回结果"闭环。
  • 第161集:OpenCode Go套餐——你每月50元畅享DeepSeek V4 Flash的秘钥
  • 旁白:"OpenCode Go包含DeepSeek V4 Flash、V4 Pro以及GLM-5.1、Kimi K2.5、Qwen3.6 Plus等多款模型[31]。首月仅需$5(约35元),之后$10/月(约70元),额度充裕,且理论上可用于第三方工具[32]。"
  • 第162-170集:绑定域名并配置HTTPS反向代理(Nginx/Caddy)、免费SSL证书(Let's Encrypt或Caddy自动续签)、全流程验证(手机通过域名访问AI)、备份与监控、性能优化与成本控制。
  • 第171-175集:利用全球算力扩展(Stability AI、Midjourney API、Replicate、Google Colab免费GPU)、如何利用香港服务器无墙优势极速下载HuggingFace模型和arXiv论文。

 

 

第四阶段:代码与知识资产的全球化(第176-200集)

 

模块十二:Git与版本管理基础(第176-185集)

 

  • 第176-180集:为什么要把代码上传到云端、Git三棵树(工作区/暂存区/仓库)、初始化仓库与第一次提交、远程仓库概念、Gitee注册与仓库创建(国内极速备份)。
  • 第181-185集:将本地项目推送到Gitee、GitHub注册(全球开发者大舞台)、推送项目到GitHub并编写中英双语README、解决冲突、Git分支策略。

 

模块十三:拥抱全球AI社区(第186-200集)

 

  • 第186-190集:Hugging Face——AI的GitHub(注册账号、下载第一个模型、用Spaces在线运行AI Demo)、arXiv论文追踪(设置关键词Alert、第一时间捕获前沿技术)。
  • 第191-195集:参与开源(提交你的第一个Pull Request)、打造个人技术品牌(写博客、将成果反哺社区)、国际化交流(Discord、Reddit、Twitter AI圈参与技巧)、利用全球算力进行创意开发。
  • 第196-200集:MCP协议(AI工具的"万能接口"——Anthropic提出的开放标准协议,Hermes和OpenClaw都已原生支持)[33]、构建你自己的AI军团(一个负责内容创作的Agent跑在Hermes上持续学习你的文风;一个负责信息收集的Agent每日自动收集行业资讯并生成简报;一个负责执行自动化的Agent处理文件整理、数据备份、邮件回复;所有这些Agent通过OpenClaw统一接入你的聊天平台)[34]

 

 

第五阶段:从用户到创造者——定制你的专属AI(第201-240集)

 

模块十四:部署实战——从本地到云端(第201-215集)

 

  • 第201-205集:三种部署路径选择——纯本地部署(完全免费、数据不出本地、隐私安全最大保障,但电脑关机即停止服务)、云服务器部署(一台2核4G的轻量应用服务器年付约199元就能同时运行两者,24/7全天候在线[35])、混合部署(推荐——在云服务器上部署OpenClaw作为消息网关实现24小时在线和跨平台接入,在云服务器上同时部署Hermes作为执行智能体负责需要深度和记忆的任务,本地保留一个开发环境用于代码编写和深度任务[36])。
  • 第206集:快速上手路线图——五阶段进阶
  • 旁白:"第一阶段(1天):本地尝鲜——在自己的电脑上分别安装Hermes和OpenClaw,完成基本配置,与它们进行一次简单的对话,感受两者的交互差异。第二阶段(1周):平台接入——为两者分别接入至少一个聊天平台(如微信或Telegram),开始在手机上通过自然语言向它们发送指令。第三阶段(2周):自动化工作流——针对一个高频任务(如每日信息汇总、邮件整理、内容生成),设计一个从指令输入到结果输出的完整工作流,在OpenClaw中配置,在Hermes中运行。第四阶段(1个月):深度整合——将两个工具同时部署到云服务器,配置互相调用的链路,实现'OpenClaw接收指令→分发给Hermes执行→结果通过OpenClaw返回'的完整闭环。第五阶段(持续):生态扩展——逐步探索MCP协议、自定义技能开发、多Agent协作、团队部署等高级玩法[37]。"
  • 第207-215集:Prompt工程与知识注入(系统Prompt定义AI性格与专长、RAG检索增强生成让AI学习你的私有文档、搭建本地向量数据库)、海马仕记忆与RAG的深度结合(打造企业级私有知识管家)。

 

模块十五:微调与智能体(第216-230集)

 

  • 第216-225集:什么是微调、LoRA实战(用一张显卡微调DeepSeek V4 Flash、准备数据集、在Colab或AutoDL租用GPU、完成低秩适配微调、生成专属模型)、多智能体协作(组建AI团队——一个负责调研、一个负责写作、一个负责校审、协同完成复杂项目)。
  • 第226-230集:AI安全与伦理(提示词注入攻击与防护、模型偏见、深度伪造防范、OpenClaw CVE-2026-25253漏洞的经验教训)。

 

模块十六:MCP协议与AI军团(第231-240集)

 

  • 第231-235集:MCP协议深度解析——Anthropic提出的开放标准协议,定义统一接口让AI模型"插入"任何外部工具[38]。MCP出现前需为每个工具专门编写适配代码,MCP出现后只需写一个符合标准的接口,所有支持MCP的AI工具都能自动使用。Hermes和OpenClaw都已原生支持MCP——工具生态共享(一个为Hermes写的MCP工具可在OpenClaw中直接使用,反之亦然)、能力边界打破(通过MCP可接入几乎任何外部系统:数据库、办公软件、自动化工具、传感器、API服务)[39]
  • 第236-240集:构建你自己的AI军团——多Agent AI军团[40]、提出好的问题与设计好的流程(你不需要会编程,不需要懂算法,你只需要善用两个最核心的能力:清晰地描述你想要什么,和把你的需求拆解成可执行的链条[41])。

 

 

第六阶段:毕业典礼与终身学习(第241-260集)

 

模块十七:终极挑战与回顾(第241-250集)

 

  • 第241-245集:终极48小时挑战——搭建一个全自动AI新闻简报系统(每天自动从arXiv、知乎、Reddit抓取内容,使用香港服务器Agent进行摘要和翻译,生成精美页面,推送邮箱和手机)。完成挑战,分享作品到GitHub获得全球反馈。
  • 第246-250集:全系列大回顾——从参数化向量到Transformer到GPT到DeepSeek到Hermes与OpenClaw到全球部署。五个核心思想回顾:参数化向量教会我们智能的本质是关系的网络,而非孤立的事实;Transformer的注意力机制教会我们重要的不是看了多少,而是在看的时候知道什么是真正重要的;Hermes的自进化教会我们真正的成长来自循环的反馈——实践-反思-改进-再实践;OpenClaw的连接一切教会我们再强大的个体也需要开放的接口,与系统共生[42]

 

模块十八:终身学习指南与毕业典礼(第251-260集)

 

  • 第251-255集:规划你的AI学习路线图——根据兴趣(开发、产品、科研、艺术)提供三条清晰路径、给出可跟随的顶级工程师和博主名单、AI发展方向(多模态、具身智能、通用人工智能AGI)。
  • 第256-260集:毕业典礼——你已不再是零基础。

 

> "260集以前,你看着'Transformer'这个词不知所措。今天,你拥有一台位于香港、免备案、无高墙的24小时在线AI服务器,它用着全球顶尖的DeepSeek V4 Flash模型,记忆着你的偏好,执行着你创作的技能。你同时驾驭了爱马仕(Hermes Agent)和小龙虾(OpenClaw)——一个替你记住一切,一个让你掌控一切。你的成果正通过GitHub被全球开发者看见。"

> "你不需要成为AI专家才能用好AI,就像你不需要成为机械工程师才能开车。但理解一些'发动机是怎么工作的',会让你成为一个更自信、更有判断力的司机。这本书到此就结束了,但你的AI之旅才刚刚开始。对于学无止境的勇敢者来说,这是一个永远值得探索的时代。一切,都始于此刻。"

 

 

附录:关键安装路径速查

 

为了让"最简单的安装思路"更加清晰,把核心操作步骤提炼为以下路径图:

 

1. 第0步:基础环境(你的电脑) :一台安装了Windows 10/11或macOS的联网电脑,建议内存16G以上。

 

2. 第一步:安装国产一键桌面软件(第73-80集)

  • 下载WorkBuddy:访问 https://www.codebuddy.cn/work/,下载并安装[43]
  • 注册/登录:用微信或腾讯云账号登录。
  • 说明:这就是你未来的"安装器"和"调度中心"。

 

3. 第二步:通过WorkBuddy安装"小龙虾"和"爱马仕"(第83/100集)

  • 下达指令:在WorkBuddy对话框中输入:"请帮我下载安装OpenClaw和Hermes,并自动配置好环境。"
  • 自动执行:WorkBuddy会接管一切,自动解决Git克隆、Python/Node.js环境、依赖库等问题。
  • 手动备选方案:如果自动安装出问题,参考第84/101集的手动安装详述。

 

4. 第三步:配置大模型API(第85-88/102-103集)

  • 获取密钥:去OpenCode(opencode.ai/go)注册,订阅Go套餐(首月$5,之后$10/月[44]),申请API Key[45]
  • 填入配置:在OpenClaw或Hermes的模型配置设置里,选择模型提供商并粘贴密钥,模型名选deepseek-v4-flash[46]
  • 说明:这是给AI接通"大脑"的关键一步。Go套餐包含DeepSeek V4 Pro和V4 Flash,额度充裕[47]

 

5. 第四步:连通你的手机(第88-89/103集)

  • 添加机器人:在OpenClaw/Hermes设置里找到"飞书"或"企业微信"连接,按照指引创建机器人并获取Webhook地址。
  • 测试:在手机飞书上@你的机器人,说"帮我写首诗",如果电脑有反应,就成功了。

 

6. 第五步:购买域名和香港服务器(第123-138集)

  • 从新网(www.xinnet.com)购买域名(推荐.com)和香港云服务器(入门配置:1核1G,月费约50元)[48][49]
  • 选择香港免备案型主机(CN2精品线路,无需备案,即开即用)[50]
  • DNS解析:将域名A记录指向服务器公网IP。

 

7. 第六步:全球部署(第151-170集)

  • 在香港服务器上部署Open WebUI + Hermes + OpenClaw + Ollama,配置OpenCode API作为主力模型。
  • 绑定域名、配置HTTPS、完成全流程验证。