11. 认知层 — 思维

认知层的思维子系统是 iFay 的"大脑记忆与理解中枢"——它管理 iFay 的记忆、获取外部知识、并维护对你的深度理解,为所有行为提供认知基础。


11.1 个人数据堆

一句话定义

个人数据堆是 iFay 的记忆——你的照片、聊天记录、工作文档、健康数据……散落在手机、电脑、云盘各处。个人数据堆把它们统一管理,让 iFay 随时能"回忆"起任何一段过去。

为什么需要它

想想你自己的记忆是怎么工作的。你的大脑不会把"视觉记忆"存在一个地方、"听觉记忆"存在另一个地方、"情感记忆"存在第三个地方——当你回忆一次旅行时,画面、声音、感受会一起涌上来。你的大脑把所有这些信息统一管理,让你能自然地"想起"任何一段经历。

但你的数字生活完全不是这样。你的照片在手机相册里,工作文档在电脑硬盘上,聊天记录在微信里,健康数据在智能手表的 App 里,云盘里还有一堆文件……这些数据散落在十几个不同的地方,用着不同的格式,彼此之间毫无关联。

如果 iFay 要成为你的数字化身,它必须能"记住"你的一切——但它不能要求你把所有数据都搬到同一个地方。个人数据堆的解决方案是:数据留在原处,但 iFay 用统一的方式读写它们。就像你的大脑不在乎记忆存储在哪些神经元里,它只需要能"想起来"就行。

个人数据堆就是 iFay 的记忆系统。它让 iFay 拥有了一个完整的、可检索的、不断增长的"人生记忆"。

它在架构中的位置

iFay 四层架构
├── 社交层
├── 交互层
│   ├── 感知(Sense)
│   │   ├── 传感器           ← 传感器数据流入数据堆
│   │   └── ...
│   └── 动作(Action)
│       └── ...
├── 认知层          ← 个人数据堆在这里
│   ├── 思维(Thought)
│   │   ├── 👉 个人数据堆    ← 记忆:统一管理所有私有数据
│   │   ├── 外部知识         ← 图书馆:外部知识也会存入数据堆
│   │   └── 对齐意识         ← 从数据堆中挖掘人类原型画像
│   └── 技能(Skill)
│       └── ...
└── 自我层

个人数据堆位于认知层的思维子系统中,是 iFay 所有数据的"总仓库"。它的位置决定了它的角色:几乎所有其他模块都会和它打交道。

  • 交互层的传感器采集的数据,最终存储在这里
  • 外部知识获取的信息,也会整合到这里
  • 对齐意识从这里挖掘数据来构建你的画像
  • 自驱行为从这里获取信息来判断该不该主动行动

它就像人体的记忆中枢——所有感官收集的信息最终都汇聚到这里,所有需要"回忆"的模块都从这里提取信息。

它是怎么工作的

个人数据堆的工作方式可以用四个关键词概括:统一、分类、持久、丰富

1. 统一——一个接口管所有数据

你的照片可能在 iCloud 上,文档在 Google Drive 上,聊天记录在本地手机里,健康数据在智能手表的云端。个人数据堆不会把这些数据都搬到一个地方,而是提供一个统一的读写接口——iFay 的其他模块只需要说"我要找三年前在杭州拍的照片",个人数据堆会自动去对应的存储位置找到它。

这就像你的大脑:你不需要知道某段记忆存储在哪个神经元里,你只需要"想",记忆就会浮现。

2. 分类——四种数据类型

个人数据堆管理四种类型的数据:

  • 内容(Content):你创造的东西——照片、视频、文章、笔记、代码
  • 数据(Data):结构化的信息——健康数据、财务记录、位置历史、传感器数据
  • 知识库(Knowledge Base):经过整理的知识——你的专业笔记、学习资料、工作经验总结
  • 信息流(Info Feed):持续更新的信息——新闻订阅、社交媒体动态、邮件通知

这四种类型覆盖了你数字生活中几乎所有的数据形态。

3. 持久——数据的安全保管

通过 DTP(数据隧道协议),个人数据堆负责数据的持久化存储和监护。"监护"意味着不只是存储,还要保护——确保数据不丢失、不被未授权访问、在需要时能完整恢复。

这就像你的记忆不只是"记住",还包括"保护"——你不会轻易把重要的记忆告诉不信任的人。

4. 丰富——让原始数据变得更有价值

个人数据堆不只是被动地存储数据,它还能对数据进行丰富化和个性化处理。比如:

  • 你的健康数据是一堆数字(心率 72、血压 120/80、步数 8000),个人数据堆可以把它们关联起来,生成"你今天的健康状况整体良好,运动量比昨天多了 20%"这样的洞察
  • 你的照片不只是图片文件,个人数据堆可以为它们添加语义标签——"2022 年夏天在杭州西湖和家人的合影"

与其他模块的关系

相关模块关系人体类比
传感器传感器采集的环境数据存储在个人数据堆中感觉信号 → 记忆存储
外部知识外部知识获取的信息整合到个人数据堆中从图书馆学到的知识 → 变成自己的记忆
对齐意识对齐意识从个人数据堆中挖掘数据来构建人类原型画像从记忆中总结出"我是什么样的人"
自驱行为自驱行为从个人数据堆获取信息来判断是否需要主动行动根据记忆判断"该做什么了"
DTP 协议数据通过 DTP 协议在终端和个人数据堆之间双向传输记忆的输入和输出通道

场景故事

场景一:找到三年前去过的餐厅

周末你想带朋友去一家餐厅,你记得三年前去过一次,味道很好,但你忘了餐厅的名字和地址。你只记得"大概是在杭州,吃的是杭帮菜,好像是和同事一起去的"。

你对 iFay 说:"帮我找一下三年前在杭州吃过的那家杭帮菜餐厅。"

iFay 在个人数据堆中开始搜索:

  1. 先查位置历史(Data 类型):三年前你在杭州的活动轨迹,筛选出在餐饮区域停留过的地点
  2. 再查照片(Content 类型):那段时间你拍的照片,找到几张餐厅的菜品照片
  3. 然后查聊天记录(Content 类型):发现你在同事群里发过一条消息"今天这家杭帮菜太好吃了",还附了餐厅的定位
  4. 最后交叉验证:位置数据、照片和聊天记录指向同一家餐厅——"杭州味道·西湖店"

iFay 告诉你:"找到了,是'杭州味道·西湖店',在西湖区 XX 路 XX 号。你三年前 6 月 15 日和同事去的,你当时拍了三张菜品照片,还在群里推荐过。要帮你订位吗?"

这个场景展示了个人数据堆的核心价值:跨数据源的统一检索。照片、位置、聊天记录分别存储在不同的地方,但个人数据堆让 iFay 能像人类回忆一样,把散落的碎片拼成完整的记忆。

场景二:健康数据的丰富化洞察

你每天都戴着智能手表,它持续记录你的心率、睡眠、步数、血氧等数据。这些原始数据存储在个人数据堆中(Data 类型)。

某天,iFay 对这些数据进行丰富化处理后,给你一个洞察:

"过去两周,你的平均睡眠时间从 7.5 小时下降到 6.2 小时,深度睡眠比例也从 22% 降到了 15%。同时,你的静息心率从 68 升高到了 74。我注意到这段时间你的日历上有很多晚间会议(知识库中的工作日程数据),而且你最近经常在凌晨 1 点后才放下手机(使用习惯数据)。"

"建议:你可能需要调整一下作息。要不要我帮你把晚上 10 点以后的会议都推迟到第二天?"

在这个场景中,个人数据堆不只是被动地存储健康数据,而是通过丰富化处理,将原始数字(心率、睡眠时长)与其他数据(日程、使用习惯)关联起来,生成有意义的个性化洞察。这就是"让数据变得更有价值"。

对开发者

个人数据堆属于 阶段 2(直接接管客户端) 的核心模块。

  • 需求编号:需求 11(个人数据堆)
  • 接口规范PersonalDataHeap 接口,包含 read()(统一读取)、write()(统一写入)、enrich()(数据丰富化)和 persist()(持久化存储)四个核心方法
  • 四种数据类型:Content(内容)、Data(数据)、Knowledge Base(知识库)、Info Feed(信息流)
  • 支持的存储位置:运行时内存(runtime_memory)、云存储(cloud)、向量数据库(vector_db)、本地存储(local
  • 关联协议:DTP(数据隧道协议)用于终端与数据堆之间的双向数据传输和数据监护
  • 关联模块:传感器(SensorModule)提供环境数据,外部知识(ExternalKnowledge)提供外部信息,对齐意识(AlignedConsciousness)从数据堆挖掘人类原型画像
  • 合规性测试:iFACTS L1 验证四种数据类型的读写能力,L2 验证与传感器和外部知识模块的数据接口,L3 验证"数据采集→存储→丰富化→检索"的完整链路
  • 设计要点:统一读写接口屏蔽底层存储差异;支持语义查询(semanticQuery);数据丰富化和个性化处理

11.2 外部知识

一句话定义

外部知识是 iFay 的图书馆和专家顾问——个人数据堆是 iFay 自己的记忆,外部知识是 iFay 可以查阅的图书馆和咨询的专家。它让 iFay 拥有超越人类原型自身能力的知识。

为什么需要它

你的记忆再好,也不可能记住所有事情。当你遇到不懂的问题时,你会怎么做?去图书馆查资料,或者咨询专业人士。

比如你收到一份体检报告,上面写着"甘油三酯 2.8 mmol/L"。你知道这是什么意思吗?大多数人不知道。这时候你需要的不是"回忆"(个人数据堆),而是"查阅"——去查医学知识库,或者问一个医生。

iFay 也是如此。个人数据堆存储的是你自己的数据和记忆,但你的知识是有限的。外部知识模块让 iFay 能够走出自己的记忆,去查阅外部的知识库、咨询外部的智能模型——就像一个人走进图书馆或拨通专家的电话。

这让 iFay 的能力不再局限于"你知道什么",而是扩展到"世界上有什么知识可以帮到你"。

它是怎么工作的

外部知识的工作方式可以用三个关键词概括:接入、查询、整合

1. 接入——连接外部知识源

外部知识源的种类很多:

  • 知识库:医学知识库、法律知识库、百科全书
  • 大型语言模型:GPT、Claude 等通用 AI 模型
  • 专家系统:特定领域的专业推理系统
  • 搜索引擎:互联网上的公开信息

这些知识源通过 SSP(技能共享协议) 接入 iFay。SSP 是一个标准化的协议,让原本只对特定客户端开放的服务和接口向全网开放——iFay 可以像访问任何其他技能一样访问这些知识源。

2. 查询——像咨询专家一样提问

当 iFay 需要外部知识时,它会向对应的知识源发送查询请求。每个查询结果都带有置信度——告诉 iFay 这个答案有多可靠。iFay 可以综合多个知识源的回答,选择最可靠的信息。

3. 整合——学到的知识变成自己的

从外部知识源获取的信息不会只是"用完就扔"。重要的知识会被整合到个人数据堆中,成为 iFay 自己的记忆。下次遇到类似问题时,iFay 可以直接从自己的记忆中找到答案,不需要再次查询外部知识源。

如果知识源不可用怎么办?

网络可能断开,知识源可能下线。这时候,外部知识模块会降级使用个人数据堆中的缓存知识。就像图书馆关门了,你还可以翻翻自己之前做的笔记。同时,iFay 会通知认知层"当前使用的是缓存知识,可能不是最新的"。

与其他模块的关系

相关模块关系人体类比
个人数据堆外部知识获取的信息整合到个人数据堆中从图书馆学到的知识 → 记在笔记本里
注册技能外部知识源作为技能类型注册和管理图书馆的借书证也是一种"技能凭证"
对齐意识对齐意识帮助筛选与人类原型相关的外部知识你的兴趣决定你去图书馆借什么书
内部技能内部技能检查外部知识是否与人类原型意图冲突用自己的判断力评估外部信息的可信度
SSP 协议外部知识源通过 SSP 协议标准化接入图书馆的统一借阅规则

场景故事

场景一:帮你看懂体检报告

你收到了年度体检报告,里面有一堆看不懂的指标:甘油三酯 2.8 mmol/L、低密度脂蛋白 3.9 mmol/L、尿酸 480 μmol/L……

你对 iFay 说:"帮我看看这份体检报告,有没有什么需要注意的?"

iFay 开始工作:

  1. 先从个人数据堆中调取你过去三年的体检数据(自己的记忆)
  2. 然后查询外部的医学知识库(图书馆):每个指标的正常范围是多少?超标意味着什么?
  3. 综合分析后告诉你:

"你的甘油三酯偏高(正常值应低于 1.7,你是 2.8),低密度脂蛋白也偏高(正常值应低于 3.4,你是 3.9)。这两项指标和去年相比都有上升。结合你最近三个月的饮食记录(个人数据堆中的数据),你外卖点餐的频率明显增加了,而且偏好高油高盐的食物。"

"建议你关注血脂健康,考虑调整饮食习惯。要不要我帮你预约一个心内科的门诊?"

在这个场景中,iFay 结合了自己的记忆(你的历史体检数据和饮食记录)和外部知识(医学知识库中的指标解读),给出了个性化的健康建议。这就是外部知识的价值——让 iFay 拥有你不具备的专业知识。

场景二:帮你起草合同条款

你是一个小企业主,需要和供应商签一份采购合同。你对合同法不太熟悉,但又不想每次都花钱请律师。

你对 iFay 说:"帮我起草一个采购合同的违约条款,供应商如果延迟交货超过 15 天,我们有权解除合同。"

iFay 开始工作:

  1. 查询外部的法律知识库:关于采购合同违约条款的法律规定和常见写法
  2. 参考个人数据堆中你之前签过的合同模板(自己的记忆)
  3. 综合生成一段违约条款草稿,包含法律术语和保护性条款

iFay 给你呈现草稿:"这是根据《合同法》相关规定起草的违约条款。我参考了法律知识库中的标准模板,并结合了你之前和 XX 公司签的那份合同的风格。你看看是否需要调整?"

同时 iFay 提醒你:"这是基于法律知识库生成的草稿,建议在正式签署前让专业律师审核。"

这个场景展示了外部知识的另一个重要用途:让 iFay 在你不擅长的领域也能提供专业级的辅助。iFay 不是律师,但它可以查阅法律知识库,就像你去图书馆查法律书籍一样。

对开发者

外部知识属于 阶段 3(iFay 作为虚拟世界的接口) 的核心模块。

  • 需求编号:需求 12(外部知识接入)
  • 接口规范ExternalKnowledge 接口,包含 query()(查询外部知识)、registerSource()(注册知识源)和 fallbackToCache()(降级到缓存)三个核心方法
  • 知识源类型knowledge_base(知识库)、llm(大型语言模型)、expert_system(专家系统)、search_engine(搜索引擎)
  • 关联协议:SSP(技能共享协议)用于标准化接入外部知识源
  • 关联模块:个人数据堆(PersonalDataHeap)整合外部知识,注册技能(RegisteredSkillManager)管理知识源注册,内部技能(InternalSkill)检查知识冲突
  • 降级策略:外部知识源不可用时,自动降级使用个人数据堆中的缓存知识,并通知认知层
  • 合规性测试:iFACTS L1 验证知识查询和缓存降级能力,L2 验证与个人数据堆的知识整合接口,L3 验证"知识查询→整合→缓存→降级"的完整链路

11.3 对齐意识

一句话定义

对齐意识是 iFay 对你的完整理解——如果 Ego 模型是 iFay 的"性格",对齐意识就是 iFay 对你这个人的深度认知——你的价值观、偏好、习惯、边界。它是 iFay 所有行为的基准线。

为什么需要它

想象你有一个跟了你十年的老助手。这个助手之所以好用,不是因为他技术多强,而是因为他太了解你了

  • 他知道你不喜欢在早上 10 点之前开会
  • 他知道你对食物过敏,点餐时会自动避开花生
  • 他知道你做决策时偏好数据驱动,所以汇报时总会附上数据图表
  • 他知道你最近在减肥,所以不会主动推荐甜品

这种"了解"不是写在说明书里的,而是在长期相处中积累起来的。它包括你的价值观、偏好、习惯、能力边界、甚至你自己都没意识到的行为模式。

对齐意识就是 iFay 对你的这种"完整理解"。它维护着一份关于你的完整画像——不是简单的标签("男,30 岁,程序员"),而是一个多维度的、持续更新的、深入骨髓的理解。

为什么这很重要?因为 iFay 的每一个行为都需要一个"基准线"来判断:这件事该不该做?该怎么做?做到什么程度?这个基准线就是对齐意识提供的人类原型画像。没有它,iFay 就像一个不了解你的陌生人——技术再强,做出来的事也可能让你不满意。

它是怎么工作的

对齐意识维护的人类原型画像包含多个维度:价值取向、兴趣偏好、习惯模式、认知边界、技能边界、权限边界、工作风格。这些维度共同构成了一个完整的"你"。

这份画像通过三种方式建立和更新:

1. 数据挖掘——从你的数据中了解你

对齐意识会从个人数据堆中挖掘你的行为模式。比如:

  • 分析你过去一年的点餐记录,发现你最近三个月不再点肉类菜品 → 推断你可能开始吃素了
  • 分析你的日历数据,发现你从不在周末安排工作会议 → 推断你重视工作生活平衡
  • 分析你的阅读记录,发现你最近在大量阅读投资相关的书籍 → 推断你对投资产生了兴趣

这种方式是被动的、持续的——iFay 不需要问你,它通过观察你的数据就能逐渐了解你。

2. 实时调整——从你的反应中读懂你

自我感知模块会实时观察你的反应,并将观察结果传递给对齐意识。比如:

  • iFay 推荐了一首歌,你立刻跳过了 → 对齐意识更新:你不喜欢这种风格的音乐
  • iFay 帮你写了一封邮件,你大幅修改了措辞 → 对齐意识更新:你的邮件风格比 iFay 预期的更正式
  • iFay 在晚上 11 点提醒你一个工作任务,你表现出不耐烦 → 对齐意识更新:你不希望在深夜被工作打扰

这种方式是主动的、即时的——iFay 从你的每一次反应中学习,不断微调对你的理解。

3. 手动定义——你直接告诉 iFay

有些偏好和边界,你可以直接告诉 iFay:

  • "我不想让你在早上 10 点之前安排任何会议"
  • "我对花生过敏,帮我点餐时注意"
  • "工作邮件用正式语气,私人消息可以随意一点"

这种方式是明确的、即时的——你说什么,iFay 就记什么,不需要推断。

三种方式互相补充:数据挖掘提供长期趋势,实时调整捕捉即时变化,手动定义设定明确边界。它们共同让对齐意识维护的画像越来越准确、越来越完整。

与其他模块的关系

相关模块关系人体类比
个人数据堆对齐意识从个人数据堆中挖掘数据来构建人类原型画像从记忆中总结出"我是什么样的人"
自我感知自我感知实时观察人类原型反应,传递给对齐意识进行画像更新察言观色 → 更新对你的理解
Ego 模型对齐意识将人类原型画像提供给 Ego 模型,作为个性约束的输入对你的了解 → 塑造 iFay 的性格
内部技能对齐意识为内部技能提供行为约束基准对你的了解 → 决定哪些事能做、哪些不能做
自驱行为对齐意识帮助自驱行为判断"该不该主动做这件事"了解你的边界 → 决定行动范围

场景故事

场景一:从点餐数据中发现你变成了素食者

过去三个月,iFay 通过对齐意识的数据挖掘功能,分析了你在个人数据堆中的点餐记录:

  • 三个月前:你的外卖订单中 70% 包含肉类菜品
  • 两个月前:肉类菜品比例下降到 30%,开始频繁出现素食选项
  • 最近一个月:完全没有点过肉类菜品,而且你在社交媒体上关注了几个素食博主

对齐意识综合这些数据,更新了你的画像:饮食偏好从杂食转变为素食

这个更新立刻影响了 iFay 的行为:

  • 当你说"帮我点个外卖"时,iFay 推荐的全是素食餐厅
  • 当 iFay 帮你规划旅行时,会特别标注目的地附近的素食友好餐厅
  • 当朋友邀请你聚餐时,iFay 会提醒你"这家餐厅的素食选择比较少,要不要建议换一家?"

你没有明确告诉 iFay "我现在吃素了",但 iFay 通过数据挖掘自己发现了这个变化,并自动调整了所有相关的行为。这就是对齐意识的力量——它让 iFay 像一个朝夕相处的伙伴一样,默默地理解你的变化。

场景二:你直接告诉 iFay 一条规则

某天早上,你被一个 8 点的会议吵醒了。你有点恼火地对 iFay 说:"以后不要在早上 10 点之前给我安排任何会议。"

iFay 立刻回应:"好的,我记住了。以后所有会议都会安排在上午 10 点之后。"

这是一次手动定义——你直接告诉 iFay 一条明确的规则。对齐意识立刻更新了你的画像,在"习惯模式"维度中添加了这条约束。

这个更新的影响是即时的:

  • 当有人通过 iFay 约你明天早上 9 点开会时,iFay 会回复:"XX 上午 10 点之前不方便,10 点之后可以吗?"
  • 当 iFay 的自驱行为想在早上 8 点提醒你一个工作任务时,它会检查对齐意识,发现"10 点前不打扰"的规则,于是把提醒推迟到 10 点
  • 即使是定时任务,如果执行时间在 10 点之前,iFay 也会自动延后

一条简单的口头指令,通过对齐意识的传导,影响了 iFay 的所有相关行为。这就是对齐意识作为"行为基准线"的作用——它不直接执行任何动作,但它约束着所有动作。

对开发者

对齐意识属于 阶段 4(iFay + coFay 全面拟人化) 的核心模块。

  • 需求编号:需求 16(对齐意识)
  • 接口规范AlignedConsciousness 接口,包含 getProfile()(获取人类原型画像)、mineFromDataHeap()(数据挖掘更新)、adjustFromAwareness()(自我感知实时调整)和 manualUpdate()(人类原型手动定义)四个核心方法
  • 人类原型画像维度:价值取向(values)、偏好(preferences)、习惯(habits)、认知边界(cognitiveBoundaries)、技能边界(skillBoundaries)、权限边界(permissionBoundaries)、工作风格(workingStyle
  • 三种更新方式:从个人数据堆挖掘(被动、持续)、通过自我感知实时调整(主动、即时)、人类原型手动定义(明确、即时)
  • 关联模块:个人数据堆(PersonalDataHeap)提供数据源,自我感知(SelfAwareness)提供实时反馈,Ego 模型(EgoModel)和内部技能(InternalSkill)消费画像数据
  • 与 iFay Profile 的关系:人类原型画像(HostProfile)是 iFay Profile 的子集和输入源,Profile 是 iFay 的完整"身份证",对齐意识是其中"对人类原型的理解"部分
  • 合规性测试:iFACTS L1 验证三种画像更新方式,L2 验证与 Ego 模型和内部技能的画像传递接口,L4 验证画像更新对行为约束的实际影响