BLUEPRINT

11. 认知层 — 思维

认知层的思维子系统是 iFay 的"大脑记忆与理解中枢"——它管理 iFay 的记忆、获取外部知识、并维护对你的深度理解，为所有行为提供认知基础。

11.1 个人数据堆

一句话定义

个人数据堆是 iFay 的记忆——你的照片、聊天记录、工作文档、健康数据……散落在手机、电脑、云盘各处。个人数据堆把它们统一管理，让 iFay 随时能"回忆"起任何一段过去。

为什么需要它

想想你自己的记忆是怎么工作的。你的大脑不会把"视觉记忆"存在一个地方、"听觉记忆"存在另一个地方、"情感记忆"存在第三个地方——当你回忆一次旅行时，画面、声音、感受会一起涌上来。你的大脑把所有这些信息统一管理，让你能自然地"想起"任何一段经历。

但你的数字生活完全不是这样。你的照片在手机相册里，工作文档在电脑硬盘上，聊天记录在微信里，健康数据在智能手表的 App 里，云盘里还有一堆文件……这些数据散落在十几个不同的地方，用着不同的格式，彼此之间毫无关联。

如果 iFay 要成为你的数字化身，它必须能"记住"你的一切——但它不能要求你把所有数据都搬到同一个地方。个人数据堆的解决方案是：数据留在原处，但 iFay 用统一的方式读写它们。就像你的大脑不在乎记忆存储在哪些神经元里，它只需要能"想起来"就行。

个人数据堆就是 iFay 的记忆系统。它让 iFay 拥有了一个完整的、可检索的、不断增长的"人生记忆"。

它在架构中的位置

iFay 四层架构
├── 社交层
├── 交互层
│   ├── 感知（Sense）
│   │   ├── 传感器           ← 传感器数据流入数据堆
│   │   └── ...
│   └── 动作（Action）
│       └── ...
├── 认知层          ← 个人数据堆在这里
│   ├── 思维（Thought）
│   │   ├── 👉 个人数据堆    ← 记忆：统一管理所有私有数据
│   │   ├── 外部知识         ← 图书馆：外部知识也会存入数据堆
│   │   └── 对齐意识         ← 从数据堆中挖掘人类原型画像
│   └── 技能（Skill）
│       └── ...
└── 自我层

个人数据堆位于认知层的思维子系统中，是 iFay 所有数据的"总仓库"。它的位置决定了它的角色：几乎所有其他模块都会和它打交道。

交互层的传感器采集的数据，最终存储在这里
外部知识获取的信息，也会整合到这里
对齐意识从这里挖掘数据来构建你的画像
自驱行为从这里获取信息来判断该不该主动行动

它就像人体的记忆中枢——所有感官收集的信息最终都汇聚到这里，所有需要"回忆"的模块都从这里提取信息。

它是怎么工作的

个人数据堆的工作方式可以用四个关键词概括：统一、分类、持久、丰富。

1. 统一——一个接口管所有数据

你的照片可能在 iCloud 上，文档在 Google Drive 上，聊天记录在本地手机里，健康数据在智能手表的云端。个人数据堆不会把这些数据都搬到一个地方，而是提供一个统一的读写接口——iFay 的其他模块只需要说"我要找三年前在杭州拍的照片"，个人数据堆会自动去对应的存储位置找到它。

这就像你的大脑：你不需要知道某段记忆存储在哪个神经元里，你只需要"想"，记忆就会浮现。

2. 分类——四种数据类型

个人数据堆管理四种类型的数据：

内容（Content）：你创造的东西——照片、视频、文章、笔记、代码
数据（Data）：结构化的信息——健康数据、财务记录、位置历史、传感器数据
知识库（Knowledge Base）：经过整理的知识——你的专业笔记、学习资料、工作经验总结
信息流（Info Feed）：持续更新的信息——新闻订阅、社交媒体动态、邮件通知

这四种类型覆盖了你数字生活中几乎所有的数据形态。

3. 持久——数据的安全保管

通过 DTP（数据隧道协议），个人数据堆负责数据的持久化存储和监护。"监护"意味着不只是存储，还要保护——确保数据不丢失、不被未授权访问、在需要时能完整恢复。

这就像你的记忆不只是"记住"，还包括"保护"——你不会轻易把重要的记忆告诉不信任的人。

4. 丰富——让原始数据变得更有价值

个人数据堆不只是被动地存储数据，它还能对数据进行丰富化和个性化处理。比如：

你的健康数据是一堆数字（心率 72、血压 120/80、步数 8000），个人数据堆可以把它们关联起来，生成"你今天的健康状况整体良好，运动量比昨天多了 20%"这样的洞察
你的照片不只是图片文件，个人数据堆可以为它们添加语义标签——"2022 年夏天在杭州西湖和家人的合影"

与其他模块的关系

相关模块	关系	人体类比
传感器	传感器采集的环境数据存储在个人数据堆中	感觉信号 → 记忆存储
外部知识	外部知识获取的信息整合到个人数据堆中	从图书馆学到的知识 → 变成自己的记忆
对齐意识	对齐意识从个人数据堆中挖掘数据来构建人类原型画像	从记忆中总结出"我是什么样的人"
自驱行为	自驱行为从个人数据堆获取信息来判断是否需要主动行动	根据记忆判断"该做什么了"
DTP 协议	数据通过 DTP 协议在终端和个人数据堆之间双向传输	记忆的输入和输出通道

场景故事

场景一：找到三年前去过的餐厅

周末你想带朋友去一家餐厅，你记得三年前去过一次，味道很好，但你忘了餐厅的名字和地址。你只记得"大概是在杭州，吃的是杭帮菜，好像是和同事一起去的"。

你对 iFay 说："帮我找一下三年前在杭州吃过的那家杭帮菜餐厅。"

iFay 在个人数据堆中开始搜索：

先查位置历史（Data 类型）：三年前你在杭州的活动轨迹，筛选出在餐饮区域停留过的地点
再查照片（Content 类型）：那段时间你拍的照片，找到几张餐厅的菜品照片
然后查聊天记录（Content 类型）：发现你在同事群里发过一条消息"今天这家杭帮菜太好吃了"，还附了餐厅的定位
最后交叉验证：位置数据、照片和聊天记录指向同一家餐厅——"杭州味道·西湖店"

iFay 告诉你："找到了，是'杭州味道·西湖店'，在西湖区 XX 路 XX 号。你三年前 6 月 15 日和同事去的，你当时拍了三张菜品照片，还在群里推荐过。要帮你订位吗？"

这个场景展示了个人数据堆的核心价值：跨数据源的统一检索。照片、位置、聊天记录分别存储在不同的地方，但个人数据堆让 iFay 能像人类回忆一样，把散落的碎片拼成完整的记忆。

场景二：健康数据的丰富化洞察

你每天都戴着智能手表，它持续记录你的心率、睡眠、步数、血氧等数据。这些原始数据存储在个人数据堆中（Data 类型）。

某天，iFay 对这些数据进行丰富化处理后，给你一个洞察：

"过去两周，你的平均睡眠时间从 7.5 小时下降到 6.2 小时，深度睡眠比例也从 22% 降到了 15%。同时，你的静息心率从 68 升高到了 74。我注意到这段时间你的日历上有很多晚间会议（知识库中的工作日程数据），而且你最近经常在凌晨 1 点后才放下手机（使用习惯数据）。"

"建议：你可能需要调整一下作息。要不要我帮你把晚上 10 点以后的会议都推迟到第二天？"

在这个场景中，个人数据堆不只是被动地存储健康数据，而是通过丰富化处理，将原始数字（心率、睡眠时长）与其他数据（日程、使用习惯）关联起来，生成有意义的个性化洞察。这就是"让数据变得更有价值"。

对开发者

个人数据堆属于 阶段 2（直接接管客户端） 的核心模块。

需求编号：需求 11（个人数据堆）
接口规范：PersonalDataHeap 接口，包含 read()（统一读取）、write()（统一写入）、enrich()（数据丰富化）和 persist()（持久化存储）四个核心方法
四种数据类型：Content（内容）、Data（数据）、Knowledge Base（知识库）、Info Feed（信息流）
支持的存储位置：运行时内存（runtime_memory）、云存储（cloud）、向量数据库（vector_db）、本地存储（local）
关联协议：DTP（数据隧道协议）用于终端与数据堆之间的双向数据传输和数据监护
关联模块：传感器（SensorModule）提供环境数据，外部知识（ExternalKnowledge）提供外部信息，对齐意识（AlignedConsciousness）从数据堆挖掘人类原型画像
合规性测试：iFACTS L1 验证四种数据类型的读写能力，L2 验证与传感器和外部知识模块的数据接口，L3 验证"数据采集→存储→丰富化→检索"的完整链路
设计要点：统一读写接口屏蔽底层存储差异；支持语义查询（semanticQuery）；数据丰富化和个性化处理

11.2 外部知识

一句话定义

外部知识是 iFay 的图书馆和专家顾问——个人数据堆是 iFay 自己的记忆，外部知识是 iFay 可以查阅的图书馆和咨询的专家。它让 iFay 拥有超越人类原型自身能力的知识。

为什么需要它

你的记忆再好，也不可能记住所有事情。当你遇到不懂的问题时，你会怎么做？去图书馆查资料，或者咨询专业人士。

比如你收到一份体检报告，上面写着"甘油三酯 2.8 mmol/L"。你知道这是什么意思吗？大多数人不知道。这时候你需要的不是"回忆"（个人数据堆），而是"查阅"——去查医学知识库，或者问一个医生。

iFay 也是如此。个人数据堆存储的是你自己的数据和记忆，但你的知识是有限的。外部知识模块让 iFay 能够走出自己的记忆，去查阅外部的知识库、咨询外部的智能模型——就像一个人走进图书馆或拨通专家的电话。

这让 iFay 的能力不再局限于"你知道什么"，而是扩展到"世界上有什么知识可以帮到你"。

它是怎么工作的

外部知识的工作方式可以用三个关键词概括：接入、查询、整合。

1. 接入——连接外部知识源

外部知识源的种类很多：

知识库：医学知识库、法律知识库、百科全书
大型语言模型：GPT、Claude 等通用 AI 模型
专家系统：特定领域的专业推理系统
搜索引擎：互联网上的公开信息

这些知识源通过 SSP（技能共享协议） 接入 iFay。SSP 是一个标准化的协议，让原本只对特定客户端开放的服务和接口向全网开放——iFay 可以像访问任何其他技能一样访问这些知识源。

2. 查询——像咨询专家一样提问

当 iFay 需要外部知识时，它会向对应的知识源发送查询请求。每个查询结果都带有置信度——告诉 iFay 这个答案有多可靠。iFay 可以综合多个知识源的回答，选择最可靠的信息。

3. 整合——学到的知识变成自己的

从外部知识源获取的信息不会只是"用完就扔"。重要的知识会被整合到个人数据堆中，成为 iFay 自己的记忆。下次遇到类似问题时，iFay 可以直接从自己的记忆中找到答案，不需要再次查询外部知识源。

如果知识源不可用怎么办？

网络可能断开，知识源可能下线。这时候，外部知识模块会降级使用个人数据堆中的缓存知识。就像图书馆关门了，你还可以翻翻自己之前做的笔记。同时，iFay 会通知认知层"当前使用的是缓存知识，可能不是最新的"。

与其他模块的关系

相关模块	关系	人体类比
个人数据堆	外部知识获取的信息整合到个人数据堆中	从图书馆学到的知识 → 记在笔记本里
注册技能	外部知识源作为技能类型注册和管理	图书馆的借书证也是一种"技能凭证"
对齐意识	对齐意识帮助筛选与人类原型相关的外部知识	你的兴趣决定你去图书馆借什么书
内部技能	内部技能检查外部知识是否与人类原型意图冲突	用自己的判断力评估外部信息的可信度
SSP 协议	外部知识源通过 SSP 协议标准化接入	图书馆的统一借阅规则

场景故事

场景一：帮你看懂体检报告

你收到了年度体检报告，里面有一堆看不懂的指标：甘油三酯 2.8 mmol/L、低密度脂蛋白 3.9 mmol/L、尿酸 480 μmol/L……

你对 iFay 说："帮我看看这份体检报告，有没有什么需要注意的？"

iFay 开始工作：

先从个人数据堆中调取你过去三年的体检数据（自己的记忆）
然后查询外部的医学知识库（图书馆）：每个指标的正常范围是多少？超标意味着什么？
综合分析后告诉你：

"你的甘油三酯偏高（正常值应低于 1.7，你是 2.8），低密度脂蛋白也偏高（正常值应低于 3.4，你是 3.9）。这两项指标和去年相比都有上升。结合你最近三个月的饮食记录（个人数据堆中的数据），你外卖点餐的频率明显增加了，而且偏好高油高盐的食物。"

"建议你关注血脂健康，考虑调整饮食习惯。要不要我帮你预约一个心内科的门诊？"

在这个场景中，iFay 结合了自己的记忆（你的历史体检数据和饮食记录）和外部知识（医学知识库中的指标解读），给出了个性化的健康建议。这就是外部知识的价值——让 iFay 拥有你不具备的专业知识。

场景二：帮你起草合同条款

你是一个小企业主，需要和供应商签一份采购合同。你对合同法不太熟悉，但又不想每次都花钱请律师。

你对 iFay 说："帮我起草一个采购合同的违约条款，供应商如果延迟交货超过 15 天，我们有权解除合同。"

iFay 开始工作：

查询外部的法律知识库：关于采购合同违约条款的法律规定和常见写法
参考个人数据堆中你之前签过的合同模板（自己的记忆）
综合生成一段违约条款草稿，包含法律术语和保护性条款

iFay 给你呈现草稿："这是根据《合同法》相关规定起草的违约条款。我参考了法律知识库中的标准模板，并结合了你之前和 XX 公司签的那份合同的风格。你看看是否需要调整？"

同时 iFay 提醒你："这是基于法律知识库生成的草稿，建议在正式签署前让专业律师审核。"

这个场景展示了外部知识的另一个重要用途：让 iFay 在你不擅长的领域也能提供专业级的辅助。iFay 不是律师，但它可以查阅法律知识库，就像你去图书馆查法律书籍一样。

对开发者

外部知识属于 阶段 3（iFay 作为虚拟世界的接口） 的核心模块。

需求编号：需求 12（外部知识接入）
接口规范：ExternalKnowledge 接口，包含 query()（查询外部知识）、registerSource()（注册知识源）和 fallbackToCache()（降级到缓存）三个核心方法
知识源类型：knowledge_base（知识库）、llm（大型语言模型）、expert_system（专家系统）、search_engine（搜索引擎）
关联协议：SSP（技能共享协议）用于标准化接入外部知识源
关联模块：个人数据堆（PersonalDataHeap）整合外部知识，注册技能（RegisteredSkillManager）管理知识源注册，内部技能（InternalSkill）检查知识冲突
降级策略：外部知识源不可用时，自动降级使用个人数据堆中的缓存知识，并通知认知层
合规性测试：iFACTS L1 验证知识查询和缓存降级能力，L2 验证与个人数据堆的知识整合接口，L3 验证"知识查询→整合→缓存→降级"的完整链路

11.3 对齐意识

一句话定义

对齐意识是 iFay 对你的完整理解——如果 Ego 模型是 iFay 的"性格"，对齐意识就是 iFay 对你这个人的深度认知——你的价值观、偏好、习惯、边界。它是 iFay 所有行为的基准线。

为什么需要它

想象你有一个跟了你十年的老助手。这个助手之所以好用，不是因为他技术多强，而是因为他太了解你了：

他知道你不喜欢在早上 10 点之前开会
他知道你对食物过敏，点餐时会自动避开花生
他知道你做决策时偏好数据驱动，所以汇报时总会附上数据图表
他知道你最近在减肥，所以不会主动推荐甜品

这种"了解"不是写在说明书里的，而是在长期相处中积累起来的。它包括你的价值观、偏好、习惯、能力边界、甚至你自己都没意识到的行为模式。

对齐意识就是 iFay 对你的这种"完整理解"。它维护着一份关于你的完整画像——不是简单的标签（"男，30 岁，程序员"），而是一个多维度的、持续更新的、深入骨髓的理解。

为什么这很重要？因为 iFay 的每一个行为都需要一个"基准线"来判断：这件事该不该做？该怎么做？做到什么程度？这个基准线就是对齐意识提供的人类原型画像。没有它，iFay 就像一个不了解你的陌生人——技术再强，做出来的事也可能让你不满意。

它是怎么工作的

对齐意识维护的人类原型画像包含多个维度：价值取向、兴趣偏好、习惯模式、认知边界、技能边界、权限边界、工作风格。这些维度共同构成了一个完整的"你"。

这份画像通过三种方式建立和更新：

1. 数据挖掘——从你的数据中了解你

对齐意识会从个人数据堆中挖掘你的行为模式。比如：

分析你过去一年的点餐记录，发现你最近三个月不再点肉类菜品 → 推断你可能开始吃素了
分析你的日历数据，发现你从不在周末安排工作会议 → 推断你重视工作生活平衡
分析你的阅读记录，发现你最近在大量阅读投资相关的书籍 → 推断你对投资产生了兴趣

这种方式是被动的、持续的——iFay 不需要问你，它通过观察你的数据就能逐渐了解你。

2. 实时调整——从你的反应中读懂你

自我感知模块会实时观察你的反应，并将观察结果传递给对齐意识。比如：

iFay 推荐了一首歌，你立刻跳过了 → 对齐意识更新：你不喜欢这种风格的音乐
iFay 帮你写了一封邮件，你大幅修改了措辞 → 对齐意识更新：你的邮件风格比 iFay 预期的更正式
iFay 在晚上 11 点提醒你一个工作任务，你表现出不耐烦 → 对齐意识更新：你不希望在深夜被工作打扰

这种方式是主动的、即时的——iFay 从你的每一次反应中学习，不断微调对你的理解。

3. 手动定义——你直接告诉 iFay

有些偏好和边界，你可以直接告诉 iFay：

"我不想让你在早上 10 点之前安排任何会议"
"我对花生过敏，帮我点餐时注意"
"工作邮件用正式语气，私人消息可以随意一点"

这种方式是明确的、即时的——你说什么，iFay 就记什么，不需要推断。

三种方式互相补充：数据挖掘提供长期趋势，实时调整捕捉即时变化，手动定义设定明确边界。它们共同让对齐意识维护的画像越来越准确、越来越完整。

与其他模块的关系

相关模块	关系	人体类比
个人数据堆	对齐意识从个人数据堆中挖掘数据来构建人类原型画像	从记忆中总结出"我是什么样的人"
自我感知	自我感知实时观察人类原型反应，传递给对齐意识进行画像更新	察言观色 → 更新对你的理解
Ego 模型	对齐意识将人类原型画像提供给 Ego 模型，作为个性约束的输入	对你的了解 → 塑造 iFay 的性格
内部技能	对齐意识为内部技能提供行为约束基准	对你的了解 → 决定哪些事能做、哪些不能做
自驱行为	对齐意识帮助自驱行为判断"该不该主动做这件事"	了解你的边界 → 决定行动范围

场景故事

场景一：从点餐数据中发现你变成了素食者

过去三个月，iFay 通过对齐意识的数据挖掘功能，分析了你在个人数据堆中的点餐记录：

三个月前：你的外卖订单中 70% 包含肉类菜品
两个月前：肉类菜品比例下降到 30%，开始频繁出现素食选项
最近一个月：完全没有点过肉类菜品，而且你在社交媒体上关注了几个素食博主

对齐意识综合这些数据，更新了你的画像：饮食偏好从杂食转变为素食。

这个更新立刻影响了 iFay 的行为：

当你说"帮我点个外卖"时，iFay 推荐的全是素食餐厅
当 iFay 帮你规划旅行时，会特别标注目的地附近的素食友好餐厅
当朋友邀请你聚餐时，iFay 会提醒你"这家餐厅的素食选择比较少，要不要建议换一家？"

你没有明确告诉 iFay "我现在吃素了"，但 iFay 通过数据挖掘自己发现了这个变化，并自动调整了所有相关的行为。这就是对齐意识的力量——它让 iFay 像一个朝夕相处的伙伴一样，默默地理解你的变化。

场景二：你直接告诉 iFay 一条规则

某天早上，你被一个 8 点的会议吵醒了。你有点恼火地对 iFay 说："以后不要在早上 10 点之前给我安排任何会议。"

iFay 立刻回应："好的，我记住了。以后所有会议都会安排在上午 10 点之后。"

这是一次手动定义——你直接告诉 iFay 一条明确的规则。对齐意识立刻更新了你的画像，在"习惯模式"维度中添加了这条约束。

这个更新的影响是即时的：

当有人通过 iFay 约你明天早上 9 点开会时，iFay 会回复："XX 上午 10 点之前不方便，10 点之后可以吗？"
当 iFay 的自驱行为想在早上 8 点提醒你一个工作任务时，它会检查对齐意识，发现"10 点前不打扰"的规则，于是把提醒推迟到 10 点
即使是定时任务，如果执行时间在 10 点之前，iFay 也会自动延后

一条简单的口头指令，通过对齐意识的传导，影响了 iFay 的所有相关行为。这就是对齐意识作为"行为基准线"的作用——它不直接执行任何动作，但它约束着所有动作。

对开发者

对齐意识属于 阶段 4（iFay + coFay 全面拟人化） 的核心模块。

需求编号：需求 16（对齐意识）
接口规范：AlignedConsciousness 接口，包含 getProfile()（获取人类原型画像）、mineFromDataHeap()（数据挖掘更新）、adjustFromAwareness()（自我感知实时调整）和 manualUpdate()（人类原型手动定义）四个核心方法
人类原型画像维度：价值取向（values）、偏好（preferences）、习惯（habits）、认知边界（cognitiveBoundaries）、技能边界（skillBoundaries）、权限边界（permissionBoundaries）、工作风格（workingStyle）
三种更新方式：从个人数据堆挖掘（被动、持续）、通过自我感知实时调整（主动、即时）、人类原型手动定义（明确、即时）
关联模块：个人数据堆（PersonalDataHeap）提供数据源，自我感知（SelfAwareness）提供实时反馈，Ego 模型（EgoModel）和内部技能（InternalSkill）消费画像数据
与 iFay Profile 的关系：人类原型画像（HostProfile）是 iFay Profile 的子集和输入源，Profile 是 iFay 的完整"身份证"，对齐意识是其中"对人类原型的理解"部分
合规性测试：iFACTS L1 验证三种画像更新方式，L2 验证与 Ego 模型和内部技能的画像传递接口，L4 验证画像更新对行为约束的实际影响