BLUEPRINT
核心概念
Ego Pod(自我意识胶囊)
Ego Pod 是 Ego 的核心引擎——一个全自动化的训练管线。就像一个"修炼舱",你把原始数据放进去,它自动帮你炼出一个懂你的 AI 模型。
它做三件事:
- 采集 — 从指定数据源(本地目录/URL/云盘/...)读取宿主数据
- 炼化 — 将原始数据处理成训练语料,基于选定基座训练 LoRA 适配器
- 产出 — 输出多个版本(edition)的 Ego 模型,覆盖旧版本
类比:Ego Pod 就像一个"个性化工厂"。你把自己的日记、聊天记录、工作笔记(原料)送进去,它自动清洗、分类、加工,最后产出一个"迷你版的你"(成品)。这个成品可以装在手表上(lite 版),也可以装在电脑上(plus 版),就像同一个人穿不同尺码的衣服。
数据源 Ego Pod 产出
┌──────────────┐ ┌─────────────────┐ ┌──────────────┐
│ Sense 数据 │──┐ │ │ │ Ego-lite │
│ Action 数据 │──┤ │ ① 数据采集 │ │ Ego-normal │
│ Thought 数据 │──┼───→ │ ② 语料构建 │───────→ │ Ego-plus │
│ Skill 数据 │──┤ │ ③ LoRA 训练 │ │ Ego-super │
│ Credentials │──┘ │ ④ 多版本输出 │ │ [custom...] │
└──────────────┘ └─────────────────┘ └──────────────┘
目录/URL/云盘 全自动·可重复执行 覆盖旧版本
Ego 模型结构
每个 Ego = 基座模型 + LoRA 适配器
- 基座模型:开源小参数模型(如 Qwen 3.5、Gemma 4 等),提供通用语言和推理能力。类比:基座就像一个"毛坯房",它有基本的结构和水电,但没有任何个人风格。
- LoRA 适配器:从宿主数据训练而来,承载宿主的个性、偏好、记忆、知识、技能。类比:LoRA 就像你的"装修方案"——你喜欢的家具、墙面颜色、灯光布局,这些才让房子变成"你的家"。
基座不包含任何个性化信息,LoRA 才是"灵魂"。
换基座就像搬家:你从一居室(0.8B)搬到三居室(4B),房子变大了,但你的装修风格(LoRA)需要重新适配新户型。好消息是 Ego Pod 会自动帮你完成这个"重新装修"的过程。
Edition 体系
Ego 默认提供四个版本,适配不同算力的终端:
| Edition | 目标终端 | 基座规模 | 典型场景 |
|---|---|---|---|
| lite | 智能手表、录音笔、无人机、IoT 设备 | ~0.8B | 你的智能手表上运行 Ego-lite,它知道你每天 7 点起床、偏好黑咖啡,早上自动推送天气和日程提醒,语气和你自己写备忘录的风格一样 |
| normal | 手机、平板电脑 | ~2B | 手机上的 Ego-normal 能理解你的对话习惯,帮你草拟邮件时自动用你常用的措辞和签名格式 |
| plus | 高性能 PC、本地服务器 | ~4-9B | 笔记本上的 Ego-plus 能辅助你写代码,它学习了你的编码风格(变量命名习惯、注释风格、常用设计模式),给出的建议像是你自己写的 |
| super | 云服务、GPU 集群 | ~27B+ | 云端的 Ego-super 拥有你的完整知识库,能代替你参加技术评审,给出的意见和你本人的判断高度一致 |
支持用户自定义 edition,可自行命名和配置。
例如:一个医生可以自定义一个 "clinic" edition(基座 4B),专门用于门诊场景,学习了他的问诊习惯、常用处方模板和患者沟通风格。
每个 edition 使用不同规模的基座,并各自拥有独立训练的 LoRA 适配器集合。
