status: v1-final
我的用户画像forAI
得到一份关于我的“用户说明书”,发给任何AI让它快速了解我 不要把自己绑定在某一个 AI 身上,而是让任何 AI 都能更快服务你
最小完成标准:只要得到一份可跨 AI 使用的 User.md,这件事就算完成第一版。
导出的目的是什么?
能导出原始聊天数据,但不能直接一键导出成高质量的“个人画像/User.md”
ChatGPT 官方支持导出账号数据,导出内容里包含聊天历史等账号数据;Gemini 官方支持通过 Google Takeout 导出 Gemini Apps 数据,也支持把单次回答导出到 Docs、Gmail、Sheets、Colab 等,但这仍然更接近“数据导出”,不是“人物档案导出”
但是我们想要的不是单纯“备份聊天记录”,而是:
- 把你和 ChatGPT / Gemini 的历史对话取出来
- 从里面提炼出:你是什么样的人/你需要什么支持/你常见的问题是什么/你喜欢 AI 怎么回应你...
- 生成一份能跨平台复用的
User.md
所以这件事最好分成两层:
A. 数据导出层
把原始聊天拿出来,参考:[导出数据操作](# 导出数据操作)
B. 记忆提炼层
让 AI 基于原始聊天,把原始聊天整理成你真正想要的“可迁移记忆文件”,参考:[个人画像制作](# 数据处理提示词)
导出数据操作
ChatGPT
提示词:从 ChatGPT 导出账号数据,获取聊天历史和相关数据。
Gemini
提示词:通过 Google Takeout 导出 Gemini / Gemini Apps 相关数据。
处理取得数据
源数据
确定能拿到的内容
- ChatGPT 的聊天历史和相关账号数据。
- Gemini / Gemini Apps 的导出数据,包括:
- Gemini Gems 数据
- Gemini Apps Activity 中的聊天、生成媒体、上传内容(如果你勾选了 My Activity 里的 Gemini Apps)
- 其他勾选的Google生态产品数据
处理方式
=> 先“除杂”,再“蒸馏”
也就是,原始数据并不能直接作为个人画像说明,因为里面会混有:
- 临时情绪
- 开玩笑
- 反复修改的想法
- 阶段性状态
- 样本不完整导致的偏差
如果不筛选,模型很容易把“短期状态”误当成“长期人格”。
所以需要先对这些数据去一次杂质,再精细化得到个人画像。
推荐工作流
阶段 1:先导出
- 导出 ChatGPT 数据
- 导出 Gemini 数据
阶段 2:选取样本
不要一上来把所有文件全扔给AI处理,先从最近 3 到 6 个月、你认为“最能代表你”的高价值对话开始
阶段 3:先除杂
让 AI:
- 识别材料类型
- 区分长期信息 / 短期状态
- 标注明确事实 / 稳健归纳 / 弱推测
- 输出材料清单、信息分类和缺失项
阶段 4:再蒸馏
基于证据表生成 User.md 初稿,只保留高价值、可迁移的信息。
阶段 5:人工修订
删除:
- 过度解读
- 太私密的内容
- 样本偏差明显的内容
- 不适合写入长期画像的短期状态
产出结果
最后产出文件:
1. User.md 长期稳定的个人画像
内容包含:
- 基本背景
- 长期目标
- 优势
- 常见困难
- 决策风格
- 需要 AI 提供什么帮助
- 偏好的交流方式
- 重要约束条件
可选文件
1. State.md 当前阶段状态
内容包含:
- 最近在做什么
- 目前最困扰的问题
- 当前优先级
- 本月目标
- 最近决策
- 当前订阅/工具/设备情况
2. User-Compact.md 当 User.md 明显过长时,再压缩出短版
数据处理提示词
执行流程
1. 导出原始数据
- ChatGPT 导出
- Gemini 导出
2. 选取样本
- 不先全量处理
- 先选最近 3~6 个月高价值对话
3. 先除杂
- 识别材料类型
- 区分长期信息 / 短期状态
- 标注明确事实 / 稳健归纳 / 弱推测
- 输出材料地图、信息分类表、缺失项
4. 再蒸馏
- 生成 User.md 初稿
- 只保留高价值、可迁移信息
5. 再压缩(可选)
- 从 User.md 压缩出短版给新 AI 快速使用
6. 最后审查
- 检查是否过度解读
- 删除不对的、太私密的、样本偏差导致的内容
7. 定稿
- 保留 User.md 其他文件按需生成下面这些提示词,可以直接发给AI处理,按“从粗到细”给你准备
提示词 1:让 AI 先识别材料,不急着下结论 “除杂”
我准备把我和不同 AI 的历史聊天记录逐步提供给你。你的任务不是立刻给我下结论,而是先完成这几步:
1. 识别这些材料分别是什么:
- 原始聊天
- 文件上传记录
- 生成内容
- 项目讨论
- 情绪表达
- 偏好说明
2. 按“长期稳定信息”和“短期状态信息”分类整理。
3. 标记哪些内容是高置信度结论,哪些只是猜测,不能混在一起。
4. 暂时不要生成最终人物画像,只输出:
- 可用信息清单
- 信息类别
- 置信度
- 明显缺口
要求:
- 不要过度解读
- 不要把一次性的情绪当作长期人格
- 不要把试探性说法当作事实
- 明确区分“用户明确说过”与“你推断的” 提示词 2:证据表 “进一步除杂”
很好,先不要进入人物画像总结。请你基于刚才的材料识别结果,继续整理成一份“证据表”,要求如下:
1. 只整理高置信度和中高置信度的信息
2. 每条信息都要包含:
- 结论
- 类别(项目讨论 / 偏好说明 / 情绪表达 / 经历说明 / 技术背景 / 目标)
- 长期稳定 or 短期状态
- 来源位置(尽量具体到文件夹、文件名或材料类型)
- 证据性质(用户明确说过 / 多条材料支持的稳健归纳 / 仍需验证)
- 是否建议进入最终 User.md
3. 暂时不要写成“你是一个什么样的人”
4. 暂时不要使用带人格色彩的标签词
5. 把不适合写进 User.md、但适合写进 State.md 的内容单独标出来
输出格式用 Markdown 表格或分节列表都可以,但要清晰。 提示词 3:让 AI 生成 User.md 初稿 “蒸馏”
请基于你刚才整理出的“证据表”,生成一个可跨 AI 平台使用的 User.md 初稿。
严格要求:
1. 只允许使用证据表中“适合考虑进入 User.md 的信息”以及“可保留但需要措辞保守的条目”
2. 不要使用“当前不纳入证据表的内容”
3. 不要把短期状态、短期情绪、阶段性任务写成长期人格或稳定特征
4. 不要使用过强的人格标签,例如“你是一个……的人”“典型的……型人格”
5. 对于“长期稳定倾向”但仍非绝对确定的内容,措辞要保守,例如使用:
- 倾向于
- 更关注
- 曾多次表现出
- 在现有材料中反复出现
6. 不要写成心理测试报告,不要煽情,不要过度解释
7. 让这份 User.md 的目标是:让任意 AI 在阅读后,快速理解用户的长期背景、长期关注点、偏好、常见支持需求和沟通方式
8. 如果某条信息更适合 State.md,就不要写进正文;可以放到最后的附录中
请用 Markdown 输出,结构如下:
# User Profile
## Basic Overview
## Long-Term Goals
## Strengths
## Recurring Difficulties
## Preferred AI Support
## Communication Preferences
## Technical / Tool Context
## Constraints
## What Helps
## What Doesn’t Help
## Open Questions / Uncertain Inferences
最后追加一个附录:
## Better suited for State.md
列出你认为不该进入 User.md、但更适合写入 State.md 的内容。至此,可利用 AI 蒸馏出一份可长期使用的个人画像,即 User.md;State.md 按需补充
提示词 4:让 AI 生成更适合“喂给其他 AI”的短版 (可选)
请把上面的 User.md 再压缩成一个“给新 AI 的快速 User-Compact 文件”,要求:
- 不超过 800 到 1200 字
- 保留最重要的信息密度
- 删除冗余背景
- 强调:
1. 这个人最常需要什么帮助
2. 回答时要避免什么
3. 最合适的交流方式
4. 当前最相关的项目或问题
输出文件名建议:User-Compact.md 提示词 5:让 AI 检查画像是否“幻觉过度”(可选)
请审查你刚才生成的 User.md,逐条检查:
1. 哪些内容是用户明确说过的?
2. 哪些内容是你根据多段材料归纳出来的?
3. 哪些内容只是弱推测?
4. 哪些内容可能因为样本偏差而不可靠?
请输出一个审查版清单,格式为:
- 结论
- 类型:明确事实 / 稳健归纳 / 弱推测
- 支持依据
- 是否建议保留到最终 User.md