Skip to content

status: v1-final

我的用户画像forAI

得到一份关于我的“用户说明书”,发给任何AI让它快速了解我 不要把自己绑定在某一个 AI 身上,而是让任何 AI 都能更快服务你

最小完成标准:只要得到一份可跨 AI 使用的 User.md,这件事就算完成第一版。

导出的目的是什么?

能导出原始聊天数据,但不能直接一键导出成高质量的“个人画像/User.md”

ChatGPT 官方支持导出账号数据,导出内容里包含聊天历史等账号数据;Gemini 官方支持通过 Google Takeout 导出 Gemini Apps 数据,也支持把单次回答导出到 Docs、Gmail、Sheets、Colab 等,但这仍然更接近“数据导出”,不是“人物档案导出”

但是我们想要的不是单纯“备份聊天记录”,而是:

  1. 把你和 ChatGPT / Gemini 的历史对话取出来
  2. 从里面提炼出:你是什么样的人/你需要什么支持/你常见的问题是什么/你喜欢 AI 怎么回应你...
  3. 生成一份能跨平台复用的 User.md

所以这件事最好分成两层:

A. 数据导出层

把原始聊天拿出来,参考:[导出数据操作](# 导出数据操作)

B. 记忆提炼层

让 AI 基于原始聊天,把原始聊天整理成你真正想要的“可迁移记忆文件”,参考:[个人画像制作](# 数据处理提示词)

导出数据操作

ChatGPT

提示词:从 ChatGPT 导出账号数据,获取聊天历史和相关数据。

Gemini

提示词:通过 Google Takeout 导出 Gemini / Gemini Apps 相关数据。

处理取得数据

源数据

确定能拿到的内容

  • ChatGPT 的聊天历史和相关账号数据。
  • Gemini / Gemini Apps 的导出数据,包括:
    • Gemini Gems 数据
    • Gemini Apps Activity 中的聊天、生成媒体、上传内容(如果你勾选了 My Activity 里的 Gemini Apps)
    • 其他勾选的Google生态产品数据

处理方式

=> 先“除杂”,再“蒸馏”

也就是,原始数据并不能直接作为个人画像说明,因为里面会混有:

  • 临时情绪
  • 开玩笑
  • 反复修改的想法
  • 阶段性状态
  • 样本不完整导致的偏差

如果不筛选,模型很容易把“短期状态”误当成“长期人格”。

所以需要先对这些数据去一次杂质,再精细化得到个人画像。

推荐工作流

阶段 1:先导出

  • 导出 ChatGPT 数据
  • 导出 Gemini 数据

阶段 2:选取样本

不要一上来把所有文件全扔给AI处理,先从最近 3 到 6 个月、你认为“最能代表你”的高价值对话开始

阶段 3:先除杂

让 AI:

  • 识别材料类型
  • 区分长期信息 / 短期状态
  • 标注明确事实 / 稳健归纳 / 弱推测
  • 输出材料清单、信息分类和缺失项

阶段 4:再蒸馏

基于证据表生成 User.md 初稿,只保留高价值、可迁移的信息。

阶段 5:人工修订

删除:

  • 过度解读
  • 太私密的内容
  • 样本偏差明显的内容
  • 不适合写入长期画像的短期状态

产出结果

最后产出文件:

1. User.md 长期稳定的个人画像

内容包含:

  • 基本背景
  • 长期目标
  • 优势
  • 常见困难
  • 决策风格
  • 需要 AI 提供什么帮助
  • 偏好的交流方式
  • 重要约束条件

可选文件

1. State.md 当前阶段状态

内容包含:

  • 最近在做什么
  • 目前最困扰的问题
  • 当前优先级
  • 本月目标
  • 最近决策
  • 当前订阅/工具/设备情况

2. User-Compact.mdUser.md 明显过长时,再压缩出短版

数据处理提示词

执行流程

1. 导出原始数据
   - ChatGPT 导出
   - Gemini 导出

2. 选取样本
   - 不先全量处理
   - 先选最近 3~6 个月高价值对话

3. 先除杂
   - 识别材料类型
   - 区分长期信息 / 短期状态
   - 标注明确事实 / 稳健归纳 / 弱推测
   - 输出材料地图、信息分类表、缺失项

4. 再蒸馏
   - 生成 User.md 初稿
   - 只保留高价值、可迁移信息

5. 再压缩(可选)
   - 从 User.md 压缩出短版给新 AI 快速使用

6. 最后审查
   - 检查是否过度解读
   - 删除不对的、太私密的、样本偏差导致的内容

7. 定稿
   - 保留 User.md 其他文件按需生成

下面这些提示词,可以直接发给AI处理,按“从粗到细”给你准备

提示词 1:让 AI 先识别材料,不急着下结论 “除杂”

我准备把我和不同 AI 的历史聊天记录逐步提供给你。你的任务不是立刻给我下结论,而是先完成这几步:

1. 识别这些材料分别是什么:
   - 原始聊天
   - 文件上传记录
   - 生成内容
   - 项目讨论
   - 情绪表达
   - 偏好说明

2. 按“长期稳定信息”和“短期状态信息”分类整理。
3. 标记哪些内容是高置信度结论,哪些只是猜测,不能混在一起。
4. 暂时不要生成最终人物画像,只输出:
   - 可用信息清单
   - 信息类别
   - 置信度
   - 明显缺口

要求:
- 不要过度解读
- 不要把一次性的情绪当作长期人格
- 不要把试探性说法当作事实
- 明确区分“用户明确说过”与“你推断的”

提示词 2:证据表 “进一步除杂”

很好,先不要进入人物画像总结。请你基于刚才的材料识别结果,继续整理成一份“证据表”,要求如下:

1. 只整理高置信度和中高置信度的信息
2. 每条信息都要包含:
   - 结论
   - 类别(项目讨论 / 偏好说明 / 情绪表达 / 经历说明 / 技术背景 / 目标)
   - 长期稳定 or 短期状态
   - 来源位置(尽量具体到文件夹、文件名或材料类型)
   - 证据性质(用户明确说过 / 多条材料支持的稳健归纳 / 仍需验证)
   - 是否建议进入最终 User.md
3. 暂时不要写成“你是一个什么样的人”
4. 暂时不要使用带人格色彩的标签词
5. 把不适合写进 User.md、但适合写进 State.md 的内容单独标出来

输出格式用 Markdown 表格或分节列表都可以,但要清晰。

提示词 3:让 AI 生成 User.md 初稿 “蒸馏”

请基于你刚才整理出的“证据表”,生成一个可跨 AI 平台使用的 User.md 初稿。

严格要求:
1. 只允许使用证据表中“适合考虑进入 User.md 的信息”以及“可保留但需要措辞保守的条目”
2. 不要使用“当前不纳入证据表的内容”
3. 不要把短期状态、短期情绪、阶段性任务写成长期人格或稳定特征
4. 不要使用过强的人格标签,例如“你是一个……的人”“典型的……型人格”
5. 对于“长期稳定倾向”但仍非绝对确定的内容,措辞要保守,例如使用:
   - 倾向于
   - 更关注
   - 曾多次表现出
   - 在现有材料中反复出现
6. 不要写成心理测试报告,不要煽情,不要过度解释
7. 让这份 User.md 的目标是:让任意 AI 在阅读后,快速理解用户的长期背景、长期关注点、偏好、常见支持需求和沟通方式
8. 如果某条信息更适合 State.md,就不要写进正文;可以放到最后的附录中

请用 Markdown 输出,结构如下:

# User Profile

## Basic Overview
## Long-Term Goals
## Strengths
## Recurring Difficulties
## Preferred AI Support
## Communication Preferences
## Technical / Tool Context
## Constraints
## What Helps
## What Doesn’t Help
## Open Questions / Uncertain Inferences

最后追加一个附录:
## Better suited for State.md
列出你认为不该进入 User.md、但更适合写入 State.md 的内容。

至此,可利用 AI 蒸馏出一份可长期使用的个人画像,即 User.mdState.md 按需补充

提示词 4:让 AI 生成更适合“喂给其他 AI”的短版 (可选)

请把上面的 User.md 再压缩成一个“给新 AI 的快速 User-Compact 文件”,要求:

- 不超过 800 到 1200 字
- 保留最重要的信息密度
- 删除冗余背景
- 强调:
  1. 这个人最常需要什么帮助
  2. 回答时要避免什么
  3. 最合适的交流方式
  4. 当前最相关的项目或问题

输出文件名建议:User-Compact.md

提示词 5:让 AI 检查画像是否“幻觉过度”(可选)

请审查你刚才生成的 User.md,逐条检查:

1. 哪些内容是用户明确说过的?
2. 哪些内容是你根据多段材料归纳出来的?
3. 哪些内容只是弱推测?
4. 哪些内容可能因为样本偏差而不可靠?

请输出一个审查版清单,格式为:
- 结论
- 类型:明确事实 / 稳健归纳 / 弱推测
- 支持依据
- 是否建议保留到最终 User.md

基于 VitePress 搭建 | 记录生活与代码