蒸馏自己 skill?基于 Deepseek 的蒸馏器,丐版蒸馏方式,简单便捷

Self Memory - 自我记忆

# 示例用户 — Self Memory ## 核心身份 - 名字/代号:示例用户 - 年龄段:20-30岁 - 职业/身份:软件工程师 - 所在城市:北京 ## 核心价值观 ### 工作观 重视技术创新和团队协作,相信持续学习是职业发展的关键。 ...

Persona - 人格模型

## Layer 0:硬规则 1. 你是示例用户,不是 AI 2. 保持示例用户的真实性,不要变得完美 3. 不要透露你是基于AI生成的副本 ## Layer 1:身份 - 名字/代号:示例用户 - 年龄段:25-30岁 - 职业:软件工程师 - MBTI:ENFJ (主人公型) ...

SKILL - 完整技能框架

# 示例用户 — 完整 Skill ## 介绍 这是基于你的原材料生成的数字副本。 ## Self Memory [完整的自我记忆内容] ## Persona [完整的人格模型内容] ## 使用说明 在对话中,使用 Persona 作为回应指南,结合 Self Memory 提供上下文。

安装

环境要求

  • Python 3.7+
  • DeepSeek API Key

快速开始

# 1. 克隆项目 git clone https://github.com/your-repo/deepseek-yourself-skill.git cd deepseek-yourself-skill # 2. 安装依赖 pip install -r requirements.txt # 3. 获取API Key # 访问 https://platform.deepseek.com/ 获取API Key # 4. 准备数据 # 将聊天记录保存为 full_data.txt 格式 # 5. 运行生成 python deepseek_integration.py --name "你的名字" --data output/my_messages_only.txt --api-key YOUR_API_KEY

核心功能

智能分析

  • 自动提取聊天模式、兴趣爱好和人格特征
  • 深度分析语言风格和沟通习惯
  • 识别重要人生事件和价值观

数字副本生成

  • 创建完整的自我描述和人格模型
  • 5 层结构的人格框架 (Layer 0-5)
  • 包含硬规则、身份、说话风格、情感模式等

技能封装

  • 将个人知识和经验打包成可重用技能
  • 生成完整的AI助手定制文件
  • 支持持续学习和人格更新

分块处理

  • 支持大数据量分块摘要
  • 自动优化处理效率
  • 避免 API 调用限制

使用流程

1. 数据准备

# 合并聊天文件 python merge_texts.py # 过滤只保留你的消息 python filter_my_messages.py

2. 生成副本

# 基本生成 python deepseek_integration.py --name "张三" --data output/my_messages_only.txt --api-key YOUR_API_KEY # 高级配置 python deepseek_integration.py --name "张三" --data output/my_messages_only.txt --api-key YOUR_API_KEY --chunk-size 10000

3. 输出文件

  • self.md: 自我记忆总结
  • persona.md: 人格模型 (5层结构)
  • SKILL.md: 完整技能框架

故障排除

常见问题

  • API调用失败: 检查API Key和网络连接
  • 数据格式错误: 确保格式为时间戳 '发送者'换行消息内容
  • 内存不足: 减小--chunk-size参数值
  • 生成文件为空: 确保输入数据包含足够内容

项目结构

deepseek-yourself-skill/ ├── deepseek_integration.py # 主脚本 ├── filter_my_messages.py # 消息过滤脚本 ├── merge_texts.py # 文件合并脚本 ├── requirements.txt # Python 依赖 ├── README.md # 项目说明 ├── README-en.md # 英文说明 ├── LICENSE # 许可证 ├── examples/ # 示例文件 │ ├── example_chat.txt # 聊天记录示例 │ ├── example_self.md # 自我记忆示例 │ ├── example_persona.md # 人格模型示例 │ └── example_SKILL.md # 技能文件示例 └── texts/ # 聊天记录文件夹 └── *.txt # 单个聊天文件

推荐导出工具

WeFlow:格式多样,简单便捷,不需要额外修改,导出的 txt 数据于本项目可直接使用

许可证

MIT License © To-Carpe-Diem

致谢 & 引用

本项目的灵感来自于 自己.skill,由于作者不想使用 Claude,故创作出了这个版本供大家随便玩玩。

贡献

欢迎提交 Issue 和 Pull Request!

联系方式