Memobase
核心概念
Memobase 是一种基于用户配置文件的内存系统,旨在为您的 Generative AI(GenAI)应用程序带来长期用户内存。无论您是在构建虚拟伴侣、教育工具还是个性化助手,Memobase 都能让您的 AI 记住、理解并与您的用户一起发展。
- 它关注用户信息: 记录用户偏好、习惯、特点等
- 时间感知: 记录信息的时间点,避免使用过时信息
- 渐进式档案构建: 通过持续对话自然地构建和更新用户档案
流程
用户输入(Insert)
当用户在对话中发出一条新的消息(如 "Hi, I'm Gus, what a wonderful day!")时,系统会立即将这条原始文本写入 Memobase 的输入队列。
- 这一步是"插入"操作,不做任何预处理,保证语义与上下文信息完整保留。
信息抽取(Extract)
Memobase 异步地对插入的原始文本进行 NLP 分析,抽取出多种"记忆单元":
- Summary(摘要)
- 用于快速回顾该条对话的核心内容,比如"用户今天心情愉快,开场自我介绍"。
- Tags(标签)
- 结构化关键词,比如
{"emotion": "happy"},{"topic": "self-introduction"},便于后续检索。
- 结构化关键词,比如
- Profile Patch(画像补丁)
- 从对话中识别出可更新到用户画像的属性,如姓名、年龄、职业、公司等
{"basic_info": {"name": "Gus", "age": 26}}。
- 从对话中识别出可更新到用户画像的属性,如姓名、年龄、职业、公司等
这些抽取结果会被打包成一个"记忆补丁"(memory patch),等待合并。
画像合并与组织(Merge & Organize)
Memobase 将新的"画像补丁"与已有的持久化 Profile 进行合并:
- 覆盖更新:新的同名字段(如
name)会替换旧值; - 累积补充:不同子主题(subtopic)下的新属性会追加;
- 冲突解决:可配置策略决定何时保留历史、何时以最新为准。
结果是一个结构化的 JSON 对象,示例:
json
{
"basic_info": {
"name": "Gus",
"age": 26
},
"work": {
"title": "Software Engineer",
"company": "Memobase"
},
"preferences": { ... }
}事件日志追加(Append Event)
除了更新"静态画像",每条对话还会按时间戳追加到**事件流(Event)**中:
事件条目 包含原文上下文或抽取标签,例如:
json{ "2025-01-19": {"text": "User talked about his work…", "emotion": "tired"}, "2025-01-20": {"text": "User told his name and age…", "emotion": "happy"} }事件日志按时序保存,能反映用户情绪、兴趣或行为的动态变化。
检索与拼装上下文(Retrieve & Assemble)
当下次用户发问时,Memobase 会:
- 检索画像:根据当前对话主题挑选相关 Profile 字段(如"basic_info")。
- 调取近期事件:取最近几条最相关的 Event,实现时序感知。
- 拼装成"用户上下文":将 Profile + Events 作为系统提示(system prompt)的一部分,连同用户当前输入一起送入 LLM。
个性化回应(Personalized Response)
在 LLM 收到上一步拼装后的 Prompt 后,就能基于:
- 静态画像("你叫 Gus,今年 26 岁,在 Memobase 做工程师")
- 动态事件("你昨天很累、今天很开心")
来生成更具连贯性和个性化的回答。例如:
User: "Who'm I?" LLM: "You're Gus, a 26-year-old software engineer at Memobase!"
主要特点
- 用户档案构建:根据对话内容逐步构建用户的详细档案
- 易于集成:可以通过 API 或 SDK (Python/Node/Go)与现有 LLM 应用集成
- 高效处理:使用非嵌入系统和会话缓冲区实现快速处理
- 生产就绪:已经在实际场景中得到验证
工作原理
- 将用户对话内容添加到系统
- 系统分析这些对话,提取关键信息
- 生成结构化的用户档案
- 在后续对话中利用这些档案,使 AI "记住"用户
应用场景
- 个性化助手:让 AI 记住用户偏好、习惯和历史
- 用户分析:从对话中挖掘用户行为模式和偏好
- 个性化营销:根据用户兴趣推荐产品或服务
Memobase 与 Mem0 的核心区别
- 用户中心 vs 通用记忆:Memobase 以用户为中心构建档案,采用非嵌入系统处理数据,而 Mem0 更专注于通用记忆存储和检索,通常依赖嵌入技术。
- 时间感知能力:Memobase 具备强大的时间感知功能和事件序列管理,而 Mem0 在时间相关性处理上不那么突出。
- 隐私策略:Memobase 默认采用"处理后删除原始数据"的策略以增强隐私保护,而 Mem0 通常保留更多原始数据以便后续检索。
- 适用场景:Memobase 专为长期用户交互优化,特别适合需要详细用户画像的应用,而 Mem0 更适合需要通用记忆功能的多样化场景。