Infinity Memory Service

基于 Infinity 向量数据库实现的记忆层服务，为 LLM 应用提供高性能的记忆存储和检索能力。支持多租户、多项目的记忆管理，可以轻松集成到现有的 AI 应用中。

特性

基于 Infinity 向量数据库实现高效的向量检索
支持多租户和多项目隔离
自动向量化处理（使用外部 Embedding 服务）
支持混合搜索（向量 + 全文）
完整的 CRUD 操作接口
异步操作支持
简单的配置管理

安装

确保已安装 Infinity 数据库并正常运行
安装依赖：

pip install -r requirements.txt

配置

创建 .env 文件：

# Infinity 配置
INFINITY_HOST=localhost
INFINITY_PORT=23817

# 向量服务配置
EMBEDDING_SERVICE_URL=https://your-embedding-service.com/v1/embeddings
EMBEDDING_API_KEY=your-api-key
EMBEDDING_MODEL=text-embedding-3-small
EMBEDDING_DIM=1536

# 数据库配置
DEFAULT_DATABASE=memory_store
TABLE_PREFIX=memories_

基础使用

from memory_service import InfinityMemoryService
from config import MemoryServiceConfig
import asyncio

async def main():
    # 初始化服务
    config = MemoryServiceConfig()
    memory_service = InfinityMemoryService(config)
    
    # 添加记忆
    memory_id = await memory_service.add_memory(
        tenant_id="tenant_001",
        project_id="project_001",
        content="这是一条重要的记忆",
        metadata={"source": "conversation"},
        tags=["important"]
    )
    
    # 搜索记忆
    results = await memory_service.search_memory(
        tenant_id="tenant_001",
        project_id="project_001",
        query_text="重要的记忆"
    )

if __name__ == "__main__":
    asyncio.run(main())

FastAPI 集成示例

from fastapi import FastAPI, Depends
from memory_service import InfinityMemoryService
from config import MemoryServiceConfig
from typing import Optional, List, Dict

app = FastAPI()

# 服务单例
memory_service = InfinityMemoryService(MemoryServiceConfig())

# 依赖注入
async def get_memory_service():
    return memory_service

@app.post("/memories/{tenant_id}/{project_id}")
async def create_memory(
    tenant_id: str,
    project_id: str,
    content: str,
    metadata: Optional[Dict] = None,
    tags: Optional[List[str]] = None,
    service: InfinityMemoryService = Depends(get_memory_service)
):
    memory_id = await service.add_memory(
        tenant_id=tenant_id,
        project_id=project_id,
        content=content,
        metadata=metadata,
        tags=tags
    )
    return {"memory_id": memory_id}

@app.get("/memories/{tenant_id}/{project_id}/search")
async def search_memories(
    tenant_id: str,
    project_id: str,
    query: str,
    tags: Optional[List[str]] = None,
    limit: int = 10,
    service: InfinityMemoryService = Depends(get_memory_service)
):
    results = await service.search_memory(
        tenant_id=tenant_id,
        project_id=project_id,
        query_text=query,
        filter_tags=tags,
        limit=limit
    )
    return {"results": results}

LangChain 集成示例

from langchain.memory import BaseMemory
from typing import Dict, List, Any

class InfinityMemory(BaseMemory):
    memory_service: InfinityMemoryService
    tenant_id: str
    project_id: str
    
    def __init__(self, memory_service: InfinityMemoryService, tenant_id: str, project_id: str):
        self.memory_service = memory_service
        self.tenant_id = tenant_id
        self.project_id = project_id
    
    async def add_memory(self, text: str, metadata: Dict[str, Any] = None):
        await self.memory_service.add_memory(
            tenant_id=self.tenant_id,
            project_id=self.project_id,
            content=text,
            metadata=metadata
        )
    
    async def get_relevant_memories(self, query: str, k: int = 5) -> List[Dict]:
        return await self.memory_service.search_memory(
            tenant_id=self.tenant_id,
            project_id=self.project_id,
            query_text=query,
            limit=k
        )

API 文档

核心方法

add_memory: 添加新记忆
search_memory: 搜索记忆
get_memory: 获取指定记忆
list_memories: 列出记忆
update_memory: 更新记忆
delete_memory: 删除记忆

详细的方法说明和参数请参考代码文档。

性能优化建议

1. 连接池管理

# 在 FastAPI 应用中使用连接池
from contextlib import asynccontextmanager

class MemoryServicePool:
    def __init__(self, config: MemoryServiceConfig, pool_size: int = 10):
        self.pool = [InfinityMemoryService(config) for _ in range(pool_size)]
        self._index = 0
    
    @asynccontextmanager
    async def get_service(self):
        service = self.pool[self._index]
        self._index = (self._index + 1) % len(self.pool)
        try:
            yield service
        finally:
            pass # 如果需要，这里可以添加清理逻辑

2.批量操作

# 批量添加记忆示例
async def batch_add_memories(
    service: InfinityMemoryService,
    tenant_id: str,
    project_id: str,
    memories: List[Dict]
):
    tasks = []
    for memory in memories:
        task = service.add_memory(
            tenant_id=tenant_id,
            project_id=project_id,
            content=memory["content"],
            metadata=memory.get("metadata"),
            tags=memory.get("tags")
        )
        tasks.append(task)
    return await asyncio.gather(*tasks)

贡献

欢迎提交 Issue 和 Pull Request！

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
.env_template		.env_template
.gitignore		.gitignore
README.md		README.md
config.py		config.py
conftest.py		conftest.py
memory_service.py		memory_service.py
pytest.ini		pytest.ini
requirements.txt		requirements.txt
test_memory_service.py		test_memory_service.py
usage_example.py		usage_example.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Infinity Memory Service

特性

安装

配置

基础使用

FastAPI 集成示例

LangChain 集成示例

API 文档

核心方法

性能优化建议

1. 连接池管理

2.批量操作

贡献

About

Releases

Packages

Languages

Yi-Lyu/Infinity-Memory-Service

Folders and files

Latest commit

History

Repository files navigation

Infinity Memory Service

特性

安装

配置

基础使用

FastAPI 集成示例

LangChain 集成示例

API 文档

核心方法

性能优化建议

1. 连接池管理

2.批量操作

贡献

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages