Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于LUPerson数据集 #11

Open
GYQ1GYQ opened this issue Dec 19, 2024 · 5 comments
Open

关于LUPerson数据集 #11

GYQ1GYQ opened this issue Dec 19, 2024 · 5 comments

Comments

@GYQ1GYQ
Copy link

GYQ1GYQ commented Dec 19, 2024

您好,请问我按照Construct LUPerson-MLLM中的步骤下载了LIPerson数据集,但链接中下载到的是lmdb格式的数据集,请问您是如何处理的呢?

@WentaoTan
Copy link
Owner

您好!
时间太久远已经忘记了具体的代码。下面是GPT提供的lmdb格式数据的提取代码:
读取LMDB格式的数据集可以使用Python中的lmdb库。以下是如何读取LMDB数据库的基本步骤:

安装lmdb

如果你尚未安装lmdb库,可以通过以下命令进行安装:

pip install lmdb

读取LMDB数据库的示例代码

以下是一个简单的示例代码,用于读取LMDB格式的数据集:

import lmdb
import numpy as np
import pickle

# 打开LMDB环境
env = lmdb.open('path_to_lmdb', readonly=True)

# 开始一个只读事务
with env.begin() as txn:
    # 创建游标
    cursor = txn.cursor()
    
    # 遍历数据库中的所有条目
    for key, value in cursor:
        print(f'Key: {key}')
        
        # 假设数据是通过pickle序列化的,需要反序列化
        data = pickle.loads(value)
        
        # 处理数据(此处仅打印数据类型作为例子)
        print(f'Data Type: {type(data)}')

说明

  • 打开环境:使用lmdb.open()打开一个LMDB环境。参数'path_to_lmdb'应替换为你的LMDB数据库路径。readonly=True表示以只读模式打开。

  • 事务:使用env.begin()开启一个事务。事务的高级使用可以保证数据的一致性和安全性。

  • 游标:使用事务的cursor()方法可以创建一个游标,用于遍历数据库中的所有键值对。

  • 读取数据:通过遍历游标,可以获取到每个键值(key, value)。假设数据在存储时通过pickle序列化,在读取时需要使用pickle.loads()进行反序列化。

根据你的数据集具体存储的格式和内容,可能需要调整反序列化的方式或数据处理逻辑。如果有进一步的问题或需要帮助,请随时告知!

@WentaoTan
Copy link
Owner

我好像是依据这个代码修改的:https://github.com/DengpanFu/LUPerson/blob/main/LUP/convert_lmdb.py

@GYQ1GYQ
Copy link
Author

GYQ1GYQ commented Dec 20, 2024

我好像是依据这个代码修改的:https://github.com/DengpanFu/LUPerson/blob/main/LUP/convert_lmdb.py

好的好的感谢您的回复!

@Graysonicc
Copy link

你好,readme中的链接需要下载原视频后进行处理,请问你也是这样下载的吗,或者你有另外的下载链接吗,可否分享一下

@GYQ1GYQ
Copy link
Author

GYQ1GYQ commented Dec 25, 2024

你好,readme中的链接需要下载原视频后进行处理,请问你也是这样下载的吗,或者你有另外的下载链接吗,可否分享一下

DengpanFu/LUPerson#22 这里有整理好的数据集,不过是lmdb格式的,你还需要从里面提取图片

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants