Datasets

gluonfr.data 提供了训练和验证的输入流程, 目前所有数据集由洞见实验室制作提供, 所有人脸图像均使用MTCNN进行对齐, 并截断至``(112, 112)``大小. 为了加速读取它们被转化成 train.rec, train.idx 以及 val_data.bin, 详细信息请参考 [insightface/Dataset-Zoo].

examples/dali_utils.py 文件中, 有一个使用Nvidia DALI准备数据的简单例子, 当CPU处理数据成为训练瓶颈时推荐使用.

将下载好的数据集按如下结构组织:

face/
    emore/
        train.rec
        train.idx
        property
    ms1m/
        train.rec
        train.idx
        property
    lfw.bin
    agedb_30.bin
    ...
    vgg2_fp.bin

为了保持和MXNet一致, 使用 ~/.mxnet/datasets 作为数据集的根目录.