Datasets¶
gluonfr.data
提供了训练和验证的输入流程, 目前所有数据集由洞见实验室制作提供, 所有人脸图像均使用MTCNN进行对齐,
并截断至``(112, 112)``大小. 为了加速读取它们被转化成 train.rec
, train.idx
以及
val_data.bin
, 详细信息请参考
[insightface/Dataset-Zoo].
在 examples/dali_utils.py
文件中, 有一个使用Nvidia DALI准备数据的简单例子, 当CPU处理数据成为训练瓶颈时推荐使用.
将下载好的数据集按如下结构组织:
face/
emore/
train.rec
train.idx
property
ms1m/
train.rec
train.idx
property
lfw.bin
agedb_30.bin
...
vgg2_fp.bin
为了保持和MXNet一致, 使用 ~/.mxnet/datasets
作为数据集的根目录.
参考文献¶
- CFP_fp, CFP_ff