数据集包含50万人的5千万图片,为了更好学术研究,我们清洗了数据,得到了celeb-500K-2R,这个数据集包含36.5万人的2500万张人脸对齐图。利用这个数据集,我们训练出了最好的模型。
依据大量的实验,我们还总结出两条规矩: 一,当人数变很大时,矩阵学习类方法会变的逐渐失效。 二,对于人脸识别问题,人数比图片数更重要。
人物数量 | 50万左右 |
图片数量 | 5千万 |
引用数据 | Cao, Jiajiong & Li, Yingming & Zhang, Zhongfei. (2018). Celeb-500K: A Large Training Dataset for Face Recognition. 2406-2410. 10.1109/ICIP.2018.8451704. |