图书馆里的清洁工 少林寺里的扫地僧

深度学习常用数据集总结

深度学习常用数据集总结

图像

CIFAR-10
包含50K训练图片和10k测试图片。所有图片大小32x32,
CIFAR10

CIFAR-100
CIFAR-10的拓展,有100个类别。

UCM 数据集
UC Merced Land Use Dataset,2010年10月28号发布,包含21类土地利用分类数据。每类100张,共2100张。

Kaggle Flowers Recognition
包含4242张花的数据集。

DOTA数据集
DOTA: A Large-scale Dataset for Object DeTection in Aerial Images
航空影像目标检测

iSAID
iSAID: A Large-scale Dataset for Instance Segmentation in Aerial Images
航空影像实例分割

语音

文本

WordNet
普林斯顿大学发布的英语词汇数据库,收录了超过十万个实词。在WordNet中意义相近的词组成同义词组,而同义词组之间则以上-下义,同义-反义,整体-部分以及蕴含等语义关系连接在一起,构成一个由同义词组作为节点,语义关系作为边的网状结构。