caffe之数据集介绍-白红宇

caffe之数据集介绍

阅读量：5821 次

发布时间：2019-06-18

本文共 733 字，大约阅读时间需要 2 分钟。

数据集：http://bigdata.51cto.com/art/201702/531276.htm

计算机视觉

MNIST: 最通用的健全检查。25x25 的数据集，中心化，B&W 手写数字。这是个容易的任务——但是在 MNIST 有效，不等同于其本身是有效的。

地址：

CIFAR 10 & CIFAR 100: 32x32 彩色图像。虽不再常用，但还是用了一次，可以是一项有趣的健全检查。

地址：

ImageNet: 新算法实际上的图像数据集。很多图片 API 公司从其 REST 接口获取标签，这些标签被怀疑与 ImageNet 的下一级 WordNet 的 1000 个范畴很接近。

地址：

LSUN: 场景理解具有很多辅助任务(房间布置评估、显著性预测等)和一个相关竞争。

地址：

PASCAL VOC: 通用图像分割/分类：对于构建真实世界的图像注释毫无用处，对于基线则意义重大。

地址：

SVHN: 来自谷歌街景视图(Google Street View)的房屋数量。把这想象成荒野之中的周期性 MNIST。

地址：

MS COCO: 带有一个相关性竞争的通用图像理解/字幕。

地址：

Visual Genome: 非常详细的视觉知识库，并带有 100K 图像的深字幕。

地址：

Labeled Faces in the Wild:通过名称标识符，已经为被裁剪的面部区域(用 Viola-Jones)打了标签。现有人类的子集在数据集中有两个图像。对于这里做面部匹配系统训练的人来说，这很正常。

地址：

ImageNet的ILSVRC2012数据集

转载于:https://www.cnblogs.com/alanfang/p/6529504.html

你可能感兴趣的文章