2025-07-29 19:07:34 +08:00
..
2025-07-29 19:07:34 +08:00
2025-07-29 19:07:34 +08:00
2025-07-29 19:07:34 +08:00
2025-07-29 19:07:34 +08:00

数据集介绍

简介

“MSRA 文本检测 500 数据库MSRA-TD500收集并公开发布作为评估文本检测算法的基准旨在跟踪自然图像文本检测领域的最新进展特别是进展用于检测任意方向的文本。MSRA 文本检测 500 数据库 (MSRA-TD500) 包含 500 张自然图像,这些图像是使用袖珍相机从室内(办公室和商场)和室外(街道)场景中拍摄的。室内图像主要是标志, 门牌和警示牌, 而户外图像多为复杂背景下的指南牌和广告牌. 图像的分辨率从 1296x864 到 1920x1280 不等. 由于文本的多样性和背景的复杂性, 数据集具有挑战性图片。文字可能是不同的语言(中文、英文或两者的混合)、字体、大小、颜色和方向。背景可能包含植被(例如树木和公共汽车) hes) 和重复的图案(例如窗户和砖块),它们与文本的区别不大。数据集分为两部分:训练集和测试集。训练集包含从原始数据集中随机选择的 300 张图像,其余 200 张图像构成测试集。该数据集中的所有图像都已完全注释。该数据集中的基本单位是文本行(见图 1而不是 ICDAR 数据集中使用的单词,因为很难根据间距将中文文本行划分为单个单词;即使对于英文文本行,在没有高级信息的情况下执行单词划分也很重要。"

引文

"@inproceedings{yao2012detecting,
title={Detecting texts of arbitrary orientations in natural images},
author={Yao, Cong and Bai, Xiang and Liu, Wenyu and Ma, Yi and Tu, Zhuowen},
booktitle={2012 IEEE conference on computer vision and pattern recognition},
pages={1083--1090},
year={2012},
organization={IEEE}
}"