“MSRA 文本检测 500 数据库（MSRA-TD500）收集并公开发布，作为评估文本检测算法的基准，旨在跟踪自然图像文本检测领域的最新进展，特别是进展用于检测任意方向的文本。MSRA 文本检测 500 数据库 (MSRA-TD500) 包含 500 张自然图像，这些图像是使用袖珍相机从室内（办公室和商场）和室外（街道）场景中拍摄的。室内图像主要是标志, 门牌和警示牌, 而户外图像多为复杂背景下的指南牌和广告牌. 图像的分辨率从 1296x864 到 1920x1280 不等. 由于文本的多样性和背景的复杂性, 数据集具有挑战性图片。文字可能是不同的语言（中文、英文或两者的混合）、字体、大小、颜色和方向。背景可能包含植被（例如树木和公共汽车） hes) 和重复的图案（例如窗户和砖块），它们与文本的区别不大。数据集分为两部分：训练集和测试集。训练集包含从原始数据集中随机选择的 300 张图像，其余 200 张图像构成测试集。该数据集中的所有图像都已完全注释。该数据集中的基本单位是文本行（见图 1），而不是 ICDAR 数据集中使用的单词，因为很难根据间距将中文文本行划分为单个单词；即使对于英文文本行，在没有高级信息的情况下执行单词划分也很重要。"

引文

"@inproceedings{yao2012detecting,
title={Detecting texts of arbitrary orientations in natural images},
author={Yao, Cong and Bai, Xiang and Liu, Wenyu and Ma, Yi and Tu, Zhuowen},
booktitle={2012 IEEE conference on computer vision and pattern recognition},
pages={1083--1090},
year={2012},
organization={IEEE}
}"

‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌

README.md Unescape Escape

数据集介绍

简介

引文

README.md