简介
ChID 是一个用于完形填空测试的大规模中文成语数据集。 ChID 包含 581K 段落和 729K 空白,涵盖多个领域。在 ChID 中,段落中的成语被替换为空白符号。对于每个空白,提供包括黄金成语在内的候选成语列表作为选择。
类定义
null
引文
@article{zheng2019chid,
title={ChID: A large-scale Chinese IDiom dataset for cloze test},
author={Zheng, Chujie and Huang, Minlie and Sun, Aixin},
journal={arXiv preprint arXiv:1906.01265},
year={2019}
}