## 简介 ChID 是一个用于完形填空测试的大规模中文成语数据集。 ChID 包含 581K 段落和 729K 空白,涵盖多个领域。在 ChID 中,段落中的成语被替换为空白符号。对于每个空白,提供包括黄金成语在内的候选成语列表作为选择。 ## 类定义 null ## 引文 ``` @article{zheng2019chid, title={ChID: A large-scale Chinese IDiom dataset for cloze test}, author={Zheng, Chujie and Huang, Minlie and Sun, Aixin}, journal={arXiv preprint arXiv:1906.01265}, year={2019} } ``` ‌​‌‌​​​​‌​​​‌‌‌‌‌​​‌‌​‌​‌​​‌​​​‌‌​‌‌‌​‌‌‌​​‌‌‌‌​‌​​​‌​‌‌‌​​‌‌‌‌​‌​‌‌​​‌‌‌​​‌‌‌‌​‌​​‌‌‌​‌