| 153 | 1 | 29 |
| 下载次数 | 被引频次 | 阅读次数 |
近些年来语料库语言学的发展较为迅速,语料库的建设成为一项重要的工作。在对语料加工的过程中,保证词性标注的一致性也成为建设高质量语料库的首要问题.本文首先概要介绍了一种维吾尔语的标注方法,并受一些文献的启发,根据维吾尔语的特点对其进行词性标注自动校对的研究,进而提高维语词性标注的正确率。
Abstract:In recent years, the development of corpus linguistics is faster, and building corpus has become an important task. In the process of processing corpus , it has been a primary problem to assure the consistency of part-of-speech tagging in building quality corpus. At first, the paper outlines a method of word tagging, and according to the characteristics of Uighur words, we, inspired by some literatures, make some researches on the auto-proofreading of part-of-speech, so as to enhance the correctness ratio of the part-of-speech tagging of Uighur words.
[1]齐璇,王挺,陈火旺.义类自动标注方法的研究[J].中文信息学报,2001
[2]汉语语料库词性标注规范[S],清华大学计算机系智能技术与系统国家重点实验室技术资料,1998.10
[3]俞士汶主编,现代汉语语料库加工——词语切分与词性标注规范与手册[J].北京大学计算语言学研究所,1999年
[4]俞士汶、朱学锋、段慧明,大规模现代汉语标注语料库的加工规范[J].中文信息学报,2000年6期
[5]张虎,郑家恒,刘江,语料库词性标注一致性检查方法研究[J].中文信息学报Vol118No15.2005
[6]米吉提.阿不力米提在多文种环境下的维吾尔语文字对系统的开发研究[M].系统工程理论与实践2003。23(5)
[7]海米提现代维吾尔语语法(词汇学)[M].北京:民族出版社。1987
基本信息:
中图分类号:TP391.1
引用信息:
[1]牛洪梅,吐尔根,伊不拉音.维吾尔语的词性标注校对初探[J].微型电脑应用,2006(12):45-47+67.
2006-12-20
2006-12-20