nav emailalert searchbtn searchbox tablepage yinyongbenwen piczone journalimg journalInfo journalinfonormal searchdiv searchzone qikanlogo popupnotification paper paperNew
2002, 01, 13-15+2
一种改进的MM分词算法
基金项目(Foundation):
邮箱(Email):
DOI:
发布时间: 2002-01-20
出版时间: 2002-01-20
移动端阅读
摘要:

本文首先提出一种对中文句子进行分词预处理的方法 ,在预处理过程中就能完成分词过程中所有的数据库访问操作 ,这种方法可以不加修改地应用于所有机械分词算法以及消除歧义 ;然后在预处理的基础上实现一种改进的MM法 ,更加完全地遵照“长词优先”的原则 ,使分词系统在机械分词阶段能有比 MM法更好的效果

Abstract:

In this paper, a pretreatment method for Chinese word segmentation is introduced. Using it, all operations of access to the database in the segmentation process tare completed in the pretreatment phase. This method can also be used for algorithms of automatic segmentation and ambiguity diminishing. Then this paper proposes an improved Maximum Matching Method (MM) based on the pretreatment method, which achieves better effects based on the principle of ″Longer Word First″.

KeyWords:
参考文献

[1]揭春雨、刘源、梁南元,论汉语自动分词方法,中文信息学报,1989.1

[2]骆正清、陈增武、朝上序,一种改进的MM分词方法的算法设计,中文信息学报,1996.10

[3]郭祥昊、钟义信,杨雨,基于两字词簇的流语快速自动分词算法,情报学报,1998.5

[4]姚天顺,张桂平等,基于规则的汉语自动分词系统,中文信息学报,1990.1

[5]黄昌宁,中文信息处理中的分词问题,语言文字应用,1997.1

基本信息:

中图分类号:TP391.1

引用信息:

[1]郭辉,苏中义,王文 ,崔骏.一种改进的MM分词算法[J].微型电脑应用,2002(01):13-15+2.

发布时间:

2002-01-20

出版时间:

2002-01-20

检 索 高级检索

引用

GB/T 7714-2015 格式引文
MLA格式引文
APA格式引文