Quote:
引用第12楼zc1984于04-22-2007 18:22发表的:
那么蝈蝈说的很消耗时间的问题是什么?
使用具体的代码跑过测试了么?
我这里根据HMM做出来的分词速度还是可以的哈~~
.......
HMM理论上比较成功了........
实现是另外一个问题
向刚开始用MLE来初始化观测概率就比较费时间
我现在的想法是可不可以先建一个这个的库,然后在读入
forward只是用来检验HMM训练的,根据设定阀值的大小不知要计算多少次
另外数据平滑中Katz也比较费时间........这里也有2个参数需要估计
//-------------------------------------------------------------
目前这些还没有搞定
..................估计还需要很长时间
网上所谓的分词,即使说是基于HMM的,那也是伪的,包括
AdvancedChineseAnalyze 的Lucene.Net.Analysis.China.dll
这里面的MLE估计是事先整好的
..........................