第22卷第3期计算机技术与发展V0l_22 No.3
2012年3月computertechnologyanddevelopmentmar.2012
混合模拟退火遗传算法与
hmm web挖掘
dddlh,曾经的战斗机
(南华大学计算机科学技术学院,湖南衡阳421001 )。
摘要:隐马尔可夫模型训练算法是一种局部搜索算法,对初始值敏感。 传统方法多采用随机参数训练隐马尔可夫模型
陷入局部最优,在Web挖掘中的应用效果不佳。 遗传算法具有较强的全局搜索能力,但容易早熟、收敛慢,模拟退火算法
具有很好的本地搜索能力,但随机漫游,缺乏全局搜索能力。 综合考虑遗传算法和模拟退火算法的特点,提出混合模拟退火
遗传算法SGA优化了HMM的初始参数,弥补了对Baum—Welch算法初始参数敏感的缺点,Web挖掘的实验结果表明有5个域提取
的kwdggx和PRE有明显的提高。
关键词:模拟退火算法遗传算法; 隐马尔可夫模型; Web挖掘
中图分类编号: TP391文献识别码: a文章编号: 1673-629x(2012 ) 03—0106—04
webminingbasedonhybridsimulatedannealing
通用algorithm和hmm
ZOULa-mei,贡巷-建
(schoolofcomputerscienceandtechnology,UniversityofSouthChina,Hengynag421001,China )
abstract:thetrainingalgorithmwhichisusedtotraininghmmisasub-optimalgorithmandsensitivetoinitialparameters.typical
hiddenmrakovmodeloftenleadstosub-optimalwhentrainingitwithrandomparmaeters.itineffectivewhenminingwebinformation
wimtypicalhm.gahashteexcellentabmtyofglobalsearchingnadhashtedefectofslowconvergencerate.sahashteeexcellentabil—
ityoflocalsearchingnadhashtedefectofrandomlyroaming.ticombinestheadvantagesofgeneticalgorithmandsimulatednanealingal -
gorithm,proposeshybridsimulatednanealinggeneticalgorihtm (SGA ).sgachoosesthebestsgaparametersbyexperimentandoptimi -
zshmmcombiningbaum-welchduringhtecourseofwebmining.theexperimentalresetsshowhtathtesgasignificantlyimproves
theperfomrnaceinprecisionnadrecal 1。
keywords:simulatednanealingalgorithm; 通用语言; hiddenMarkovmodel; W ebmining
o引用网络的大部分信息是未处理的文本数据,使用的是HMM
随着互联网的发展,进入Web2.0时代,Web已经进行Web挖掘是一种基于统计学习的方法。 因为…
信息制造、发布、正面