这篇文章主要为大家详细介绍了Python nltk 之 snowball 提取词干的简单示例,具有一定的参考价值,可以用来参考一下。
对python这个高级语言感兴趣的小伙伴,下面一起跟随四海网的小编两巴掌来看看吧!
机器学习中很重要的应用场景就是机器自动分类,而分类的关键是词干提取。所以我们要用到snowball。
下面说一下snowball 提取词干的两种方法。
两种方法:
方法一:
# 来自www.q1010.com
>>> from nltk import SnowballStemmer
>>> SnowballStemmer.languages # See which languages are supported
('danish', 'dutch', 'english', 'finnish', 'french', 'german', 'hungarian',
'italian', 'norwegian', 'porter', 'portuguese", 'romanian',
'russian', 'spanish', 'swedish')
>>> stemmer = SnowballStemmer("german") # Choose a language
>>> stemmer.stem(u"Autobahnen") # Stem a word
u'autobahn'
# End www_512pic_com
但是当你知道你使用的语言场景的时候可以使用下面的方法直接调用:
# 来自www.q1010.com
>>> ps = nltk.stem.snowball.PortugueseStemmer()
>>> ps.stem('celular')
u'celul'
>>> ps.stem('celular')
u'celul'
# End www_512pic_com
本文来自:http://www.q1010.com/181/2284-0.html
注:关于Python nltk 之 snowball 提取词干的简单示例的内容就先介绍到这里,更多相关文章的可以留意四海网的其他信息。
关键词:nltk,snowball
四海网收集整理一些常用的php代码,JS代码,数据库mysql等技术文章。