Class HMMChineseTokenizerFactory

Factory for HMMChineseTokenizer

Note: this class will currently emit tokens for punctuation. So you should either add a WordDelimiterFilter after to remove these (with concatenate off), or use the SmartChinese stoplist with a StopFilterFactory via:

words="org/apache/lucene/analysis/cn/smart/stopwords.txt"

@lucene.experimental

Inheritance

System.Object

AbstractAnalysisFactory

TokenizerFactory

HMMChineseTokenizerFactory

Inherited Members

TokenizerFactory.ForName(String, IDictionary<String, String>)

TokenizerFactory.LookupClass(String)

TokenizerFactory.AvailableTokenizers

TokenizerFactory.ReloadTokenizers()

TokenizerFactory.Create(TextReader)

TokenizerFactory.Create(AttributeSource.AttributeFactory, TextReader)

AbstractAnalysisFactory.LUCENE_MATCH_VERSION_PARAM

AbstractAnalysisFactory.m_luceneMatchVersion

AbstractAnalysisFactory.OriginalArgs

AbstractAnalysisFactory.AssureMatchVersion()

AbstractAnalysisFactory.LuceneMatchVersion

AbstractAnalysisFactory.Require(IDictionary<String, String>, String)

AbstractAnalysisFactory.Require(IDictionary<String, String>, String, ICollection<String>)

AbstractAnalysisFactory.Require(IDictionary<String, String>, String, ICollection<String>, Boolean)

AbstractAnalysisFactory.Get(IDictionary<String, String>, String, String)

AbstractAnalysisFactory.Get(IDictionary<String, String>, String, ICollection<String>)

AbstractAnalysisFactory.Get(IDictionary<String, String>, String, ICollection<String>, String)

AbstractAnalysisFactory.Get(IDictionary<String, String>, String, ICollection<String>, String, Boolean)

AbstractAnalysisFactory.RequireInt32(IDictionary<String, String>, String)

AbstractAnalysisFactory.GetInt32(IDictionary<String, String>, String, Int32)

AbstractAnalysisFactory.RequireBoolean(IDictionary<String, String>, String)

AbstractAnalysisFactory.GetBoolean(IDictionary<String, String>, String, Boolean)

AbstractAnalysisFactory.RequireSingle(IDictionary<String, String>, String)

AbstractAnalysisFactory.GetSingle(IDictionary<String, String>, String, Single)

AbstractAnalysisFactory.RequireChar(IDictionary<String, String>, String)

AbstractAnalysisFactory.GetChar(IDictionary<String, String>, String, Char)

AbstractAnalysisFactory.GetSet(IDictionary<String, String>, String)

AbstractAnalysisFactory.GetPattern(IDictionary<String, String>, String)

AbstractAnalysisFactory.GetCulture(IDictionary<String, String>, String, CultureInfo)

AbstractAnalysisFactory.GetWordSet(IResourceLoader, String, Boolean)

AbstractAnalysisFactory.GetLines(IResourceLoader, String)

AbstractAnalysisFactory.GetSnowballWordSet(IResourceLoader, String, Boolean)

AbstractAnalysisFactory.SplitFileNames(String)

AbstractAnalysisFactory.GetClassArg()

AbstractAnalysisFactory.IsExplicitLuceneMatchVersion

Assembly: Lucene.Net.Analysis.SmartCn.dll

Syntax

public sealed class HMMChineseTokenizerFactory : TokenizerFactory

Constructors

Name	Description
HMMChineseTokenizerFactory(IDictionary<String, String>)	Creates a new HMMChineseTokenizerFactory

Methods

Name	Description
Create(AttributeSource.AttributeFactory, TextReader)

Extension Methods

Number.IsNumber(Object)

SystemTypesHelpers.toString(Object)

SystemTypesHelpers.equals(Object, Object)