Class DutchAnalyzer

Analyzer for Dutch language.

Supports an external list of stopwords (words that will not be indexed at all), an external list of exclusions (word that will not be stemmed, but indexed) and an external list of word-stem pairs that overrule the algorithm (dictionary stemming). A default set of stopwords is used unless an alternative list is specified, but the exclusion list is empty by default.

You must specify the required LuceneVersion compatibility when creating DutchAnalyzer:

As of 3.6, DutchAnalyzer(LuceneVersion, CharArraySet) and DutchAnalyzer(LuceneVersion, CharArraySet, CharArraySet) also populate the default entries for the stem override dictionary
As of 3.1, Snowball stemming is done with SnowballFilter, LowerCaseFilter is used prior to StopFilter, and Snowball stopwords are used by default.
As of 2.9, StopFilter preserves position increments

NOTE: This class uses the same LuceneVersion dependent settings as StandardAnalyzer.

Inheritance

System.Object

Analyzer

DutchAnalyzer

Inherited Members

Lucene.Net.Analysis.Analyzer.NewAnonymous(System.Func<System.String, System.IO.TextReader, Lucene.Net.Analysis.TokenStreamComponents>)

Lucene.Net.Analysis.Analyzer.NewAnonymous(System.Func<System.String, System.IO.TextReader, Lucene.Net.Analysis.TokenStreamComponents>, Lucene.Net.Analysis.ReuseStrategy)

Lucene.Net.Analysis.Analyzer.NewAnonymous(System.Func<System.String, System.IO.TextReader, Lucene.Net.Analysis.TokenStreamComponents>, System.Func<System.String, System.IO.TextReader, System.IO.TextReader>)

Lucene.Net.Analysis.Analyzer.GetTokenStream(System.String, System.IO.TextReader)

Analyzer.GetTokenStream(String, String)

Lucene.Net.Analysis.Analyzer.InitReader(System.String, System.IO.TextReader)

Analyzer.GetPositionIncrementGap(String)

Analyzer.GetOffsetGap(String)

Analyzer.Strategy

Analyzer.Dispose()

Lucene.Net.Analysis.Analyzer.GetObjectData(System.Runtime.Serialization.SerializationInfo, System.Runtime.Serialization.StreamingContext)

Analyzer.GLOBAL_REUSE_STRATEGY

Analyzer.PER_FIELD_REUSE_STRATEGY

System.Object.ToString()

System.Object.Equals(System.Object)

System.Object.Equals(System.Object, System.Object)

System.Object.ReferenceEquals(System.Object, System.Object)

System.Object.GetHashCode()

System.Object.GetType()

System.Object.MemberwiseClone()

Assembly: Lucene.Net.Analysis.Common.dll

Syntax

[Serializable]
public sealed class DutchAnalyzer : Analyzer, IDisposable

Constructors

Name	Description
DutchAnalyzer(LuceneVersion)	Builds an analyzer with the default stop words (DefaultStopSet) and a few default entries for the stem exclusion table.
DutchAnalyzer(LuceneVersion, CharArraySet)
DutchAnalyzer(LuceneVersion, CharArraySet, CharArraySet)
DutchAnalyzer(LuceneVersion, CharArraySet, CharArraySet, CharArrayMap<String>)

Fields

Name	Description
DEFAULT_STOPWORD_FILE	File containing default Dutch stopwords.

Properties

Name	Description
DefaultStopSet	Returns an unmodifiable instance of the default stop-words set.

Methods

Name	Description
CreateComponents(String, TextReader)	Returns a (possibly reused) TokenStream which tokenizes all the text in the provided System.IO.TextReader.

Extension Methods

Number.IsNumber(Object)

SystemTypesHelpers.toString(Object)

SystemTypesHelpers.equals(Object, Object)