3eb63a887b
stop words can be loaded from files/bytes, closes #19 stop words loaded for large list of languages, closes #20 defined language specific analyzers for as much as possible right now, closes #21 opened new issues for some of the remaining gaps
54 lines
556 B
Go
54 lines
556 B
Go
package stop_words_filter
|
|
|
|
// this content was obtained from:
|
|
// lucene-4.7.2/analysis/common/src/resources/org/apache/lucene/analysis/
|
|
// ` was changed to ' to allow for literal string
|
|
|
|
var ArmenianStopWords = []byte(`# example set of Armenian stopwords.
|
|
այդ
|
|
այլ
|
|
այն
|
|
այս
|
|
դու
|
|
դուք
|
|
եմ
|
|
են
|
|
ենք
|
|
ես
|
|
եք
|
|
է
|
|
էի
|
|
էին
|
|
էինք
|
|
էիր
|
|
էիք
|
|
էր
|
|
ըստ
|
|
թ
|
|
ի
|
|
ին
|
|
իսկ
|
|
իր
|
|
կամ
|
|
համար
|
|
հետ
|
|
հետո
|
|
մենք
|
|
մեջ
|
|
մի
|
|
ն
|
|
նա
|
|
նաև
|
|
նրա
|
|
նրանք
|
|
որ
|
|
որը
|
|
որոնք
|
|
որպես
|
|
ու
|
|
ում
|
|
պիտի
|
|
վրա
|
|
և
|
|
`)
|