Built-in Analyzers

下面是 ELasticsearch 自带的一些分析器:

名称 简介
Standard Analyzer 默认分词器,按词切分,小写处理(lowercase token filter),并支持删除停止词(默认关闭这个功能)。例如Is that Peter's cute-looking dog?被解析成["is", "that", "peter's", "cute", "looking", "dog"]
Simple Analyzer 当遇到非字母的字符时切分。小写处理。例如Is that Peter's cute-looking dog?被解析成["is", "that", "peter", "s", "cute", "looking", "dog"]
Whitespace Analyzer 每当遇到任何空白字符时切分词。没有小写处理。
Stop Analyzer simple 增强,支持删除停止词。
Keyword Analyzer 不切,原文直接输出
Pattern Analyzer 使用正则表达式将文本分割,默认非字符分割(\W+)。小写处理,删除停止词。
Language Analyzers 这里不是指一个叫做 Language 分词器,这里表示的 Elasticsearch提供了许多语言特定的分词器,比如 english 或 french。