下面是 ELasticsearch 自带的一些分析器:
名称 | 简介 |
---|---|
Standard Analyzer | 默认分词器,按词切分,小写处理(lowercase token filter),并支持删除停止词(默认关闭这个功能)。例如Is that Peter's cute-looking dog? 被解析成["is", "that", "peter's", "cute", "looking", "dog"] |
Simple Analyzer | 当遇到非字母的字符时切分。小写处理。例如Is that Peter's cute-looking dog? 被解析成["is", "that", "peter", "s", "cute", "looking", "dog"] |
Whitespace Analyzer | 每当遇到任何空白字符时切分词。没有小写处理。 |
Stop Analyzer | simple 增强,支持删除停止词。 |
Keyword Analyzer | 不切,原文直接输出 |
Pattern Analyzer | 使用正则表达式将文本分割,默认非字符分割(\W+)。小写处理,删除停止词。 |
Language Analyzers | 这里不是指一个叫做 Language 分词器,这里表示的 Elasticsearch提供了许多语言特定的分词器,比如 english 或 french。 |