Java TokenFilterFactory.create方法代碼示例

本文整理匯總了Java中org.elasticsearch.index.analysis.TokenFilterFactory.create方法的典型用法代碼示例。如果您正苦於以下問題：Java TokenFilterFactory.create方法的具體用法？Java TokenFilterFactory.create怎麽用？Java TokenFilterFactory.create使用的例子？那麽, 這裏精選的方法代碼示例或許可以為您提供幫助。您也可以進一步了解該方法所在類org.elasticsearch.index.analysis.TokenFilterFactory的用法示例。

在下文中一共展示了TokenFilterFactory.create方法的15個代碼示例，這些例子默認根據受歡迎程度排序。您可以為喜歡或者感覺有用的代碼點讚，您的評價將有助於係統推薦出更棒的Java代碼示例。

示例1: testOne

import org.elasticsearch.index.analysis.TokenFilterFactory; //導入方法依賴的package包/類
@Test
public void testOne() throws IOException {

    String source = "Das ist ein Bindestrich-Wort.";

    String[] expected = {
            "Das",
            "ist",
            "ein",
            "Bindestrich-Wort",
            "BindestrichWort",
            "Wort",
            "Bindestrich"
    };
    String resource = "org/xbib/elasticsearch/index/analysis/hyphen/hyphen_tokenizer.json";
    Tokenizer tokenizer = tokenizerFactory(resource, "my_hyphen_tokenizer").create();
    tokenizer.setReader(new StringReader(source));
    TokenFilterFactory tokenFilter = tokenFilterFactory(resource, "hyphen");
    TokenStream tokenStream = tokenFilter.create(tokenizer);
    assertSimpleTSOutput(tokenStream, expected);
}

開發者ID:jprante，項目名稱:elasticsearch-analysis-hyphen，代碼行數:22，代碼來源:HyphenTokenizerTests.java

示例2: testGermanNumberFormat

import org.elasticsearch.index.analysis.TokenFilterFactory; //導入方法依賴的package包/類
@Test
public void testGermanNumberFormat() throws IOException {

    String source = "Muss Rudi Völler fünftausend oder 10000 EUR Strafe zahlen?";

    String[] expected = {
            "Muss",
            "Rudi",
            "Völler",
            "fünftausend",
            "oder",
            "zehntausend",
            "EUR",
            "Strafe",
            "zahlen"
    };
    String resource = "org/xbib/elasticsearch/index/analysis/icu/icu_numberformat.json";
    Tokenizer tokenizer = tokenizerFactory(resource, "my_tokenizer").create();
    tokenizer.setReader(new StringReader(source));
    TokenFilterFactory tokenFilter = tokenFilterFactory(resource, "spellout_de");
    TokenStream tokenStream = tokenFilter.create(tokenizer);
    assertSimpleTSOutput(tokenStream, expected);
}

開發者ID:jprante，項目名稱:elasticsearch-plugin-bundle，代碼行數:24，代碼來源:IcuNumberFormatTests.java

示例3: testAmericanEnglish

import org.elasticsearch.index.analysis.TokenFilterFactory; //導入方法依賴的package包/類
@Test
public void testAmericanEnglish() throws IOException {

    String source = "You will never get 100,000 US dollars of salary per year.";

    String[] expected = {
            "You",
            "will",
            "never",
            "get",
            "onehundredthousand",
            "US",
            "dollars",
            "of",
            "salary",
            "per",
            "year"
    };
    String resource = "org/xbib/elasticsearch/index/analysis/icu/icu_numberformat.json";
    Tokenizer tokenizer = tokenizerFactory(resource, "my_tokenizer").create();
    tokenizer.setReader(new StringReader(source));
    TokenFilterFactory tokenFilter = tokenFilterFactory(resource,"spellout_en");
    TokenStream tokenStream = tokenFilter.create(tokenizer);
    assertSimpleTSOutput(tokenStream, expected);
}

開發者ID:jprante，項目名稱:elasticsearch-plugin-bundle，代碼行數:26，代碼來源:IcuNumberFormatTests.java

示例4: testOne

import org.elasticsearch.index.analysis.TokenFilterFactory; //導入方法依賴的package包/類
@Test
public void testOne() throws IOException {

    String source = "Das ist ein Bindestrich-Wort.";

    String[] expected = {
            "Das",
            "ist",
            "ein",
            "Bindestrich-Wort",
            "BindestrichWort",
            "Wort",
            "Bindestrich"
    };
    String resource = "org/xbib/elasticsearch/index/analysis/hyphen/hyphen_tokenizer.json";
    Tokenizer tokenizer = tokenizerFactory(resource, "my_hyphen_tokenizer").create();
    tokenizer.setReader(new StringReader(source));
    TokenFilterFactory tokenFilter = tokenFilterFactory(resource,"hyphen");
    TokenStream tokenStream = tokenFilter.create(tokenizer);
    assertSimpleTSOutput(tokenStream, expected);
}

開發者ID:jprante，項目名稱:elasticsearch-plugin-bundle，代碼行數:22，代碼來源:HyphenTokenizerTests.java

示例5: testOne

import org.elasticsearch.index.analysis.TokenFilterFactory; //導入方法依賴的package包/類
@Test
public void testOne() throws IOException {

    String source = "Das ist ein Bindestrich-Wort.";

    String[] expected = {
            "Das",
            "ist",
            "ein",
            "Bindestrich-Wort",
            "BindestrichWort",
            "Wort",
            "Bindestrich"
    };
    AnalysisService analysisService = createAnalysisService();
    Tokenizer tokenizer = analysisService.tokenizer("my_hyphen_tokenizer").create(new StringReader(source));
    TokenFilterFactory tokenFilter = analysisService.tokenFilter("hyphen");
    TokenStream tokenStream = tokenFilter.create(tokenizer);
    assertSimpleTSOutput(tokenStream, expected);
}

開發者ID:jprante，項目名稱:elasticsearch-analysis-german，代碼行數:21，代碼來源:HyphenTokenizerTests.java

示例6: testMetaphoneWords

import org.elasticsearch.index.analysis.TokenFilterFactory; //導入方法依賴的package包/類
@Test
public void testMetaphoneWords() throws Exception {
    Index index = new Index("test", "_na_");
    Settings settings = Settings.builder()
            .put(IndexMetaData.SETTING_VERSION_CREATED, Version.CURRENT)
            .put("index.analysis.filter.myStemmer.type", "br_metaphone")
            .build();

    AnalysisService analysisService = createAnalysisService(index, settings, new AnalysisMetaphonePlugin());

    TokenFilterFactory filterFactory = analysisService.tokenFilter("br_metaphone");

    Tokenizer tokenizer = new KeywordTokenizer();
    
    Map<String,String> words = buildWordList();
    
    Set<String> inputWords = words.keySet();
    for(String word : inputWords) {
        tokenizer.setReader(new StringReader(word));
        TokenStream ts = filterFactory.create(tokenizer);

        CharTermAttribute term1 = ts.addAttribute(CharTermAttribute.class);
        ts.reset();
        assertThat(ts.incrementToken(), equalTo(true));
        assertThat(term1.toString(), equalTo(words.get(word)));
        ts.close();
    }
}

開發者ID:anaelcarvalho，項目名稱:elasticsearch-analysis-metaphone_ptBR，代碼行數:29，代碼來源:MetaphoneTokenFilterTests.java

示例7: assertTokenFilter

import org.elasticsearch.index.analysis.TokenFilterFactory; //導入方法依賴的package包/類
private void assertTokenFilter(String name, Class<?> clazz) throws IOException {
    Settings settings = Settings.builder()
                           .put(IndexMetaData.SETTING_VERSION_CREATED, Version.CURRENT)
                           .put(Environment.PATH_HOME_SETTING.getKey(), createTempDir().toString()).build();
    TestAnalysis analysis = AnalysisTestsHelper.createTestAnalysisFromSettings(settings);
    TokenFilterFactory tokenFilter = analysis.tokenFilter.get(name);
    Tokenizer tokenizer = new WhitespaceTokenizer();
    tokenizer.setReader(new StringReader("foo bar"));
    TokenStream stream = tokenFilter.create(tokenizer);
    assertThat(stream, instanceOf(clazz));
}

開發者ID:justor，項目名稱:elasticsearch_my，代碼行數:12，代碼來源:AnalysisModuleTests.java

示例8: createComponents

import org.elasticsearch.index.analysis.TokenFilterFactory; //導入方法依賴的package包/類
@Override
protected TokenStreamComponents createComponents(String fieldName) {
    Tokenizer tokenizer = tokenizerFactory.create();
    TokenStream tokenStream = tokenizer;
    for (TokenFilterFactory tokenFilter : Arrays.asList(stdnumTokenFilterFactory, uniqueTokenFilterFactory)) {
        tokenStream = tokenFilter.create(tokenStream);
    }
    return new TokenStreamComponents(tokenizer, tokenStream);
}

開發者ID:jprante，項目名稱:elasticsearch-plugin-bundle，代碼行數:10，代碼來源:StandardnumberAnalyzer.java