当前位置: 首页>>代码示例>>Java>>正文


Java TextCorpusStored.createTokensLayer方法代码示例

本文整理汇总了Java中eu.clarin.weblicht.wlfxb.tc.xb.TextCorpusStored.createTokensLayer方法的典型用法代码示例。如果您正苦于以下问题:Java TextCorpusStored.createTokensLayer方法的具体用法?Java TextCorpusStored.createTokensLayer怎么用?Java TextCorpusStored.createTokensLayer使用的例子?那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在eu.clarin.weblicht.wlfxb.tc.xb.TextCorpusStored的用法示例。


在下文中一共展示了TextCorpusStored.createTokensLayer方法的6个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于系统推荐出更棒的Java代码示例。

示例1: createTestTextCorpus

import eu.clarin.weblicht.wlfxb.tc.xb.TextCorpusStored; //导入方法依赖的package包/类
private TextCorpusStored createTestTextCorpus() {
    TextCorpusStored textCorpus = new TextCorpusStored("de");
    String text = "<ähm> ich würde diesmal sagen Theater das ist dann immer so aufge in letzter "
            + "Minute so was spielt man heute abend ich wäre eher dafür daß wir vielleicht ins Kino "
            + "gehen und nachher irgendwo in eine nette Kneipe";
    textCorpus.createTextLayer().addText(text);
    TokensLayer tokensLayer = textCorpus.createTokensLayer();
    String[] tokenStrings = ("<ähm> ich würde diesmal sagen Theater das ist dann immer so aufge in letzter "
            + "Minute so was spielt man heute abend ich wäre eher dafür daß wir vielleicht ins Kino "
            + "gehen und nachher irgendwo in eine nette Kneipe").split(" ");
    List<Token> tokens = new ArrayList<Token>();
    for (String tokenString : tokenStrings) {
        Token token = tokensLayer.addToken(tokenString);
        tokens.add(token);
    }
    return textCorpus;
}
 
开发者ID:weblicht,项目名称:wlfxb,代码行数:18,代码来源:WLDObjector2Test.java

示例2: createTestTextCorpus

import eu.clarin.weblicht.wlfxb.tc.xb.TextCorpusStored; //导入方法依赖的package包/类
private TextCorpusStored createTestTextCorpus() {
    TextCorpusStored textCorpus = new TextCorpusStored("en");
    String text = "This is a test. This is the second sentence."; // 0-15, 16-44
    textCorpus.createTextLayer().addText(text);
    TokensLayer tokensLayer = textCorpus.createTokensLayer();
    String[] tokenStrings = "This is a test . This is the second sentence .".split(" ");
    List<Token> tokens = new ArrayList<Token>();
    for (String tokenString : tokenStrings) {
        Token token = tokensLayer.addToken(tokenString);
        tokens.add(token);
    }
    SentencesLayer sentencesLayer = textCorpus.createSentencesLayer();
    sentencesLayer.addSentence(tokens.subList(0, 5), 0, 15);
    sentencesLayer.addSentence(tokens.subList(5, 11), 16, 44);
    return textCorpus;
}
 
开发者ID:weblicht,项目名称:wlfxb,代码行数:17,代码来源:WLDObjectorTest.java

示例3: TCFWriter

import eu.clarin.weblicht.wlfxb.tc.xb.TextCorpusStored; //导入方法依赖的package包/类
public TCFWriter(Writer writer, String language, boolean lemmas, Optional<String> posTagset,
                 Optional<String> dependencyTagset) {
    corpusWriter = writer;
    corpus = new TextCorpusStored(language);
    sentencesLayer = corpus.createSentencesLayer();
    tokensLayer = corpus.createTokensLayer();
    lemmasLayer = lemmas ? corpus.createLemmasLayer() : null;
    posTagsLayer = posTagset.isPresent() ? corpus.createPosTagsLayer(posTagset.get()) : null;
    dependencyLayer = dependencyTagset.isPresent() ?
            corpus.createDependencyParsingLayer(dependencyTagset.get(), true, false) : null;
}
 
开发者ID:weblicht,项目名称:conll-utils,代码行数:12,代码来源:TCFWriter.java

示例4: testReadWrite

import eu.clarin.weblicht.wlfxb.tc.xb.TextCorpusStored; //导入方法依赖的package包/类
@Test
public void testReadWrite() throws Exception {

    TextCorpusStored tc = new TextCorpusStored("de");
    MetaData md = new MetaData();
    //WLData data = new WLData(tc);

    String outfile = testFolder.getRoot() + File.separator + OUTPUT_FILE;
    File ofile = new File(outfile);

    TextLayer text = tc.createTextLayer();
    text.addText("Peter aß eine Käsepizza. Sie schmeckte ihm.");
    TokensLayer tokens = tc.createTokensLayer();
    for (String tokenString : tokenstrings) {
        tokens.addToken(tokenString);
    }
    TextStructureLayer textstructure = tc.createTextStructureLayer();
    TextSpan parentSpan = textstructure.addSpan(tokens.getToken(0), tokens.getToken(4), "page");
    
    textstructure.addSpan(parentSpan, null, null, "number", "1");
    
    textstructure.addSpan(null, null, "line");
    textstructure.addSpan(tokens.getToken(0), tokens.getToken(8), "paragraph", 0, 45);
    textstructure.addSpan(tokens.getToken(0), tokens.getToken(2), "line", 0, 13);
    textstructure.addSpan(tokens.getToken(3), tokens.getToken(4), "line", 14, 25);
    textstructure.addSpan(tokens.getToken(5), tokens.getToken(8), "page", 26, 45);
    textstructure.addSpan(tokens.getToken(5), tokens.getToken(6), "line", 26, 39);
    textstructure.addSpan(tokens.getToken(7), tokens.getToken(8), "line", 40, 45);
    textstructure.addSpan(null, null, "line");

    WLDObjector.write(md, tc, ofile, false);

    System.out.println(tc);
    // compare output xml with expected xml
    assertEqualXml(EXPECTED_OUTPUT_FILE, outfile);
}
 
开发者ID:weblicht,项目名称:wlfxb,代码行数:37,代码来源:TextCorpusTextStructureTest.java

示例5: queryCorporaAndAddMatchesToTextCorpus

import eu.clarin.weblicht.wlfxb.tc.xb.TextCorpusStored; //导入方法依赖的package包/类
private void queryCorporaAndAddMatchesToTextCorpus(TextCorpusStored tc) {

        Map<String, String> token2StrId = new LinkedHashMap<String, String>();


        token2StrId.put("Peter", "5-1023");
        token2StrId.put("aß", "5-1024");
        token2StrId.put("eine", "5-1025");
        token2StrId.put("Käsepizza", "5-1026");
        token2StrId.put(".", "5-1027");
        token2StrId.put("Sie", "16-116");
        token2StrId.put("schmeckte", "16-117");
        token2StrId.put("ihm", "16-118");


        TokensLayer tokensLayer = tc.createTokensLayer();
        MatchesLayer matchesLayer = tc.createMatchesLayer("sqp", "tb_lemma=\"Peter\" | tb_lemma=\"schmecken\"");
        MatchedCorpus corpus = matchesLayer.addCorpus("wcorp-1", "some-pid");
        for (String t : token2StrId.keySet()) {
            Token token = tokensLayer.addToken(t);
            if (t.equals("Peter") || t.equals("schmeckte")) {
                Map<String, String> targets = new HashMap<String, String>();
                targets.put("tname", token.getID());
                Map<String, String> cats = new HashMap<String, String>();
                cats.put("cname", "cval");
                List<Token> refToks = Arrays.asList(new Token[]{token});
                List<String> refOrigToks = Arrays.asList(new String[]{token2StrId.get(t)});
                matchesLayer.addItem(corpus,
                        refToks,
                        refOrigToks,
                        targets, cats);
            }
        }
    }
 
开发者ID:weblicht,项目名称:wlfxb,代码行数:35,代码来源:TextCorpusMatchesTest.java

示例6: createTestTextCorpus

import eu.clarin.weblicht.wlfxb.tc.xb.TextCorpusStored; //导入方法依赖的package包/类
private TextCorpusStored createTestTextCorpus() {
    TextCorpusStored textCorpus = new TextCorpusStored("en");
    textCorpus.createTextLayer();
    textCorpus.createTokensLayer();
    textCorpus.createSentencesLayer();
    textCorpus.createPosTagsLayer("Tiger");
    return textCorpus;
}
 
开发者ID:weblicht,项目名称:wlfxb,代码行数:9,代码来源:WLDObjectorEmptyLayersTest.java


注:本文中的eu.clarin.weblicht.wlfxb.tc.xb.TextCorpusStored.createTokensLayer方法示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。