Python nltk.TreebankWordTokenizer方法代码示例

本文整理汇总了Python中nltk.TreebankWordTokenizer方法的典型用法代码示例。如果您正苦于以下问题：Python nltk.TreebankWordTokenizer方法的具体用法？Python nltk.TreebankWordTokenizer怎么用？Python nltk.TreebankWordTokenizer使用的例子？那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在类nltk的用法示例。

在下文中一共展示了nltk.TreebankWordTokenizer方法的4个代码示例，这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞，您的评价将有助于系统推荐出更棒的Python代码示例。

示例1: init

# 需要导入模块: import nltk [as 别名]
# 或者: from nltk import TreebankWordTokenizer [as 别名]
def __init__(self):
    self._word_tokenizer = nltk.TreebankWordTokenizer()
    if FLAGS.punkt_tokenizer_file is not None:
      self._sent_tokenizer = py_utils.load_pickle(FLAGS.punkt_tokenizer_file)
    else:
      self._sent_tokenizer = nltk.load("tokenizers/punkt/english.pickle")

开发者ID:google-research，项目名称:language，代码行数:8，代码来源:tokenization.py

示例2: _treebank_en

# 需要导入模块: import nltk [as 别名]
# 或者: from nltk import TreebankWordTokenizer [as 别名]
def _treebank_en(self, text):
        if self.word_tokenizer is None:
            import nltk

            self.word_tokenizer = nltk.TreebankWordTokenizer()

        return [
            token.replace("''", '"').replace("``", '"')
            for token in self.word_tokenizer.tokenize(text)
        ]

开发者ID:naver，项目名称:claf，代码行数:12，代码来源:word.py

示例3: tokenize

# 需要导入模块: import nltk [as 别名]
# 或者: from nltk import TreebankWordTokenizer [as 别名]
def tokenize(self, text):

        return TreebankWordTokenizer().tokenize(text)

开发者ID:adhaamehab，项目名称:textblob-ar，代码行数:5，代码来源:tokenizer.py

示例4: init

# 需要导入模块: import nltk [as 别名]
# 或者: from nltk import TreebankWordTokenizer [as 别名]
def __init__(self):
        self.sent_tokenzier = nltk.load('tokenizers/punkt/english.pickle')
        self.word_tokenizer = nltk.TreebankWordTokenizer()

开发者ID:allenai，项目名称:document-qa，代码行数:5，代码来源:text_utils.py

注：本文中的nltk.TreebankWordTokenizer方法示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台，相关代码片段筛选自各路编程大神贡献的开源项目，源码版权归原作者所有，传播和使用请参考对应项目的License；未经允许，请勿转载。

示例1: __init__

示例2: _treebank_en

示例3: tokenize

示例4: __init__

示例1: init

示例4: init