Python TreeDict.feature_set方法代码示例

本文整理汇总了Python中treedict.TreeDict.feature_set方法的典型用法代码示例。如果您正苦于以下问题：Python TreeDict.feature_set方法的具体用法？Python TreeDict.feature_set怎么用？Python TreeDict.feature_set使用的例子？那么恭喜您, 这里精选的方法代码示例或许可以为您提供帮助。您也可以进一步了解该方法所在类treedict.TreeDict的用法示例。

在下文中一共展示了TreeDict.feature_set方法的2个代码示例，这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞，您的评价将有助于系统推荐出更棒的Python代码示例。

示例1: prepDataSet

# 需要导入模块: from treedict import TreeDict [as 别名]
# 或者: from treedict.TreeDict import feature_set [as 别名]
def prepDataSet(csv_filename, feature_set=None, dataset_name='generic dataset',
        ddg_cutoff=0.0, truncate=False):
    '''
    prepares a data set object from a CSV file, under the conventions of this project:
    - the CSV is indexed by PDBID and residue number (columns 0,1)
    - the last column contains label-related data, mostly ddG values of residues.
    - all other columns are feature columns.

    The function reads the columns into a TreeDict structure, such that each component
    (normalized feature data, labels, PDB identifiers, columns used) is accessible as 
    an attribute.

    ``dataset_name`` is optional, giving the TreeDict a name.
    Optional argument ``features`` directs the function which features to select from 
    the table. By default, all features are selected.
    '''
    
    dataset = TreeDict(dataset_name)
    dataset.csv_filename = os.path.abspath(csv_filename)
    dataset.is_bound = (csv_filename.find('unbound') == -1)
    dataset._df = cached_csv_df(csv_filename, index_col=[0,1],
            true_values=['True'],
            false_values=['False'],
            )
    
    if truncate:
        dataset._df = dataset._df[:DEBUG_DATASET_SIZE]
    
    if feature_set is None:
        cols = dataset._df.columns[:-1]
        dataset.feature_set = FeatureSet(cols, cols)
    else:
        dataset.feature_set = feature_set
    
    all_feature_data_df = dataset._df.ix[:,dataset.feature_set.all_features]
    
    dataset.feature_data_df = all_feature_data_df.ix[:,dataset.feature_set.features]
    #dataset.X = dataset.feature_data_df.values 
    dataset.X = sklearn.preprocessing.scale(
                    dataset.feature_data_df.values.astype(float))
    
    dataset.label_data_df = dataset._df.ix[:,-1]
    dataset.ddg_cutoff = ddg_cutoff
    dataset.y = dataset.label_data_df.values > dataset.ddg_cutoff
    
    # sanity checks
    assert dataset.X.shape[0] == len(dataset.y)
    
    dataset.pdbs = dataset.feature_data_df.index.get_level_values(0)
    
    return dataset

开发者ID:asaladin，项目名称:peptalk，代码行数:53，代码来源:data.py

示例2: createConfig

# 需要导入模块: from treedict import TreeDict [as 别名]
# 或者: from treedict.TreeDict import feature_set [as 别名]
def createConfig(feature_set, train=None, test=None, title_meta=None):
    config = TreeDict('config')
    config.feature_set = feature_set
    config.bound = 'bound.data.old.csv'
    config.unbound = 'unbound.data.old.csv'

    config.training = data.prepDataSet(train or config.unbound,
            feature_set=config.feature_set)
    config.testing = data.prepDataSet(test or config.bound, 
            feature_set=config.feature_set)
    
    config.title = feature_set.getTitle()
    #display(Latex(config.title))
    return config

开发者ID:acplus，项目名称:peptalk，代码行数:16，代码来源:config.py

注：本文中的treedict.TreeDict.feature_set方法示例由纯净天空整理自Github/MSDocs等开源代码及文档管理平台，相关代码片段筛选自各路编程大神贡献的开源项目，源码版权归原作者所有，传播和使用请参考对应项目的License；未经允许，请勿转载。