當前位置: 首頁>>代碼示例>>Python>>正文


Python cmd_util.atari_arg_parser方法代碼示例

本文整理匯總了Python中baselines.common.cmd_util.atari_arg_parser方法的典型用法代碼示例。如果您正苦於以下問題:Python cmd_util.atari_arg_parser方法的具體用法?Python cmd_util.atari_arg_parser怎麽用?Python cmd_util.atari_arg_parser使用的例子?那麽, 這裏精選的方法代碼示例或許可以為您提供幫助。您也可以進一步了解該方法所在baselines.common.cmd_util的用法示例。


在下文中一共展示了cmd_util.atari_arg_parser方法的9個代碼示例,這些例子默認根據受歡迎程度排序。您可以為喜歡或者感覺有用的代碼點讚,您的評價將有助於係統推薦出更棒的Python代碼示例。

示例1: main

# 需要導入模塊: from baselines.common import cmd_util [as 別名]
# 或者: from baselines.common.cmd_util import atari_arg_parser [as 別名]
def main():
    args = atari_arg_parser().parse_args()
    logger.configure()
    train(args.env, num_timesteps=args.num_timesteps, seed=args.seed, num_cpu=32) 
開發者ID:Hwhitetooth,項目名稱:lirpg,代碼行數:6,代碼來源:run_atari.py

示例2: main

# 需要導入模塊: from baselines.common import cmd_util [as 別名]
# 或者: from baselines.common.cmd_util import atari_arg_parser [as 別名]
def main():
    args = atari_arg_parser().parse_args()
    train(args.env, num_timesteps=args.num_timesteps, seed=args.seed) 
開發者ID:Hwhitetooth,項目名稱:lirpg,代碼行數:5,代碼來源:run_atari.py

示例3: main

# 需要導入模塊: from baselines.common import cmd_util [as 別名]
# 或者: from baselines.common.cmd_util import atari_arg_parser [as 別名]
def main():
    parser = atari_arg_parser()
    parser.add_argument('--policy', help='Policy architecture', choices=['cnn', 'lstm', 'lnlstm'], default='cnn')
    args = parser.parse_args()
    logger.configure()
    train(args.env, num_timesteps=args.num_timesteps, seed=args.seed,
        policy=args.policy) 
開發者ID:Hwhitetooth,項目名稱:lirpg,代碼行數:9,代碼來源:run_atari.py

示例4: main

# 需要導入模塊: from baselines.common import cmd_util [as 別名]
# 或者: from baselines.common.cmd_util import atari_arg_parser [as 別名]
def main():
    parser = atari_arg_parser()
    parser.add_argument('--policy', help='Policy architecture', choices=['cnn', 'lstm', 'lnlstm'], default='cnn')
    parser.add_argument('--lrschedule', help='Learning rate schedule', choices=['constant', 'linear'], default='constant')
    parser.add_argument('--logdir', help ='Directory for logging')
    args = parser.parse_args()
    logger.configure(args.logdir)
    train(args.env, num_timesteps=args.num_timesteps, seed=args.seed,
          policy=args.policy, lrschedule=args.lrschedule, num_cpu=16) 
開發者ID:Hwhitetooth,項目名稱:lirpg,代碼行數:11,代碼來源:run_atari.py

示例5: main

# 需要導入模塊: from baselines.common import cmd_util [as 別名]
# 或者: from baselines.common.cmd_util import atari_arg_parser [as 別名]
def main():
    parser = atari_arg_parser()
    parser.add_argument('--policy', help='Policy architecture', choices=['cnn', 'lstm', 'lnlstm'], default='cnn')
    parser.add_argument('--lrschedule', help='Learning rate schedule', choices=['constant', 'linear'], default='constant')
    args = parser.parse_args()
    logger.configure()
    train(args.env, num_timesteps=args.num_timesteps, seed=args.seed,
        policy=args.policy, lrschedule=args.lrschedule, num_env=16) 
開發者ID:bowenliu16,項目名稱:rl_graph_generation,代碼行數:10,代碼來源:run_atari.py

示例6: main

# 需要導入模塊: from baselines.common import cmd_util [as 別名]
# 或者: from baselines.common.cmd_util import atari_arg_parser [as 別名]
def main():
    parser = atari_arg_parser()
    parser.add_argument('--policy', help='Policy architecture', choices=['cnn', 'lstm', 'lnlstm'], default='cnn')
    parser.add_argument('--lrschedule', help='Learning rate schedule', choices=['constant', 'linear'], default='constant')
    parser.add_argument('--hparams_path', help='Load json hparams from this file', type=str, default='')

    parser.add_argument('--gpu_num', help='cuda gpu #', type=str, default='')

    args = parser.parse_args()

    with open(args.hparams_path, 'r') as f:
        hparams = json.load(f)

    if args.gpu_num:
        assert(int(args.gpu_num) >= -1 and int(args.gpu_num) <= 8)
        os.environ['CUDA_VISIBLE_DEVICES'] = args.gpu_num
    elif 'gpu_num' in hparams:
        os.environ['CUDA_VISIBLE_DEVICES'] = str(hparams.get('gpu_num'))

    log_path = os.path.join(hparams['base_dir'], 'logs', hparams['experiment_name'])

    print('experiment_params: {}'.format(hparams))
    print('chosen env: {}'.format(hparams['env_id']))

    seed = 0
    if hparams.get('atari_seed'): seed = hparams['atari_seed']

    logger.configure(dir=log_path)
    train(
        env_id=hparams['env_id'],
        num_timesteps=hparams['total_timesteps'],
        seed=seed,
        policy=hparams['policy'],
        lrschedule=args.lrschedule,
        num_env=hparams['num_env'],
        ckpt_path=hparams['restore_from_ckpt_path'],
        hparams=hparams,
    ) 
開發者ID:vik-goel,項目名稱:MOREL,代碼行數:40,代碼來源:run_atari.py

示例7: main

# 需要導入模塊: from baselines.common import cmd_util [as 別名]
# 或者: from baselines.common.cmd_util import atari_arg_parser [as 別名]
def main():
    parser = atari_arg_parser()
    parser.add_argument('--hparams_path', help='Load json hparams from this file', type=str, default='')
    parser.add_argument('--gpu_num', help='cuda gpu #', type=str, default='')

    args = parser.parse_args()

    with open(args.hparams_path, 'r') as f:
        hparams = json.load(f)

    if args.gpu_num:
        assert(int(args.gpu_num) >= -1 and int(args.gpu_num) <= 8)
        os.environ['CUDA_VISIBLE_DEVICES'] = args.gpu_num
    elif 'gpu_num' in hparams:
        os.environ['CUDA_VISIBLE_DEVICES'] = str(hparams.get('gpu_num'))

    log_path = os.path.join(hparams['base_dir'], 'logs', hparams['experiment_name'])
    logger.configure(dir=log_path)

    print('experiment_params: {}'.format(hparams))
    print('chosen env: {}'.format(hparams['env_id']))

    seed = 0
    if hparams.get('atari_seed'): seed = hparams['atari_seed']

    train(hparams['env_id'], num_timesteps=args.num_timesteps, seed=seed,
        policy=hparams['policy'], hparams=hparams) 
開發者ID:vik-goel,項目名稱:MOREL,代碼行數:29,代碼來源:run_atari.py

示例8: main

# 需要導入模塊: from baselines.common import cmd_util [as 別名]
# 或者: from baselines.common.cmd_util import atari_arg_parser [as 別名]
def main():
    parser = atari_arg_parser()
    parser.add_argument('--policy', help='Policy architecture', choices=['cnn', 'lstm', 'lnlstm', 'mlp'], default='cnn')
    args = parser.parse_args()
    logger.configure()
    train(args.env, num_timesteps=args.num_timesteps, seed=args.seed,
        policy=args.policy) 
開發者ID:flyyufelix,項目名稱:sonic_contest,代碼行數:9,代碼來源:run_atari.py

示例9: main

# 需要導入模塊: from baselines.common import cmd_util [as 別名]
# 或者: from baselines.common.cmd_util import atari_arg_parser [as 別名]
def main():
    parser = atari_arg_parser()
    parser.add_argument('--policy', help='Policy architecture', choices=['cnn', 'lstm', 'lnlstm'], default='cnn')
    parser.add_argument('--lrschedule', help='Learning rate schedule', choices=['constant', 'linear'], default='constant')
    parser.add_argument('--sil-update', type=int, default=4, help="Number of updates per iteration")
    parser.add_argument('--sil-beta', type=float, default=0.1, help="Beta for weighted IS")
    parser.add_argument('--log', default='/tmp/a2c')
    args = parser.parse_args()
    logger.configure(dir=args.log)
    train(args.env, num_timesteps=args.num_timesteps, seed=args.seed,
        policy=args.policy, lrschedule=args.lrschedule, 
        sil_update=args.sil_update, sil_beta=args.sil_beta,
        num_env=16) 
開發者ID:junhyukoh,項目名稱:self-imitation-learning,代碼行數:15,代碼來源:run_atari_sil.py


注:本文中的baselines.common.cmd_util.atari_arg_parser方法示例由純淨天空整理自Github/MSDocs等開源代碼及文檔管理平台,相關代碼片段篩選自各路編程大神貢獻的開源項目,源碼版權歸原作者所有,傳播和使用請參考對應項目的License;未經允許,請勿轉載。