虽然我们不知道大脑的功能如何,但我们感觉它必须有一个逻辑单元和一个记忆单元,然后通过推理和经验做出决定。所以类似的对于计算机来说,我们有逻辑单...
我觉得我属于比较笨的那一类人。当理解一个抽象/数学的想法时,我必须真正把它放在图像中,必须在头脑中看到并触摸它。我需要通过几何物体,想法背后的直觉...
网页区块(Blocks)中表示,比特币挖掘过程实际上是在解决数学问题,但再阅读Block hashing algorithm这篇文章感觉还是不太理解没。也想尝试阅读bitcoind源代码...
毫无疑问,我们正在从单一的加密货币焦点(比特币)转向构建在区块链之上的各种基于加密货币的应用程序。
本文将探讨区块链对开发者的影响,区块链应...
在Tensorflow中训练一个模型之后:
如何保存训练得到的模型?
如何恢复(重新加载)这个保存的模型?
最佳解决办法
为保存和恢复模型添加更多...
阅读Tensorflow代码时遇到的问题
最近在研究大名鼎鼎的深度学习工具包Tensorflow,在阅读Tensorflow中的示例Python代码时,发现有以下代码片段:
flags = t...
Keras简介
Keras是一个高级神经网络API,用Python编写,能够运行在TensorFlow或者Theano之上。它的开发重点是实现快速实验。从想法到结果延迟很小,是做好...
类ChiSqSelector声明
class pyspark.mllib.feature.ChiSqSelector(numTopFeatures=50, selectorType='numTopFeatures', percentile=0.1, fpr=0.05)
类ChiS...
Spark中ml和mllib的主要区别和联系如下:
ml和mllib都是Spark中的机器学习库,目前常用的机器学习功能2个库都能满足需求。
spark官方推荐使用ml, 因...
潜在的Dirichlet分配(LDA),是专为文本文档设计的主题模型。
术语说明:
“word”=“term”:词汇表的元素。
“token”:出现在文档中的term的实例。
“topic”...
GBDT分类
pyspark使用类GradientBoostedTrees的trainClassifier函数进行GBDT分类模型训练:
trainClassifier(data, categoricalFeaturesInfo, loss='logLos...
机器学习中参数调整是门艺术,模型的最佳参数可能取决于许多场景,所以很难为此做一个全面的指导。本文尝试为xgboost中的参数调整提供一些说明。
了解偏...
pyspark中的RandomForest,也就是随机森林,既可以训练分类模型,也可以训练回归模型,下面分别介绍。
RandomForest分类
使用RondomForest建立分类模型...
类用法简介
class pyspark.mllib.classification.LogisticRegressionModel(weights, intercept, numFeatures, numClasses)
LogisticRegressionModel: 使用...
本文由Tracholar授权发布,未经允许,请勿转载。
在组内做过一次因子机的技术分享,这里将内容以及自己的思考记录如下。
综述
什么是因...