雖然我們不知道大腦的功能如何,但我們感覺它必須有一個邏輯單元和一個記憶單元,然後通過推理和經驗做出決定。所以類似的對於計算機來說,我們有邏輯單...
我覺得我屬於比較笨的那一類人。當理解一個抽象/數學的想法時,我必須真正把它放在圖像中,必須在頭腦中看到並觸摸它。我需要通過幾何物體,想法背後的直覺...
網頁區塊(Blocks)中表示,比特幣挖掘過程實際上是在解決數學問題,但再閱讀Block hashing algorithm這篇文章感覺還是不太理解沒。也想嘗試閱讀bitcoind源代碼...
毫無疑問,我們正在從單一的加密貨幣焦點(比特幣)轉向構建在區塊鏈之上的各種基於加密貨幣的應用程序。
本文將探討區塊鏈對開發者的影響,區塊鏈應...
在Tensorflow中訓練一個模型之後:
如何保存訓練得到的模型?
如何恢複(重新加載)這個保存的模型?
最佳解決辦法
為保存和恢複模型添加更多...
閱讀Tensorflow代碼時遇到的問題
最近在研究大名鼎鼎的深度學習工具包Tensorflow,在閱讀Tensorflow中的示例Python代碼時,發現有以下代碼片段:
flags = t...
Keras簡介
Keras是一個高級神經網絡API,用Python編寫,能夠運行在TensorFlow或者Theano之上。它的開發重點是實現快速實驗。從想法到結果延遲很小,是做好...
類ChiSqSelector聲明
class pyspark.mllib.feature.ChiSqSelector(numTopFeatures=50, selectorType='numTopFeatures', percentile=0.1, fpr=0.05)
類ChiS...
Spark中ml和mllib的主要區別和聯係如下:
ml和mllib都是Spark中的機器學習庫,目前常用的機器學習功能2個庫都能滿足需求。
spark官方推薦使用ml, 因...
潛在的Dirichlet分配(LDA),是專為文本文檔設計的主題模型。
術語說明:
“word”=“term”:詞匯表的元素。
“token”:出現在文檔中的term的實例。
“topic”...
GBDT分類
pyspark使用類GradientBoostedTrees的trainClassifier函數進行GBDT分類模型訓練:
trainClassifier(data, categoricalFeaturesInfo, loss='logLos...
機器學習中參數調整是門藝術,模型的最佳參數可能取決於許多場景,所以很難為此做一個全麵的指導。本文嘗試為xgboost中的參數調整提供一些說明。
了解偏...
pyspark中的RandomForest,也就是隨機森林,既可以訓練分類模型,也可以訓練回歸模型,下麵分別介紹。
RandomForest分類
使用RondomForest建立分類模型...
類用法簡介
class pyspark.mllib.classification.LogisticRegressionModel(weights, intercept, numFeatures, numClasses)
LogisticRegressionModel: 使用...
本文由Tracholar授權發布,未經允許,請勿轉載。
在組內做過一次因子機的技術分享,這裏將內容以及自己的思考記錄如下。
綜述
什麽是因...