From Spark Machine Learning to TensorFlow Deep Learning


今年剛runMachine Learning案子, 一邊著手整理這段期間運用的Apache Spark技術, 以及一些Hadoop Spark的觀念想法; 在收集資料, 與重新檢視Blog內容期間不由自主地湧進了許多的想法, 於是, 決定重新來架構整份文章內容, 從原本規畫的Spark技術語法, 和模型建構執行過程, 擴大到以三部曲的模式, 架構一套完整的人工智能系列文章。期望達到的目標有:

ü   以當前主流的Big Data平台:Spark Deep Learning平台: TensorFlow, 撰寫sample codes與實作應用分享

ü   補強Blog   Random Forests系列文章中, 所欠缺的Model Evaluation Algorithm Optimization, 以及Machine Learning專案實作上, 需要運用到的零零種種技術細節

先分享一份Random Forests模型和各Machine Learning的比較表


三部曲的順序為:
1.          Building Machine Learning Models on Apache Spark
2.          Deep Learning implementation by TensorFlow
3.          Cluster and Dimensionality Reduction using Scikit-learn



繼續閱讀...