Spark -與 Hadoop 同樣是分散式檔案系統

ssorc 發佈於 11 年前

但 hadoop 目前較普及，spark還要努力

yahoo 工程師說 : Spark 可以很快判斷廣告適合那個訪客

spark 是用 logistic regression (er …. 我尚不懂)

hadoop 運算一次就要讀一次硬碟 (~~~是喔!!?)

hadoop spark

spark 有cache方法，可以缓存上个过程的数据，多次调用同样的数据就不用重复计算了。 “分散式檔案系統”应该不对，而是计算框架

作者

cross 發佈於 11 年前

原來如此啊 :)