- 軟件大小:287.00M
- 軟件語言:中文
- 軟件類型:國(guó)產(chǎn)軟件
- 軟件類別:免費(fèi)軟件 / 其他行業(yè)
- 更新時(shí)間:2021-10-23 11:51
- 運(yùn)行環(huán)境:WinAll, Win7
- 軟件等級(jí):
- 軟件廠商:
- 官方網(wǎng)站:http://spark.apache.org/
53.78M/中文/10.0
170.00M/中文/10.0
144.69M/中文/10.0
144.69M/中文/10.0
19.52M/中文/10.0
spark大數(shù)據(jù)分析軟件為你提供了一個(gè)全新的平臺(tái),你可以使用該平臺(tái)來進(jìn)行大數(shù)據(jù)學(xué)習(xí)、計(jì)算等等,支持的行業(yè)也是相當(dāng)?shù)膹V泛。軟件中的內(nèi)容豐富,而且還有相當(dāng)多的功能。歡迎下載!
Apache Spark 是一種多語言引擎,用于在單節(jié)點(diǎn)機(jī)器或集群上執(zhí)行數(shù)據(jù)工程、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)。
1、機(jī)器學(xué)習(xí)
在筆記本電腦上訓(xùn)練機(jī)器學(xué)習(xí)算法,并使用相同的代碼擴(kuò)展到由數(shù)千臺(tái)機(jī)器組成的容錯(cuò)集群。
2、SQL 分析
為儀表板和臨時(shí)報(bào)告執(zhí)行快速、分布式的 ANSI SQL 查詢。運(yùn)行速度快于大多數(shù)數(shù)據(jù)倉(cāng)庫(kù)。
3、批處理/流數(shù)據(jù)
使用您的首選語言:Python、SQL、Scala、Java 或 R,統(tǒng)一批量和實(shí)時(shí)流式處理數(shù)據(jù)。
4、大規(guī)模數(shù)據(jù)科學(xué)
對(duì) PB 級(jí)數(shù)據(jù)執(zhí)行探索性數(shù)據(jù)分析 (EDA),而不必求助于下采樣
1、速度快
基于內(nèi)存進(jìn)行計(jì)算(當(dāng)然也有部分計(jì)算基于磁盤,比如shuffle)。
2、集成Hadoop
并不是要成為一個(gè)大數(shù)據(jù)領(lǐng)域的“獨(dú)裁者”,一個(gè)人霸占大數(shù)據(jù)領(lǐng)域所有的“地盤”,而是與Hadoop進(jìn)行了高度的集成,兩者可以完美的配合使用。Hadoop的HDFS、Hive、HBase負(fù)責(zé)存儲(chǔ),YARN負(fù)責(zé)資源調(diào)度;復(fù)雜大數(shù)據(jù)計(jì)算。實(shí)際上,Hadoop+的組合,是一種“double win”的組合。
3、極高的活躍度
目前是Apache基金會(huì)的頂級(jí)項(xiàng)目,全世界有大量的優(yōu)秀工程師是的committer。并且世界上很多頂級(jí)的IT公司都在大規(guī)模地使用。
4、容易上手開發(fā)
的基于RDD的計(jì)算模型,比Hadoop的基于Map-Reduce的計(jì)算模型要更加易于理解,更加易于上手開發(fā),實(shí)現(xiàn)各種復(fù)雜功能,比如二次排序、topn等復(fù)雜操作時(shí),更加便捷。
5、超強(qiáng)的通用性
提供了 RDD、SQL、Streaming、MLlib、GraphX等技術(shù)組件,可以一站式地完成大數(shù)據(jù)領(lǐng)域的離線批處理、交互式查詢、流式計(jì)算、機(jī)器學(xué)習(xí)、圖計(jì)算等常見的任務(wù)。
請(qǐng)描述您所遇到的錯(cuò)誤,我們將盡快予以修正,謝謝!
*必填項(xiàng),請(qǐng)輸入內(nèi)容