- 軟件大?。?span>19.11M
- 軟件語言:中文
- 軟件類型:國產(chǎn)軟件
- 軟件類別:免費軟件 / 編程工具
- 更新時間:2017-06-20 09:31
- 運行環(huán)境:WinAll, WinXP, Win7, Win8, Win10
- 軟件等級:
- 軟件廠商:
- 官方網(wǎng)站:暫無
9.00M/中文/8.0
19.53M/中文/0.0
34.17M/中文/10.0
316KB/中文/1.7
45KB/中文/1.3
騰訊Angel是騰訊發(fā)布一款開源高性能分布式計算平臺,可以更加高速精確的處理數(shù)據(jù)材料,其能力超過各類同行軟件,如果你有興趣,就來綠色資源網(wǎng)下載,學習源碼吧!
騰訊Angel 1.0是騰訊數(shù)據(jù)平臺部與香港科技大學合作、北京大學參與共同開發(fā)的分布式計算框架,它的主要設計目標是為了支持超大維度的機器學習模型運算。
【網(wǎng)絡優(yōu)化】
Angel的網(wǎng)絡解決方案使用的是香港科技大學的Chukonu。借助Chukonu,Angel可以通過網(wǎng)絡流量再分配的方式,解決半同步的運算協(xié)調(diào)機制SSP中可能出現(xiàn)的快節(jié)點等待慢節(jié)點的問題,減少了窗口空閑等待時間。
【整體架構(gòu)】
Angel的整體架構(gòu)參考了谷歌的DistBelief,這是一種最初為了深度學習而設計、使用了參數(shù)服務器來解決巨大模型在訓練時更新問題的架構(gòu)。參數(shù)服務器同樣可用于機器學習中非深度學習的模型,如SGD、ADMM、LBFGS的優(yōu)化算法在面臨在每輪迭代上億個參數(shù)更新的場景中,需要參數(shù)分布式緩存來拓展性能。
1.Angel的核心設計理念圍繞模型。它將高維度的大模型切分到多個參數(shù)服務器節(jié)點,并通過高效的模型更新接口和運算函數(shù),以及靈活的同步協(xié)議,實現(xiàn)機器學習算法的高效運行
2.Angel基于Java和Scala開發(fā),能在社區(qū)的Yarn上直接調(diào)度運行,并基于PS Service,支持Spark on Angel,未來將會支持圖計算和深度學習框架集成。
3.Angel采用的Parameter Sever架構(gòu)相比其它類型的架構(gòu)更適合解決巨大模型中的參數(shù)更新問題;實際運行中相比參數(shù)更新方面有單點瓶頸的Spark平臺,Angel能夠取得成倍的性能優(yōu)勢,而且模型越大優(yōu)勢越明顯。
4.騰訊開源的Angel給頭疼于大規(guī)模機器學習模型計算的業(yè)內(nèi)人員提供了一個新選擇。發(fā)展自己技術(shù)、擴大自己的平臺的同時,騰訊也承諾未來的開源力度只會越來越大。
5.圍繞Angel,騰訊還建立了一個小生態(tài)圈,可以支持Spark之上的MLLib,支持上億的維度的訓練;也支持更復雜的圖計算模型。
去年Angel發(fā)布時,騰訊平臺部總經(jīng)理、首席數(shù)據(jù)專家蔣杰對騰訊計算平臺的發(fā)展歷程做過介紹。2009到2011年的第一代平臺主要目標是規(guī)?;?,形成了TDW(騰訊分布式數(shù)據(jù)倉庫)這樣的架構(gòu);2012到2014年第二代平臺主要是實時化,把大規(guī)模計算搬到平臺上,支持了實時性強、規(guī)模大的業(yè)務需求,但是基于Spark的數(shù)據(jù)訓練就遇到了超大維度時出現(xiàn)瓶頸的問題。
這樣,騰訊開始建設新的高性能計算框架,要能支持超大規(guī)模數(shù)據(jù)集,能完成十億級別維度的訓練。這就是騰訊的第三臺計算平臺Angel。圍繞Angel,騰訊還建立了一個小生態(tài)圈,可以支持Spark之上的MLLib,支持上億的維度的訓練;也支持更復雜的圖計算模型。
也就是依靠Angel,騰訊獲得了2016年的Sort benchmark的排序的4項冠軍,用98.8秒時間完成了100T數(shù)據(jù)的排序,刷新了四項世界紀錄。2015年的這項排序時間還高達329秒。
請描述您所遇到的錯誤,我們將盡快予以修正,謝謝!
*必填項,請輸入內(nèi)容