亚洲韩日午夜视频,欧美日韩在线精品一区二区三区,韩国超清无码一区二区三区,亚洲国产成人影院播放,久草新在线,在线看片AV色

您好,歡迎來到思海網絡,我們將竭誠為您提供優(yōu)質的服務! 誠征網絡推廣 | 網站備案 | 幫助中心 | 軟件下載 | 購買流程 | 付款方式 | 聯(lián)系我們 [ 會員登錄/注冊 ]
促銷推廣
客服中心
業(yè)務咨詢
有事點擊這里…  531199185
有事點擊這里…  61352289
點擊這里給我發(fā)消息  81721488
有事點擊這里…  872642803
有事點擊這里…  459248018
有事點擊這里…  376585780
有事點擊這里…  61352288
有事點擊這里…  380791050
技術支持
有事點擊這里…  714236853
有事點擊這里…  719304487
有事點擊這里…  1208894568
有事點擊這里…  61352289
在線客服
有事點擊這里…  531199185
有事點擊這里…  61352288
有事點擊這里…  983054746
有事點擊這里…  893984210
當前位置:首頁 >> 新聞中心 >> 瀏覽新聞
新聞中心

大數(shù)據選擇存儲服務 存儲架構知多少

發(fā)布時間:2012-5-4 來源:IT168 

  磁盤存儲就像是衣櫥,永遠不夠用,在大數(shù)據時代,這一點尤為突出。“大數(shù)據”意味著需要比傳統(tǒng)存儲平臺處理更多的數(shù)據。那么這對于CIO意味著什么呢?意味著他們將需要做出更多的努力,而可供參考的信息卻很少。

  不過,在為大數(shù)據選擇存儲服務時也并不是完全無跡可尋。

  何謂大數(shù)據

  首先,我們需要清楚大數(shù)據與其他類型數(shù)據的區(qū)別以及與之相關的技術(主要是分析應用程序)。大數(shù)據本身意味著非常多需要使用標準存儲技術來處理的數(shù)據。大數(shù)據可能由TB級(或者甚至PB級)信息組成,既包括結構化數(shù)據(數(shù)據庫、日志、SQL等)以及非結構化數(shù)據(社交媒體帖子、傳感器、多媒體數(shù)據)。此外,大部分這些數(shù)據缺乏索引或者其他組織結構,可能由很多不同文件類型組成。

  由于這些數(shù)據缺乏一致性,使標準處理和存儲技術無計可施,而且運營開銷以及龐大的數(shù)據量使我們難以使用傳統(tǒng)的服務器和SAN方法來有效地進行處理。換句話說,大數(shù)據需要不同的處理方法:自己的平臺,這也是Hadoop可以派上用場的地方。

  Hadoop是一個開源分布式計算平臺,它提供了一種建立平臺的方法,這個平臺由標準化硬件(服務器和內部服務器存儲)組成,并形成集群能夠并行處理大數(shù)據請求。在存儲方面來看,這個開源項目的關鍵組成部分是Hadoop分布式文件系統(tǒng)(HDFS),該系統(tǒng)具有跨集群中多個成員存儲非常大文件的能力。HDFS通過創(chuàng)建多個數(shù)據塊副本,然后將其分布在整個集群內的計算機節(jié)點,這提供了方便可靠極其快速的計算能力。

  從目前來看,為大數(shù)據建立足夠大的存儲平臺最簡單的方法就是購買一套服務器,并為每臺服務器配備數(shù)TB級的驅動器,然后讓 Hadoop來完成余下的工作。對于一些規(guī)模較小的企業(yè)而言,可能只要這么簡單。然而,一旦考慮處理性能、算法復雜性和數(shù)據挖掘,這種方法可能不一定能夠保證成功。

  你的存儲架構

  這一切都歸結到所涉及的存儲結構和網絡性能。對于經常分析大數(shù)據的企業(yè)而言,可能需要一個單獨的基礎設施,因為隨著集群中計算節(jié)點的數(shù)量的增長,帶 寬開銷也會增長。通常情況下,使用HDFS的多模計算集群在處理大數(shù)據時將會產生大量流量。這是因為Hadoop在集群的成員服務器間傳輸數(shù)據(以及計算 資源)。

  在大多數(shù)情況下,基于服務器的本地存儲并沒有高效率的優(yōu)點,這也是為什么很多企業(yè)轉向使用高速光纖結構的SAN來最大限度地提高吞吐量。然 而,SAN方法本身并不一定適合大數(shù)據部署。尤其是那些使用Hadoop的大數(shù)據部署,因為SAN承擔集中硬盤上數(shù)據的責任,這反過來意味著每個計算服務 器將需要訪問相同的SAN來恢復正態(tài)分布的數(shù)據。

  然而,當比較本地服務器存儲和基于SAN的存儲時,本地存儲在兩個方面占據優(yōu)勢:成本和整體性能。簡而言之,沒有在每個計算成員放置RAID的原始磁盤在處理HDFS請求時將勝過SAN,然而,基于服務器的磁盤存在缺點,主要是在可擴展性方面。

  問題是當服務器依賴于本地存儲時,你如何在必要的時候增加更多的容量。通常,有兩種方式來處理這種困境。第一種方法是增加具有更多本地存儲的額外的 服務器。第二種方法是增加集群服務器的容量。這兩種方法都需要購買和配置硬件,這將導致停機時間,可能還需要重新設計架構。然而,無論使用哪種方法都要比 向 SAN增加容量要便宜,可以說,這是一個顯著的成本優(yōu)勢。

  然而,當涉及到Hadoop時,還有其他存儲選擇。例如,一些領先的存儲廠商都在建立專門針對Hadoop和大數(shù)據分析的存儲設備。這些供應商包括EMC,目前提供Hadoop解決方案,例如Greenplum HD Data Computing Appliance.甲骨文正在考慮進一步深化Exadata系列設備,提供計算能力以及高速存儲。

  最后一個存儲選擇是云形式的存儲,Cloudera、微軟、Amazon和很多其他供應商都在提供基于云的大數(shù)據解決方案,這些解決方案能夠提供處理能力、存儲和支持。

  在選擇大數(shù)據存儲解決方案時需要考慮究竟需要多少空間,分析頻率如何以及需要處理什么類型的數(shù)據。這些因素,以及安全、預算和處理時間都是選擇大數(shù)據存儲解決方案時需要考慮的因素。

  可能站在保險的角度來看,一個試點項目可能是一個不錯的開始,商品硬件也是大數(shù)據試點項目的低成本投資選擇。

關鍵字:數(shù)據、存儲服務、架構、空間

分享到:

頂部 】 【 關閉
版權所有:佛山思海電腦網絡有限公司 ©1998-2024 All Rights Reserved.
聯(lián)系電話:(0757)22630313、22633833
中華人民共和國增值電信業(yè)務經營許可證: 粵B1.B2-20030321 備案號:粵B2-20030321-1
網站公安備案編號:44060602000007 交互式欄目專項備案編號:200303DD003  
察察 工商 網安 舉報有獎  警警  手機打開網站