Hadoop分布式文件系統設計要點與架構 -昆山摩傑斯信息科技有限公司
發佈時間:2012-8-12

Hadoop簡介:一個分布式系統基礎架構,由Apache基金會開發。用戶可以在不了解分布式底層細節的情況下,開發分布式程序。充分利用集群的威力高速運算和存儲。Hadoop實現了一個分布式文件系統(HadoopDistributedFileSystem),簡稱HDFS。HDFS有着高容錯性的特點,并且設計用來部署在低廉的(low-cost)硬件上。而且它提供高傳輸率(highthroughput)來訪問應用程序的數據,适合那些有着超大數據集(largedataset)的應用程序。HDFS放寬了(relax)POSIX的要求(requirements)這樣可以流的形式訪問(streamingaccess)文件系統中的數據。Hadoop官網:http://hadoop.apache.org/Hadoop中文文檔:http://hadoop.apache.org/common/docs/r0.21.0/cn/一、前提和設計目标1、硬件錯誤是常态,而非異常情況,HDFS可能是有成百上千的server組成,任何一個組件都有可能一直失效,因此錯誤檢測和快速、自動的恢複是HDFS的核心架構目标。2、跑下页


返回
首頁公司簡介公司動態產品.企業聯繫.
TEL:186-2522-0688

2025-8-16 23:57:28