很多同學(xué)都不了解大數(shù)據(jù)的Hadoop是什么,Hadoop的出現(xiàn)是由于現(xiàn)代科技的飛速發(fā)展,傳統(tǒng)數(shù)據(jù)的存儲容量、讀寫速度、計算效率等越來越無法滿足用戶的需求,為了解決這些問題,Google提出了三個處理大數(shù)據(jù)的技術(shù)手段,分別是:查看全文>>
HDFS,全稱Hadoop Distributed File System,意思是分布式文件系統(tǒng)。Hadoop分布式文件系統(tǒng)是指被設(shè)計成適合du運行在通用硬件(commodity hardware)上的分zhi布式文件系統(tǒng)。查看全文>>
從零開始講解大數(shù)據(jù)調(diào)度系統(tǒng)構(gòu)成,集成大數(shù)據(jù)計算任務(wù)構(gòu)建大數(shù)據(jù)工作流,基于Oozie構(gòu)建實現(xiàn)企業(yè)級自動化任務(wù)開發(fā)。提取碼:esu8查看全文>>
從零開始講解大數(shù)據(jù)業(yè)務(wù)及數(shù)據(jù)采集和遷移需求,以案例驅(qū)動的方式講解基于Sqoop構(gòu)建高性能的分布式數(shù)據(jù)遷移和同步平臺。提取碼:964s查看全文>>
從零學(xué)習(xí)數(shù)據(jù)湖的相關(guān)概念,并通過Hadoop、Spark、Delta Lake等框架實現(xiàn)數(shù)據(jù)湖架構(gòu),通過知識點 + 案例教學(xué)法幫助小白快速掌握數(shù)據(jù)湖開發(fā)相關(guān)技能。查看全文>>