班級規(guī)模及環(huán)境--熱線:4008699035 手機:15921673576( 微信同號) |
堅持小班授課,為保證培訓效果,增加互動環(huán)節(jié),每期人數(shù)限3到5人。 |
上課時間和地點 |
上課地點:【上海】:同濟大學(滬西)/新城金郡商務樓(11號線白銀路站) 【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院 【北京分部】:北京中山學院/福鑫大樓 【南京分部】:金港大廈(和燕路) 【武漢分部】:佳源大廈(高新二路) 【成都分部】:領館區(qū)1號(中和大道) 【沈陽分部】:沈陽理工大學/六宅臻品 【鄭州分部】:鄭州大學/錦華大廈 【石家莊分部】:河北科技大學/瑞景大廈 【廣州分部】:廣糧大廈 【西安分部】:協(xié)同大廈
最近開課時間(周末班/連續(xù)班/晚班):2025年7月14日..用心服務..........--即將開課--...................... |
實驗設備 |
☆資深工程師授課
☆注重質量
☆邊講邊練
☆合格學員免費推薦工作
★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
2、課程完成后,授課老師留給學員手機和Email,保障培訓效果,免費提供半年的技術支持。
3、培訓合格學員可享受免費推薦就業(yè)機會。 |
課程大綱 |
一、 課程簡介
大數(shù)據(jù)技術已經給新興互聯(lián)網企業(yè)(如電商平臺、搜索引擎、社交平臺網站、位置服務平臺、通信運營服務平臺商、廣告服務商等)、銀行金融企業(yè)、高端裝備制造企業(yè)、IT基礎設施提供商等帶來了巨大的商業(yè)機遇,企業(yè)的大數(shù)據(jù)平臺的實施建設與運維在企業(yè)信息化建設中發(fā)揮著至關重要的作用。
本課程讓學員充分掌握Hadoop大數(shù)據(jù)處理平臺、MySQL分布式數(shù)據(jù)庫應用和Greenplum為代表的MPP數(shù)據(jù)庫、以HBase為代表的NoSQL新型數(shù)據(jù)庫平臺的技術架構、以及平臺的安裝部署、運維配置、應用開發(fā)實戰(zhàn)技能,熟悉國內外主流的大數(shù)據(jù)處理解決方案、以及大數(shù)據(jù)應用案例。強調主流的大數(shù)據(jù)關鍵技術及其在不同行業(yè)中企業(yè)的實際應用,立足于實際的行業(yè)應用需求,旨在讓企業(yè)學員能夠掌握大數(shù)據(jù)平臺技術及應用如何落地,以及基于大數(shù)據(jù)平臺的技術架構實現(xiàn)、高性能大數(shù)據(jù)應用程序開發(fā),以及大數(shù)據(jù)集群的運維技術,讓學員掌握業(yè)界主流的大數(shù)據(jù)平臺的應用和部署,并且結合當前互聯(lián)網+行業(yè)應用場景下產生的大規(guī)模結構化與非結構化數(shù)據(jù)管理以及分析處理需求,詳細講解有機地集成大數(shù)據(jù)平臺各個功能組件(大數(shù)據(jù)收集、大數(shù)據(jù)存儲、大數(shù)據(jù)管理、大數(shù)據(jù)挖掘、大數(shù)據(jù)分析和大數(shù)據(jù)可視化組件)設計大數(shù)據(jù)項目,并分享大數(shù)據(jù)項目應用實施案例。
本課程采用技術原理與項目實戰(zhàn)相結合的方式進行教學,在講授原理的過程中,穿插實際的系統(tǒng)操作,本課程講師也精心準備的實際的應用案例供學員動手訓練。通過學習基于Hadoop、MySQL、MPP數(shù)據(jù)庫平臺的大數(shù)據(jù)應用項目解決方案,緊密結合行業(yè)市場需求和國際國內最新技術發(fā)展潮流,促進企業(yè)利用大數(shù)據(jù)技術對現(xiàn)有的信息化設施進行改造升級,提升企業(yè)的商業(yè)價值,擁抱云-網-端與大數(shù)據(jù)時代的光明前景!
二、 培訓目標
1. 本課程讓學員學員掌握Hadoop平臺的平臺架構、核心關鍵技術、二次應用開發(fā)、大數(shù)據(jù)平臺集群運維和性能調優(yōu)技能。
2. 讓學員掌握主流的MySQL數(shù)據(jù)庫集群架構、應用開發(fā)和性能優(yōu)化技術的實戰(zhàn)技巧。
3. 讓學員掌握業(yè)界主流的MPP數(shù)據(jù)庫的集群架構、部署配置,并以Greenplum為代表,講解運用MPP數(shù)據(jù)庫技術結合Hadoop和MySQL技術實現(xiàn)大數(shù)據(jù)解決方案
4. 讓學員全面掌握大數(shù)據(jù)高性能處理平臺架構設計與項目選型規(guī)劃、大數(shù)據(jù)分布式存儲管理技術、NoSQL與NewSQL分布式數(shù)據(jù)庫技術、大數(shù)據(jù)倉庫與統(tǒng)計機器學習技術、大數(shù)據(jù)分析挖掘與商業(yè)智能(BI)技術、大數(shù)據(jù)實時處理技術、大數(shù)據(jù)離線處理技術、流式數(shù)據(jù)處理技術、大數(shù)據(jù)采集技術和大數(shù)據(jù)管理技術的原理知識和應用實戰(zhàn)技能。
5. 深入理解業(yè)界最流行的Hadoop與Spark大數(shù)據(jù)技術體系和平臺應用實戰(zhàn),能根據(jù)給定的應用場景嫻熟地運用大數(shù)據(jù)技術體系規(guī)劃解決方案滿足實際項目需求,結合所學的Hadoop、MySQL和MPP數(shù)據(jù)庫知識,設計并部署符合生產環(huán)境要求的大型數(shù)據(jù)倉庫和大數(shù)據(jù)處理平臺集群,熟練地掌握基于Hadoop、MySQL和MPP大數(shù)據(jù)平臺進行應用程序開發(fā)、集群運維管理和性能調優(yōu)技巧,并通過具體的實踐訓練項目貫穿整個課程,提高學員的動手技能。
三、 培訓人群
1. 數(shù)據(jù)庫與大數(shù)據(jù)項目的開發(fā)工程師
2. 數(shù)據(jù)庫與大數(shù)據(jù)項目的規(guī)劃咨詢管理人員
3. 數(shù)據(jù)庫與大數(shù)據(jù)項目的IT項目高管人員
4. 數(shù)據(jù)庫與大數(shù)據(jù)分析與挖掘處理算法應用工程師
5. 數(shù)據(jù)庫與大數(shù)據(jù)集群運維工程師
6. 數(shù)據(jù)庫與大數(shù)據(jù)項目的售前和售后技術支持服務人員
四、 培訓特色
1. 定制授課+ 案例分析講解 + 實戰(zhàn)操作,共3天
2. 實驗環(huán)境:Linux 虛擬機集群+ Hadoop + MySQL數(shù)據(jù)庫 + MPP(Greenplum)+ HBase,講師提供VMware虛擬機鏡像
五、 詳細大綱與培訓內容
培訓模塊 培訓要點
一、 業(yè)界主流的大數(shù)據(jù)技術產品與項目解決方案 1. 國內外主流的大數(shù)據(jù)解決方案介紹
2. 當前大數(shù)據(jù)解決方案與傳統(tǒng)數(shù)據(jù)庫方案的剖析比較
3. Apache Hadoop大數(shù)據(jù)平臺方案剖析
4. CDH Hadoop大數(shù)據(jù)平臺方案剖析
5. HDP Hadoop大數(shù)據(jù)平臺方案剖析
6. 開源的Hadoop大數(shù)據(jù)生態(tài)系統(tǒng)平臺剖析
二、 Hadoop大數(shù)據(jù)平臺剖析 7. Hadoop的發(fā)展歷程以及產業(yè)界的實際應用介紹
8. Hadoop大數(shù)據(jù)平臺架構
9. 基于Hadoop平臺的PB級大數(shù)據(jù)存儲管理與分析處理的工作原理與機制
10. Hadoop的核心組件剖析
三、 大數(shù)據(jù)分布式存儲系統(tǒng)原理及其應用實踐 11. 分布式文件系統(tǒng)HDFS的簡介
12. HDFS系統(tǒng)的主從式平臺架構和工作原理
13. HDFS核心組件技術講解
14. 基于HDFS的大型存儲系統(tǒng)應用開發(fā)實戰(zhàn)
15. HDFS集群的安裝、部署、配置與性能優(yōu)化實踐
16. HDFS與Linux NFS3交互技術以及本地化掛載部署應用實踐
17. 分布式鍵值存儲系統(tǒng)介紹、平臺架構、核心技術以及應用開發(fā)
18. PB及大數(shù)據(jù)存儲系統(tǒng)的項目案例分析
四、 大數(shù)據(jù)并行處理MapReduce和Yarn并行處理平臺的架構與應用實踐 19. MapReduce并行計算模型
20. MapReduce作業(yè)執(zhí)行與調度技術
21. 第二代大數(shù)據(jù)計算框架Yarn的工作原理以及DAG并行執(zhí)行機制
22. MapReduce應用開發(fā)環(huán)境的部署,以及大數(shù)據(jù)并行處理應用程序開發(fā)
23. MapReduce高級編程技巧與性能優(yōu)化實踐
24. MapReduce與Yarn大數(shù)據(jù)分析處理案例分析
五、 基于Hadoop的大型數(shù)據(jù)倉庫Hive集群平臺 25. 基于Hadoop的大型分布式數(shù)據(jù)倉庫基礎知識,HIVE在行業(yè)中的數(shù)據(jù)倉庫應用案例
26. Hive大數(shù)據(jù)倉庫簡介以及應用介紹
27. Hive數(shù)據(jù)倉庫集群的平臺體系結構、核心技術剖析
28. Hive Server的工作原理、機制與應用
29. Hive數(shù)據(jù)倉庫集群的安裝部署與配置優(yōu)化
30. Hive應用開發(fā)技巧
31. Hive SQL剖析與應用實踐
32. Hive數(shù)據(jù)倉庫表與表分區(qū)、表操作、數(shù)據(jù)導入導出、客戶端操作技巧
33. Hive數(shù)據(jù)倉庫報表設計
34. Hive JDBC與ODBC的工作原理與實現(xiàn)機制
35. Hive HWI、CLI客戶端操作以及UDF應用實踐
六、 Hadoop+Hive應用實踐操作訓練 36. 部署與配置HIVE集群,以及HIVE性能調優(yōu)
37. 構建HIVE開發(fā)環(huán)境
38. HIVE數(shù)據(jù)倉庫操作及項目實踐
七、 開源MySQL數(shù)據(jù)庫技術及其應用實踐 39. MySQL的發(fā)展歷程以及業(yè)界的實際應用介紹
40. MySQL數(shù)據(jù)庫管理系統(tǒng)的平臺架構和核心模塊剖析
41. MySQL應用開發(fā)實踐和數(shù)據(jù)庫編程實踐
42. MySQL讀寫分離技術應用實踐
43. MySQL主從復制技術應用實踐
44. 基于MySQL集群的數(shù)據(jù)分析項目應用實踐案例
八、 MySQL應用開發(fā)與運維實踐操作訓練 45. MySQL集群的部署與配置
46. MySQL讀寫分離與主從復制下的應用程序開發(fā)
47. MySQL性能調優(yōu)技巧
九、 開源PostgreSQL 數(shù)據(jù)庫技術及應用實踐 48. PostgreSQL的發(fā)展歷程以及業(yè)界的實際應用介紹
49. PostgreSQL數(shù)據(jù)庫管理系統(tǒng)的平臺架構和核心模塊剖析
50. PostgreSQL應用開發(fā)實踐和數(shù)據(jù)庫編程實踐
51. PostgreSQL讀寫分離技術應用實踐
52. PostgreSQL主從復制技術應用實踐
53. 基于PostgreSQL集群的數(shù)據(jù)分析項目應用實踐案例
十、 PostgreSQL應用開發(fā)與運維實踐操作訓練 54. PostgreSQL集群的部署與配置
55. PostgreSQL讀寫分離與主從復制下的應用程序開發(fā)
56. PostgreSQL性能調優(yōu)技巧
十一、 HBase分布式數(shù)據(jù)庫管理系統(tǒng) 57. NoSQL數(shù)據(jù)庫與NewSQL數(shù)據(jù)庫技術介紹,及其在半結構化和非結構化大數(shù)據(jù)方面的應用實踐
58. HBase分布式數(shù)據(jù)庫簡介、數(shù)據(jù)模型以及工作原理
59. HBase分布式數(shù)據(jù)庫集群的平臺架構和關鍵技術剖析
60. HBase應用項目開發(fā)技巧,以及客戶端開發(fā)實戰(zhàn)
61. HBase表設計與數(shù)據(jù)操作以及數(shù)據(jù)庫管理API調用
62. HBase集群的安裝部署與配置優(yōu)化
63. ZooKeeper分布式協(xié)調服務系統(tǒng)的工作原理、平臺架構、集群部署與配置應用實戰(zhàn)
64. HBase集群的運維與監(jiān)控管理
十二、 HBase應用實踐操作訓練 65. 部署與配置HBase集群以及HBase的性能優(yōu)化
66. 部署與配置ZooKeeper分布式集群
67. 構建HBase開發(fā)環(huán)境
68. HBase數(shù)據(jù)庫操作及項目實踐
十三、 MPP數(shù)據(jù)庫技術原理及其應用實踐 69. MPP數(shù)據(jù)庫、數(shù)據(jù)倉庫與大數(shù)據(jù)分析處理解決方案概述70.
十四、 主流MPP并行數(shù)據(jù)庫的代表:Greenplum數(shù)據(jù)庫技術及應用實踐 (注:GPDB是Greenplum Database的簡稱) 71. Greenplum發(fā)展歷程、GPDB數(shù)據(jù)庫應用場景和應用案例,主要講解Greenplum在數(shù)據(jù)倉庫與數(shù)據(jù)分析方面的應用解決方案
72. Greenplum體系結構設計原理和模塊,以及高性能與高可用架構設計
73. Greenplum的數(shù)據(jù)倉庫、多維OLAP分析和機器學習模塊詳解
74. Greenplum分布式存儲引擎工作原理,數(shù)據(jù)的分布式存儲策略和負載均衡策略
75. 講解GPDB的SQL中的DDL語言,DCL語言,DML語言和常用分析函數(shù)的語法和用法
76. GPDB的模式定義方法和示例
77. GPDB查詢處理引擎工作原理
78. GPDB查詢規(guī)劃與分發(fā)
79. GPDB的SQL語句解析與查詢處理機制
80. GPDB的MPP并行查詢執(zhí)行計劃
81. GPDB的數(shù)據(jù)管理方法,以及數(shù)據(jù)庫操作應用實踐
82. GPDB事務處理
83. GPDB數(shù)據(jù)庫監(jiān)控分析
84. GPDB數(shù)據(jù)庫中的數(shù)據(jù)查詢處理機制和應用操作實踐
85. GPDB的角色設置和權限分配
十五、 Greenplum應用實踐操作訓練 86. 在Linux虛擬機集群上部署Greenplum分布式數(shù)據(jù)庫
87. 安裝并初始化GPDB數(shù)據(jù)庫集群系統(tǒng)
88. 啟動、停止GPDB實例,查看運行狀態(tài)
89. PSQL和pgAdminIII的安裝、部署和配置
90. PSQL客戶端接口和程序應用,常用SQL命令的應用操作
91. pgAdmin III客戶端功能模塊講解,以及應用操作實踐
92. 部署配置GPDB數(shù)據(jù)應用程序二次開發(fā)環(huán)境
93. GPDB數(shù)據(jù)庫系統(tǒng)性能調優(yōu)方法和配置參數(shù)優(yōu)化操作
94. GPDB高可用性配置方法和應用操作實踐
95. GPDB數(shù)據(jù)批量加載和導入導出操作實踐
96. GPDB數(shù)據(jù)庫備份和恢復的實現(xiàn)原理和操作應用
十六、 基于Hadoop、 MySQL、Greenplum和 Mahout的大數(shù)據(jù)分析挖掘平臺解決方案(可選) 97. 大數(shù)據(jù)分析挖掘技術介紹,以及行業(yè)大數(shù)據(jù)挖掘應用案例
98. Mahout大數(shù)據(jù)挖掘平臺的體系架構和核心技術
99. 基于Mahout的數(shù)據(jù)分析挖掘算法應用,包括分類算法、聚類算法、關聯(lián)規(guī)則挖掘算法、推薦與協(xié)同過濾分析算法、預測分析等算法的應用及其案例剖析
100. 基于Mahout的數(shù)據(jù)分析挖掘應用程序開發(fā)實戰(zhàn)
101. 利用MySQL數(shù)據(jù)源、Mahout與Hadoop集成大數(shù)據(jù)挖掘平臺應用實戰(zhàn)
十七、 大數(shù)據(jù)項目應用完整實踐與咨詢討論 102. 根據(jù)講師布置的實際應用案例,根據(jù)所學的Hadoop、MySQL、Greenplum等技術,開展大數(shù)據(jù)完整項目部署設計和應用開發(fā)實踐、大數(shù)據(jù)項目的需求分析、應用實施以及解決方案分享咨詢與交流討論 |
|
|
|
|