一a一片一级一片啪啪-一a一级片-一a级毛片-一一级黄色片-国产免费福利片-国产免费福利网站

熱門(mén)關(guān)鍵字:  聽(tīng)力密碼  單詞密碼  新概念美語(yǔ)  巧用聽(tīng)寫(xiě)練聽(tīng)力  零起點(diǎn)

Spark大數(shù)據(jù)處理技術(shù)

中國(guó)水利水電出版社
    【作 者】主編 劉仁山 周洪翠 莊新妍 【I S B N 】978-7-5226-0485-5 【責(zé)任編輯】鞠向超 【適用讀者群】本專通用 【出版時(shí)間】2022-02-18 【開(kāi) 本】16開(kāi) 【裝幀信息】平裝(光膜) 【版 次】第1版第1次印刷 【頁(yè) 數(shù)】268 【千字?jǐn)?shù)】418 【印 張】16.75 【定 價(jià)】48 【叢 書(shū)】普通高等教育數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)教材 【備注信息】
圖書(shū)詳情

    本書(shū)面向大數(shù)據(jù)技術(shù)專業(yè),遵循知識(shí)性、系統(tǒng)性、實(shí)用性、條理性、連貫性和先進(jìn)性的原則,力求激發(fā)讀者的興趣,注重各知識(shí)點(diǎn)之間的銜接和實(shí)踐性環(huán)節(jié)教學(xué),精心組織內(nèi)容,做到由淺入深、突出重點(diǎn)。

    本書(shū)共9章,第1章為Spark基礎(chǔ),主要包括Spark的基礎(chǔ)知識(shí)、應(yīng)用場(chǎng)景和生態(tài)系統(tǒng)等內(nèi)容;第2章為Scala語(yǔ)言基礎(chǔ),包括Scala 編程基礎(chǔ)、Scala數(shù)組和集合以及映射、Scala對(duì)象和多繼承等內(nèi)容;第3章為Spark設(shè)計(jì)與運(yùn)行原理,包括Spark架構(gòu)、Spark Core組成、Spark編程模型和計(jì)算模型等內(nèi)容;第4章為Spark環(huán)境搭建和使用,包括Spark系列軟件環(huán)境配置(JDK、Hadoop、MySQL-Server、Hive、ZooKeeper 、Scala、Kafka、Spark)和Spark-shell交互式命令工具使用等內(nèi)容;第5章為Spark RDD彈性分布式數(shù)據(jù)集,包括RDD創(chuàng)建方式、RDD轉(zhuǎn)換算子和行動(dòng)算子操作方法等內(nèi)容;第6章為Spark SQL結(jié)構(gòu)化數(shù)據(jù)處理引擎,包括DataFrame和DataSet的創(chuàng)建和操作以及利用Spark SQL操作MySQL數(shù)據(jù)源等內(nèi)容;第7章為Spark Streaming實(shí)時(shí)流處理引擎,包括Spark Streaming程序開(kāi)發(fā)、DStream 高級(jí)數(shù)據(jù)源使用和數(shù)據(jù)轉(zhuǎn)換操作等內(nèi)容;第8章為Spark MLlib機(jī)器學(xué)習(xí),包括機(jī)器學(xué)習(xí)基礎(chǔ)、Spark MLlib 機(jī)器學(xué)習(xí)庫(kù)和常用算法等內(nèi)容;第9章為訂單交易監(jiān)控系統(tǒng),主要完成訂單交易實(shí)時(shí)監(jiān)控平臺(tái)的搭建,通過(guò)綜合案例全面應(yīng)用Spark大數(shù)據(jù)處理技術(shù)中幾乎所有知識(shí)點(diǎn),幫助讀者運(yùn)用Spark進(jìn)行大數(shù)據(jù)技術(shù)開(kāi)發(fā)和應(yīng)用。

    本書(shū)可作為普通高校或高職院校大數(shù)據(jù)技術(shù)課程的教材,也可供大數(shù)據(jù)技術(shù)領(lǐng)域從業(yè)者參考學(xué)習(xí)。

    本書(shū)配有電子課件、源代碼、課后習(xí)題答案、微課視頻等,讀者可以從中國(guó)水利水電出版社網(wǎng)站(www.waterpub.com.cn)或萬(wàn)水書(shū)苑網(wǎng)站(m.hzxbc.cn)免費(fèi)下載。

    內(nèi)容實(shí)用——理論與實(shí)踐結(jié)合,重點(diǎn)突出應(yīng)用

    體系完善——構(gòu)建完整的大數(shù)據(jù)專業(yè)解決方案

    產(chǎn)教融合——高校企業(yè)共參與,對(duì)標(biāo)行業(yè)標(biāo)準(zhǔn)

    資源豐富——微課、課件、教案、源碼、答案

    隨著大數(shù)據(jù)時(shí)代的到來(lái),無(wú)論是傳統(tǒng)行業(yè)、互聯(lián)網(wǎng)行業(yè)還是IT行業(yè)都將應(yīng)用大數(shù)據(jù)技術(shù)。大數(shù)據(jù)技術(shù)可以幫助企業(yè)進(jìn)行數(shù)據(jù)整合分析并降低生產(chǎn)成本,比如,互聯(lián)網(wǎng)公司可以在廣告業(yè)務(wù)方面進(jìn)行大數(shù)據(jù)應(yīng)用分析、效果分析和定向優(yōu)化等,在推薦系統(tǒng)方面能實(shí)施大數(shù)據(jù)優(yōu)化排名、熱點(diǎn)分析和日志監(jiān)控等。

    Spark是一種基于內(nèi)存的、分布式的大數(shù)據(jù)處理框架,憑借著快速、簡(jiǎn)潔易用以及支持多種運(yùn)行模式而成為很多企業(yè)的大數(shù)據(jù)分析框架。本書(shū)不僅介紹Spark基礎(chǔ)理論和運(yùn)行原理,還深入淺出地講解與Spark學(xué)習(xí)相關(guān)的編程語(yǔ)言、環(huán)境搭建、編程模型、數(shù)據(jù)處理技術(shù)、存儲(chǔ)原理和機(jī)器學(xué)習(xí)等內(nèi)容,所涉及的技術(shù)都結(jié)合代碼進(jìn)行講解并實(shí)現(xiàn)具體功能,讀者可以通過(guò)實(shí)例更加深入地理解Spark的運(yùn)行機(jī)制。

    本書(shū)內(nèi)容主要包括Spark基礎(chǔ)、Scala語(yǔ)言基礎(chǔ)、Spark設(shè)計(jì)與運(yùn)行原理、Spark環(huán)境搭建和使用、Spark RDD彈性分布式數(shù)據(jù)集、Spark SQL結(jié)構(gòu)化數(shù)據(jù)處理引擎、Spark Streaming實(shí)時(shí)流處理引擎、Spark MLlib機(jī)器學(xué)習(xí)、訂單交易監(jiān)控系統(tǒng)等,最后通過(guò)綜合案例全面應(yīng)用Spark中幾乎所有知識(shí)點(diǎn),幫助讀者運(yùn)用Spark進(jìn)行大數(shù)據(jù)技術(shù)開(kāi)發(fā)和應(yīng)用。

    本書(shū)融入了豐富的教學(xué)和實(shí)際工作經(jīng)驗(yàn),內(nèi)容安排合理、結(jié)構(gòu)組織有序,能夠讓讀者循序漸進(jìn)地學(xué)習(xí),通過(guò)精講多個(gè)實(shí)例激發(fā)讀者學(xué)習(xí)興趣,圖文并茂、直觀易懂,適合初學(xué)者快速學(xué)習(xí)Spark編程;本書(shū)實(shí)例豐富,突出該課程操作性強(qiáng)的特點(diǎn),每章由思維導(dǎo)圖、要點(diǎn)、正文、小結(jié)和習(xí)題組成,重點(diǎn)內(nèi)容配有微課視頻講解,課后習(xí)題配有答案,便于學(xué)生課后鞏固相關(guān)知識(shí),并且提供完整源代碼。

    本書(shū)首先講解理論基礎(chǔ)知識(shí),然后圍繞理論知識(shí)點(diǎn)進(jìn)行編程實(shí)踐,最后通過(guò)綜合案例結(jié)合工作實(shí)踐培養(yǎng)分析和解決問(wèn)題的能力,用貼合實(shí)際的應(yīng)用場(chǎng)景提升編程水平,充分鞏固各個(gè)知識(shí)點(diǎn)的應(yīng)用;源代碼全部經(jīng)過(guò)測(cè)試,能夠在Linux操作系統(tǒng)下編譯和運(yùn)行。

    本書(shū)編者均從事大數(shù)據(jù)技術(shù)相關(guān)課程一線教學(xué),如Spark、Hadoop、Java、Python等,具有豐富的教學(xué)經(jīng)驗(yàn)和較強(qiáng)的實(shí)際項(xiàng)目開(kāi)發(fā)能力,主持或參與多個(gè)系統(tǒng)開(kāi)發(fā)項(xiàng)目,部分教師具有企業(yè)軟件開(kāi)發(fā)工作經(jīng)歷。

    本書(shū)由劉仁山、周洪翠、莊新妍任主編,塔娜、腰蘇圖任副主編,主要編寫(xiě)分工如下:莊新妍編寫(xiě)第1章和第2章,塔娜編寫(xiě)第3章和第4章,周洪翠編寫(xiě)第5章和第6章,劉仁山編寫(xiě)第7章并負(fù)責(zé)全書(shū)統(tǒng)稿、修改、定稿工作,腰蘇圖編寫(xiě)第8章和第9章。本書(shū)編寫(xiě)得到了北京華晟經(jīng)世有限公司的大力支持,在此表示感謝。

    盡管編者在編寫(xiě)過(guò)程中力求準(zhǔn)確、完善,但書(shū)中不妥之處在所難免,懇請(qǐng)讀者批評(píng)指正。

    編 者

    2021年9月

    前言
    第1章 Spark基礎(chǔ) 1
    1.1 初識(shí)Spark 2
    1.1.1 Spark簡(jiǎn)介 2
    1.1.2 Spark發(fā)展 2
    1.2 Spark應(yīng)用場(chǎng)景 3
    1.3 Spark生態(tài)系統(tǒng) 4
    1.4 Spark與Hadoop對(duì)比 7
    1.5 Spark多語(yǔ)言編程 8
    本章小結(jié) 9
    練習(xí)一 9
    第2章 Scala語(yǔ)言基礎(chǔ) 11
    2.1 Scala語(yǔ)言概述 12
    2.1.1 Scala語(yǔ)言簡(jiǎn)介 12
    2.1.2 Scala編譯器安裝 12
    2.2 Scala命名規(guī)范 18
    2.2.1 基本語(yǔ)法 18
    2.2.2 Scala 關(guān)鍵字 18
    2.2.3 Scala注釋 19
    2.3 變量 20
    2.3.1 val變量 20
    2.3.2 var變量 20
    2.4 數(shù)據(jù)類型和運(yùn)算符 20
    2.4.1 數(shù)據(jù)類型 20
    2.4.2 運(yùn)算符 21
    2.5 Scala控制結(jié)構(gòu) 23
    2.5.1 if...else語(yǔ)句 23
    2.5.2 循環(huán)語(yǔ)句 24
    2.6 函數(shù)的定義和調(diào)用 26
    2.6.1 內(nèi)置函數(shù)和自定義函數(shù) 26
    2.6.2 函數(shù)的參數(shù) 27
    2.7 Scala的lazy值 29
    2.8 異常Exception的處理 30
    2.9 數(shù)組 31
    2.9.1 定長(zhǎng)數(shù)組和變長(zhǎng)數(shù)組 31
    2.9.2 遍歷數(shù)組 32
    2.9.3 數(shù)組轉(zhuǎn)換 32
    2.9.4 數(shù)組常用方法 33
    2.10 元組 33
    2.10.1 創(chuàng)建元組 33
    2.10.2 元組的訪問(wèn)和遍歷 34
    2.10.3 拉鏈操作 34
    2.11 集合 34
    2.11.1 列表(List) 34
    2.11.2 集合(Set) 37
    2.11.3 映射(Map) 38
    2.12 類 40
    2.12.1 類的定義 40
    2.12.2 get方法和set方法 41
    2.12.3 構(gòu)造器 41
    2.12.4 內(nèi)部類 42
    2.13 單例對(duì)象和伴生對(duì)象 43
    2.13.1 單例(object)對(duì)象 43
    2.13.2 伴生對(duì)象 44
    2.13.3 apply方法 44
    2.14 Scala中的繼承 45
    2.14.1 父類具有無(wú)參構(gòu)造器的繼承 46
    2.14.2 父類具有帶參構(gòu)造器的繼承 46
    2.15 抽象 47
    2.16 Scala中的特質(zhì) 48
    2.16.1 將特質(zhì)作為接口使用 48
    2.16.2 在特質(zhì)中定義具體的方法 49
    2.16.3 混合使用特質(zhì)的具體方法和抽象方法 49
    2.17 Scala包和引用 50
    2.17.1 創(chuàng)建包 50
    2.17.2 引用 50
    2.17.3 包重命名和隱藏方法 51
    本章小結(jié) 51
    練習(xí)二 52
    第3章 Spark設(shè)計(jì)與運(yùn)行原理 53
    3.1 Spark架構(gòu)設(shè)計(jì) 54
    3.1.1 Spark相關(guān)術(shù)語(yǔ) 54
    3.1.2 Spark架構(gòu) 55
    3.1.3 Spark運(yùn)行流程 56
    3.2 Spark核心功能 57
    3.2.1 Spark Core組成 57
    3.2.2 Spark編程模型 58
    3.2.3 Spark計(jì)算模型 59
    3.3 Spark運(yùn)行模式 60
    3.3.1 Local(本地)模式 60
    3.3.2 Standalone(獨(dú)立)模式 61
    3.3.3 Mesos(Spark on Mesos)模式 62
    3.3.4 Yarn(Spark on Yarn)模式 63
    本章小結(jié) 66
    練習(xí)三 66
    第4章 Spark環(huán)境搭建和使用 67
    4.1 Spark開(kāi)發(fā)環(huán)境概述 68
    4.2 操作系統(tǒng)及其網(wǎng)絡(luò)環(huán)境準(zhǔn)備 68
    4.2.1 操作系統(tǒng)環(huán)境 68
    4.2.2 遠(yuǎn)程登錄 79
    4.2.3 Linux系統(tǒng)軟件源配置 82
    4.2.4 安裝和配置第二臺(tái)和第三臺(tái)虛擬機(jī) 84
    4.3 Spark環(huán)境搭建 88
    4.3.1 安裝JDK 88
    4.3.2 安裝Hadoop 90
    4.3.3 安裝MySQL Server 100
    4.3.4 安裝Hive 102
    4.3.5 安裝ZooKeeper 109
    4.3.6 安裝Scala 111
    4.3.7 安裝Kafka 112
    4.3.8 安裝Spark 114
    4.4 Spark集群環(huán)境測(cè)試 116
    4.4.1 使用Spark-submit提交任務(wù) 116
    4.4.2 使用Spark-shell交互式命令工具 120
    本章小結(jié) 122
    練習(xí)四 122
    第5章 Spark RDD彈性分布式數(shù)據(jù)集 123
    5.1 RDD簡(jiǎn)介 124
    5.1.1 RDD的特征 124
    5.1.2 詞頻統(tǒng)計(jì)(WordCount)案例實(shí)現(xiàn)過(guò)程 124
    5.1.3 RDD的創(chuàng)建 126
    5.2 常用操作 130
    5.2.1 常用的轉(zhuǎn)換 131
    5.2.2 常用的動(dòng)作 137
    5.2.3 實(shí)例操作 141
    5.3 RDD的分區(qū) 145
    5.3.1 分區(qū)的概念 145
    5.3.2 分區(qū)原則和方法 146
    5.4 持久化 146
    5.4.1 持久化存儲(chǔ)級(jí)別 147
    5.4.2 持久化存儲(chǔ)級(jí)別的選擇 147
    5.5 容錯(cuò)機(jī)制 148
    5.6 綜合實(shí)例 148
    本章小結(jié) 154
    練習(xí)五 154
    第6章 Spark SQL結(jié)構(gòu)化數(shù)據(jù)處理引擎 155
    6.1 Spark SQL的基礎(chǔ)知識(shí) 156
    6.1.1 Spark SQL簡(jiǎn)介 156
    6.1.2 Spark SQL數(shù)據(jù)抽象 156
    6.1.3 程序主入口SparkSession 156
    6.2 DataFrame 157
    6.2.1 DataFrame簡(jiǎn)介 157
    6.2.2 創(chuàng)建DataFrame 158
    6.2.3 DataFrame查看操作 165
    6.2.4 DataFrame查詢操作 168
    6.2.5 DataFrame輸出操作 174
    6.3 DataSet 175
    6.3.1 DataSet簡(jiǎn)介 175
    6.3.2 創(chuàng)建DataSet 176
    6.4 Spark SQL操作數(shù)據(jù)源 178
    本章小結(jié) 181
    練習(xí)六 182
    第7章 Spark Streaming實(shí)時(shí)流處理引擎 184
    7.1 離線計(jì)算與實(shí)時(shí)計(jì)算 185
    7.1.1 離線計(jì)算 185
    7.1.2 實(shí)時(shí)計(jì)算 185
    7.1.3 離線計(jì)算與實(shí)時(shí)計(jì)算比較 185
    7.2 初探Spark Streaming 186
    7.2.1 Spark Streaming簡(jiǎn)介 186
    7.2.2 Spark Streaming工作原理 186
    7.2.3 Spark Streaming入門(mén)程序 188
    7.3 Spark Streaming程序開(kāi)發(fā) 190
    7.3.1 Spark Streaming環(huán)境準(zhǔn)備 190
    7.3.2 Spark Streaming項(xiàng)目搭建 190
    7.3.3 Spark Streaming核心代碼 191
    7.3.4 Spark Streaming啟動(dòng)及測(cè)試 193
    7.4 DStream輸入 194
    7.4.1 離散流(DStream) 194
    7.4.2 DStream輸入源 194
    7.4.3 文件流數(shù)據(jù)源 196
    7.4.4 RDD 隊(duì)列流 197
    7.4.5 Spark Streaming整合 Flume 197
    7.4.6 Spark Streaming整合Kafka 201
    7.5 DStream操作 203
    7.5.1 無(wú)狀態(tài)操作 204
    7.5.2 有狀態(tài)操作 204
    7.5.3 DStream窗口操作 205
    7.5.4 DStream輸出操作 206
    本章小結(jié) 208
    練習(xí)七 208
    第8章 Spark MLlib機(jī)器學(xué)習(xí) 210
    8.1 機(jī)器學(xué)習(xí)概述 211
    8.1.1 機(jī)器學(xué)習(xí)簡(jiǎn)介 211
    8.1.2 大數(shù)據(jù)與機(jī)器學(xué)習(xí) 211
    8.1.3 機(jī)器學(xué)習(xí)與人工智能 212
    8.1.4 機(jī)器學(xué)習(xí)與深度學(xué)習(xí) 212
    8.1.5 機(jī)器學(xué)習(xí)發(fā)展過(guò)程 213
    8.1.6 機(jī)器學(xué)習(xí)應(yīng)用 213
    8.2 機(jī)器學(xué)習(xí)分類 214
    8.2.1 監(jiān)督學(xué)習(xí) 215
    8.2.2 無(wú)監(jiān)督學(xué)習(xí) 215
    8.2.3 半監(jiān)督學(xué)習(xí) 215
    8.2.4 強(qiáng)化學(xué)習(xí) 216
    8.2.5 機(jī)器學(xué)習(xí)的基本任務(wù) 216
    8.3 機(jī)器學(xué)習(xí)基本流程 216
    8.3.1 機(jī)器學(xué)習(xí)基本步驟 216
    8.3.2 Spark機(jī)器學(xué)習(xí)流程 217
    8.4 Spark MLlib機(jī)器學(xué)習(xí)庫(kù) 220
    8.4.1 MLlib介紹 220
    8.3.2 MLlib數(shù)據(jù)類型 221
    8.3.3 MLlib 統(tǒng)計(jì)工具 224
    8.5 Spark MLlib常用算法 227
    8.5.1 算法的選擇 227
    8.5.2 分類算法 228
    8.5.3 回歸算法 229
    8.5.4 聚類算法 231
    8.5.6 協(xié)同過(guò)濾算法 231
    本章小結(jié) 233
    練習(xí)八 233
    第9章 訂單交易監(jiān)控系統(tǒng) 234
    9.1 系統(tǒng)介紹 235
    9.1.1 項(xiàng)目背景 235
    9.1.2 相關(guān)技術(shù)介紹 235
    9.2 系統(tǒng)設(shè)計(jì) 236
    9.2.1 流程設(shè)計(jì) 236
    9.2.2 系統(tǒng)架構(gòu) 237
    9.2.3 技術(shù)選型 237
    9.3 基礎(chǔ)環(huán)境配置 238
    9.3.1 MariaDB數(shù)據(jù)庫(kù)部署 238
    9.3.2 ZooKeeper集群部署 241
    9.3.3 Kafka集群部署 243
    9.3.4 Canal安裝配置 244
    9.3.5 HBase安裝配置 246
    9.4 系統(tǒng)功能開(kāi)發(fā) 248
    9.4.1 訂單交易數(shù)據(jù)表設(shè)計(jì) 248
    9.4.2 訂單Mock數(shù)據(jù)生成 249
    9.4.3 訂單交易數(shù)據(jù)采集 253
    9.4.4 訂單交易數(shù)據(jù)分析 254
    本章小結(jié) 258
    練習(xí)九 259
    參考文獻(xiàn) 260
最新評(píng)論共有 0 位網(wǎng)友發(fā)表了評(píng)論
發(fā)表評(píng)論
評(píng)論內(nèi)容:不能超過(guò)250字,需審核,請(qǐng)自覺(jué)遵守互聯(lián)網(wǎng)相關(guān)政策法規(guī)。
用戶名: 密碼:
匿名?
注冊(cè)
主站蜘蛛池模板: 国产三级国产精品国产普男人 | 99久久免费国产精品 | 手机看片福利视频 | 久久精品视频网站 | 亚洲欧美一区二区三区在饯 | 揉揉胸摸腿摸下面va视频 | 成年人在线视频 | 精品国产美女福利到在线不卡 | 久久在线免费观看视频 | 欧美中文字幕一区二区三区 | 欧美一区二区三区在线观看免费 | 精品久久久久久久 | 韩国美女激情视频一区二区 | 亚洲国产成a人v在线观看 | 国产精品大全 | 台湾黄三级高清在线观看播放 | 成人中文在线 | 99在线播放视频 | 欧美 日韩 国产在线 | 亚洲 欧美 精品专区 极品 | 精品欧美激情在线看 | 亚洲日本久久一区二区va | 黄色毛片免费看 | 成人午夜免费视频 | 国产男女在线观看 | 国产制服 国产制服一区二区 | 一及 片日本 | 欧美日韩一 | 一个人看的www日本高清视频 | 天天干夜夜怕 | 精品国产一区二区三区不卡 | 成年女人毛片 | 欧美一区二区三区播放 | 天天看片天天爽 | 国内主播福利视频在线观看 | 日韩欧美一区二区不卡看片 | 成人三级网址 | 99九九成人免费视频精品 | 亚洲综合一区二区不卡 | 日韩一级影院 | 久久精品成人免费看 |