R語言基礎(chǔ)及應(yīng)用

-
【作 者】主 編 涂旭東 黃源
【I S B N 】978-7-5170-9567-5
【責(zé)任編輯】石永峰
【適用讀者群】本專通用
【出版時(shí)間】2021-05-22
【開 本】16開
【裝幀信息】平裝(光膜)
【版 次】第1版第1次印刷
【頁 數(shù)】240
【千字?jǐn)?shù)】374
【印 張】15
【定 價(jià)】¥45
【叢 書】普通高等教育數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)教材
【備注信息】
簡介
本書特色
前言
章節(jié)列表
精彩閱讀
下載資源
相關(guān)圖書
本書以理論與實(shí)踐操作相結(jié)合的方式深入講解R語言的基本理論和實(shí)現(xiàn)方法,在內(nèi)容設(shè)計(jì)上既有上課時(shí)老師講述的部分(包括詳細(xì)的理論與典型的案例),又有最新的實(shí)訓(xùn)案例分析,雙管齊下,極大地激發(fā)了學(xué)生的學(xué)習(xí)積極性和主動(dòng)創(chuàng)造性,增加了趣味性,讓學(xué)生在課堂上跟上老師的思維,從而學(xué)到更多的知識和技能。
本書的編寫目的是向讀者介紹R語言的基本概念與應(yīng)用。本書共9章:R語言簡介、數(shù)據(jù)類型與數(shù)據(jù)對象、控制語句與函數(shù)、數(shù)據(jù)的讀寫與預(yù)處理、R語言基本圖形、ggplot2繪圖基礎(chǔ)和R語言高級繪圖、R語言數(shù)據(jù)分析基礎(chǔ)、R語言機(jī)器學(xué)習(xí)基礎(chǔ)、R語言訪問SQL數(shù)據(jù)庫。
本書可作為大數(shù)據(jù)專業(yè)、人工智能專業(yè)、云計(jì)算專業(yè)的教材,也可作為大數(shù)據(jù)愛好者的參考書。
內(nèi)容實(shí)用——理論與實(shí)踐結(jié)合,重點(diǎn)突出應(yīng)用
體系完善——構(gòu)建完整的大數(shù)據(jù)專業(yè)解決方案
產(chǎn)教融合——高校企業(yè)共參與,對標(biāo)行業(yè)標(biāo)準(zhǔn)
資源豐富——微課、課件、教案、源碼、答案
大數(shù)據(jù)作為新一輪工業(yè)革命中最為活躍的技術(shù)創(chuàng)新要素正在對全球競爭、國家治理、經(jīng)濟(jì)發(fā)展、產(chǎn)業(yè)轉(zhuǎn)型、社會生活等產(chǎn)生全面而深刻的影響;移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、數(shù)字家庭、電子商務(wù)等新一代信息技術(shù)的應(yīng)用每天都在源源不斷地產(chǎn)生大量的數(shù)據(jù),對大數(shù)據(jù)的處理分析正成為新一代信息技術(shù)融合應(yīng)用的結(jié)合點(diǎn)。而靈活性、開放性、優(yōu)秀的統(tǒng)計(jì)分析能力和卓越的繪圖功能、收錄超過1.4萬個(gè)數(shù)據(jù)分析工具包、幾乎涵蓋各個(gè)行業(yè)數(shù)據(jù)分析中的所有方法使R語言成為大數(shù)據(jù)時(shí)代的新寵,越來越被學(xué)界和業(yè)界所重視,多種大數(shù)據(jù)架構(gòu)平臺上已經(jīng)提供基于R語言的擴(kuò)展和插件。借助R語言的高效性,大數(shù)據(jù)分析可實(shí)現(xiàn)事半功倍。
本書以理論與實(shí)踐操作相結(jié)合的方式深入講解R語言的基本理論和實(shí)現(xiàn)方法,在內(nèi)容設(shè)計(jì)上既有上課時(shí)老師講述的部分(包括詳細(xì)的理論與典型的案例),又有最新的實(shí)訓(xùn)案例分析,雙管齊下,極大地激發(fā)了學(xué)生的學(xué)習(xí)積極性和主動(dòng)創(chuàng)造性,增加了趣味性,讓學(xué)生在課堂上跟上老師的思維,從而學(xué)到更多的知識和技能。
本書特色如下:
(1)采用“理實(shí)一體化”教學(xué)方式:課堂上既有老師的講述內(nèi)容又有學(xué)生獨(dú)立思考、上機(jī)操作的內(nèi)容。
(2)豐富的教學(xué)案例:包含教學(xué)課件、習(xí)題答案等多種教學(xué)資源。
(3)緊跟時(shí)代潮流,關(guān)注最新技術(shù)和前沿?zé)狳c(diǎn),書中既包含最新熱點(diǎn)數(shù)據(jù)的案例分析,又包含唯美的數(shù)據(jù)可視化技術(shù)。
(4)編寫本書的老師都具有多年教學(xué)經(jīng)驗(yàn),做到重難點(diǎn)突出,能夠激發(fā)學(xué)生的學(xué)習(xí)熱情。
(5)配有微課視頻:對本書中的重難點(diǎn)進(jìn)行細(xì)致講解,方便學(xué)生課后學(xué)習(xí)。
本書可作為大數(shù)據(jù)專業(yè)、人工智能專業(yè)、云計(jì)算專業(yè)的教材,也可作為大數(shù)據(jù)愛好者的參考書。
本書建議學(xué)時(shí)為60學(xué)時(shí),具體分布見下表。
章節(jié) 建議學(xué)時(shí)
R語言簡介 2
數(shù)據(jù)類型與數(shù)據(jù)對象 6
控制語句與函數(shù) 8
數(shù)據(jù)的讀寫與預(yù)處理 12
R語言基本圖形 6
ggplot2繪圖基礎(chǔ)和R語言高級繪圖 8
R語言數(shù)據(jù)分析基礎(chǔ) 8
R語言機(jī)器學(xué)習(xí)基礎(chǔ) 6
R語言訪問SQL數(shù)據(jù)庫 4
本書由涂旭東、黃源任主編。其中,黃源編寫第1章、第2章和第8章并負(fù)責(zé)策劃與統(tǒng)稿工作,涂旭東編寫第3章至第7章和第9章。
本書是校企合作的結(jié)果,在編寫過程中得到重慶譽(yù)存大數(shù)據(jù)有限公司黃遠(yuǎn)江博士的大力支持,同時(shí)編者參閱了大量相關(guān)資料,在此一并表示感謝。
由于編者水平有限,書中難免存在疏漏甚至錯(cuò)誤之處,懇請讀者批評指正,編者電子郵箱:2103069667@qq.com。
編 者
2021年2月
1.1 R語言概述 2
1.1.1 什么是R語言 2
1.1.2 R語言的特點(diǎn) 2
1.2 R的下載與運(yùn)行 2
1.2.1 R的下載 3
1.2.2 R的運(yùn)行 4
1.2.3 在R中查看幫助 6
1.3 R語言包 8
1.3.1 R語言包的安裝 9
1.3.2 R語言包的載入 9
1.3.3 R語言包的使用 9
1.4 實(shí)訓(xùn) 10
1.5 本章小結(jié) 11
練習(xí)1 11
第2章 數(shù)據(jù)類型與數(shù)據(jù)對象 12
2.1 數(shù)據(jù)類型 13
2.1.1 什么是數(shù)據(jù)類型 13
2.1.2 常見的數(shù)據(jù)類型 13
2.2 變量與標(biāo)量 14
2.2.1 變量 14
2.2.2 標(biāo)量 15
2.3 R語言中的數(shù)據(jù)對象 16
2.3.1 向量 16
2.3.2 矩陣 20
2.3.3 數(shù)組 23
2.3.4 列表 24
2.3.5 因子 26
2.3.6 數(shù)據(jù)框 26
2.4 R語言中數(shù)據(jù)類型的轉(zhuǎn)換 31
2.4.1 類型轉(zhuǎn)換函數(shù)介紹 31
2.4.2 R中數(shù)據(jù)類型轉(zhuǎn)換實(shí)例 32
2.5 實(shí)訓(xùn) 32
2.6 本章小結(jié) 33
練習(xí)2 34
第3章 控制語句與函數(shù) 35
3.1 條件結(jié)構(gòu) 36
3.1.1 條件表達(dá)式 36
3.1.2 if語句 36
3.1.3 switch語句 38
3.2 循環(huán)結(jié)構(gòu) 39
3.2.1 for循環(huán) 39
3.2.2 while循環(huán) 40
3.2.3 break語句 40
3.2.4 repeat語句 40
3.3 函數(shù) 41
3.3.1 自定義R函數(shù) 41
3.3.2 返回值 42
3.3.3 函數(shù)的參數(shù) 42
3.3.4 程序的向量化實(shí)現(xiàn) 43
3.3.5 apply()函數(shù)族 44
3.3.6 養(yǎng)成良好的代碼編寫習(xí)慣 49
3.4 實(shí)訓(xùn) 49
3.5 本章小結(jié) 51
練習(xí)3 51
第4章 數(shù)據(jù)的讀寫與預(yù)處理 53
4.1 數(shù)據(jù)的輸入 54
4.1.1 工作目錄 54
4.1.2 向量的輸入 54
4.1.3 數(shù)據(jù)文件的讀取 55
4.1.4 讀取數(shù)據(jù)文件的注意事項(xiàng) 57
4.2 數(shù)據(jù)的輸出 58
4.2.1 屏幕輸出 58
4.2.2 向量的輸出 58
4.2.3 數(shù)據(jù)文件的輸出 59
4.3 R工作空間的保存和加載 61
4.3.1 R工作空間的保存 61
4.3.2 R工作空間的加載 61
4.4 變量的預(yù)處理 62
4.4.1 變量重編碼 62
4.4.2 變量重命名 63
4.4.3 變量的排序 63
4.4.4 變量類型的轉(zhuǎn)換 64
4.5 字符串的處理 65
4.5.1 字符串分割 65
4.5.2 字符串拼接 66
4.5.3 字符串長度計(jì)算 67
4.5.4 字符串截取 68
4.5.5 字符串替換 69
4.5.6 字符串大小寫轉(zhuǎn)換 70
4.5.7 字符串匹配 71
4.5.8 字符串格式化輸出 72
4.5.9 使用stringr包處理字符串 73
4.6 日期變量的處理和轉(zhuǎn)換 75
4.6.1 取系統(tǒng)日期和時(shí)間 75
4.6.2 把字符串解析成日期和時(shí)間 76
4.6.3 把日期和時(shí)間解析成字符串 76
4.6.4 對日期中相關(guān)信息的提取與比較 77
4.6.5 使用lubridate包處理日期變量 77
4.7 清洗重復(fù)數(shù)據(jù) 80
4.7.1 查找是否有重復(fù)值 80
4.7.2 查找重復(fù)值的索引值 80
4.7.3 去除重復(fù)值 81
4.8 缺失數(shù)據(jù)處理 81
4.8.1 缺失數(shù)據(jù)的識別 81
4.8.2 缺失數(shù)據(jù)的處理 82
4.9 異常值識別和處理 83
4.9.1 簡單統(tǒng)計(jì)量分析 83
4.9.2 根據(jù)3σ原則檢測異常值 84
4.9.3 根據(jù)箱型圖檢測異常值 84
4.9.4 蓋帽法 85
4.10 數(shù)據(jù)集的合并與拆分 86
4.10.1 數(shù)據(jù)集的合并 86
4.10.2 數(shù)據(jù)集的拆分 89
4.10.3 數(shù)據(jù)集的抽取 89
4.10.4 使用tidyr包 92
4.11 實(shí)訓(xùn) 94
4.12 本章小結(jié) 99
練習(xí)4 99
第5章 R語言基本圖形 100
5.1 R語言常見圖形 101
5.1.1 散點(diǎn)圖 101
5.1.2 點(diǎn)圖 102
5.1.3 折線圖 102
5.1.4 曲線圖 103
5.1.5 條形圖 104
5.1.6 餅圖 105
5.1.7 箱線圖 107
5.1.8 直方圖 109
5.2 R語言圖形修飾 109
5.2.1 設(shè)置符號和線條 110
5.2.2 設(shè)置顏色 111
5.2.3 設(shè)置文本屬性 111
5.2.4 添加標(biāo)題 112
5.2.5 添加圖例 113
5.2.6 添加線 113
5.2.7 添加坐標(biāo)軸 115
5.2.8 添加文本標(biāo)注 115
5.3 圖形的布局和保存 116
5.3.1 一頁多圖 116
5.3.2 保存圖形 117
5.4 實(shí)訓(xùn) 117
5.5 本章小結(jié) 123
練習(xí)5 123
第6章 ggplot2繪圖基礎(chǔ)和R語言高級繪圖 125
6.1 ggplot2繪圖基礎(chǔ) 126
6.1.1 數(shù)據(jù)(Data) 126
6.1.2 映射(Mapping) 127
6.1.3 幾何對象(Geometric) 128
6.1.4 標(biāo)尺(Scale) 131
6.1.5 統(tǒng)計(jì)變換(Statistics) 132
6.1.6 坐標(biāo)系統(tǒng)(Coordinate) 133
6.1.7 圖層(Layer) 134
6.1.8 分面(Facet) 135
6.1.9 主題(Theme) 135
6.1.10 ggplot2繪圖的一般步驟 136
6.2 R語言高級繪圖 136
6.2.1 散點(diǎn)圖矩陣 136
6.2.2 關(guān)系矩陣圖和相關(guān)系數(shù)矩陣 137
6.2.3 橢圓 138
6.2.4 三維散點(diǎn)圖 139
6.2.5 氣泡圖 139
6.2.6 網(wǎng)絡(luò)圖 140
6.2.7 馬賽克圖 141
6.2.8 關(guān)鍵字云 142
6.2.9 雷達(dá)圖 143
6.2.10 山巒圖 144
6.2.11 交互圖 146
6.3 實(shí)訓(xùn) 146
6.4 本章小結(jié) 155
練習(xí)6 155
第7章 R語言數(shù)據(jù)分析基礎(chǔ) 156
7.1 描述性統(tǒng)計(jì)分析 157
7.1.1 常用統(tǒng)計(jì)量簡介 157
7.1.2 描述性統(tǒng)計(jì)的函數(shù)實(shí)現(xiàn) 159
7.2 R語言數(shù)據(jù)分析常用函數(shù) 161
7.3 t-檢驗(yàn) 164
7.3.1 單樣本t-檢驗(yàn) 164
7.3.2 配對樣本t-檢驗(yàn) 165
7.4 相關(guān)分析 166
7.4.1 相關(guān)性概念 166
7.4.2 相關(guān)分析 167
7.5 聚類分析 169
7.5.1 聚類分析的概念 169
7.5.2 計(jì)算樣本間的距離 169
7.5.3 計(jì)算類與類之間的距離 171
7.5.4 相似系數(shù) 171
7.5.5 聚類分析的主要步驟 172
7.5.6 分層聚類 172
7.5.7 k-means聚類 173
7.5.8 聚類分析的實(shí)現(xiàn) 174
7.6 主成分分析 175
7.6.1 主成分分析的基本思想 175
7.6.2 主成分分析的幾何解釋 176
7.6.3 主成分分析的數(shù)學(xué)模型 177
7.6.4 主成分分析的實(shí)現(xiàn) 177
7.7 實(shí)訓(xùn) 179
7.8 本章小結(jié) 182
練習(xí)7 183
第8章 R語言機(jī)器學(xué)習(xí)基礎(chǔ) 184
8.1 機(jī)器學(xué)習(xí)概述 185
8.1.1 認(rèn)識機(jī)器學(xué)習(xí) 185
8.1.2 機(jī)器學(xué)習(xí)的應(yīng)用 185
8.2 機(jī)器學(xué)習(xí)分類 186
8.2.1 監(jiān)督學(xué)習(xí) 186
8.2.2 無監(jiān)督學(xué)習(xí) 187
8.2.3 半監(jiān)督學(xué)習(xí) 188
8.3 機(jī)器學(xué)習(xí)常用算法 189
8.3.1 線性回歸 189
8.3.2 邏輯回歸 196
8.3.3 聚類 201
8.3.4 神經(jīng)網(wǎng)絡(luò) 204
8.4 機(jī)器學(xué)習(xí)基本流程 206
8.4.1 數(shù)據(jù)的收集 206
8.4.2 數(shù)據(jù)預(yù)處理與特征工程 208
8.4.3 模型的選擇與訓(xùn)練 209
8.4.4 模型的評估 209
8.5 實(shí)訓(xùn) 210
8.6 本章小結(jié) 214
練習(xí)8 214
第9章 R語言訪問SQL數(shù)據(jù)庫 215
9.1 R語言訪問數(shù)據(jù)庫的基本原理 216
9.2 R語言訪問SQLite數(shù)據(jù)庫 216
9.3 R語言訪問MySQL數(shù)據(jù)庫 219
9.4 R語言訪問Oracle數(shù)據(jù)庫 222
9.5 ODBC和RODBC包介紹 224
9.6 實(shí)訓(xùn) 227
9.7 本章小結(jié) 229
練習(xí)9 230
參考文獻(xiàn) 231
- 零基礎(chǔ)玩轉(zhuǎn)國產(chǎn)大模型DeepSeek [徐永冰 張帥 編著]
- 網(wǎng)絡(luò)工程師5天修煉(適配第6版考綱) [主編 朱小平 施游]
- 信息系統(tǒng)項(xiàng)目管理師考試32小時(shí)通關(guān)(適用第4版考綱) [薛大龍]
- 信息系統(tǒng)管理工程師考試32小時(shí)通關(guān)(適配第2版考綱) [薛大龍 劉偉]
- 土木工程材料檢測實(shí)訓(xùn) [洪曉江 達(dá)則曉麗 錢波]
- 科技信息檢索與論文寫作實(shí)用教程 [李振華]
- 傳統(tǒng)山水畫論解讀與實(shí)踐 [陳鈉 著]
- Python數(shù)據(jù)庫編程 [主編 殷樹友 邢 翀]
- 計(jì)算機(jī)基礎(chǔ)實(shí)訓(xùn)指導(dǎo) [主編 袁春萍 朱妮]
- 嵌入式人工智能技術(shù)應(yīng)用(數(shù)字教材) [主編 胡娜 楊國勇 晏廷榮]
- Vienna整流器技術(shù) [桂存兵 著]
- 變頻器與伺服應(yīng)用 [陳剛 葉云飛]
- 物聯(lián)網(wǎng)工程設(shè)計(jì)與實(shí)踐 [湯琳 李敏]
- 爐邊夜話——深入淺出話AI [汪建 著]
- 電商運(yùn)營與管理 [鐘肖英 陳瀟]
- Java面向?qū)ο蟪绦蛟O(shè)計(jì) [主編 姜春磊 陳虹潔]
- 信息技術(shù)基礎(chǔ)(Windows 10+WPS Office)(微課版) [主編 石利平 田輝平 謝盛嘉]
- 人工智能應(yīng)用 [主編 陳 萍 劉培培 陳孟軍]
- 大學(xué)生職業(yè)發(fā)展與就業(yè)指導(dǎo) [主編 劉志堅(jiān)]
- 高級辦公應(yīng)用項(xiàng)目教程 [主編 屈晶 趙成麗]
- 微信小程序開發(fā)項(xiàng)目實(shí)戰(zhàn)(微課版) [主編 黃龍泉 郭峰 朱倩]
- 企業(yè)檔案工作實(shí)戰(zhàn)寶典百問百答 [華俊 盧秀英 邵甜甜 著]
- 計(jì)算機(jī)網(wǎng)絡(luò)原理及應(yīng)用 [主編 唐繼勇 葉坤 孫夢娜]
- 大學(xué)生創(chuàng)業(yè)基礎(chǔ) [主編 王麗莉 王 楊]
- 船舶輔機(jī) [主編 王連海 于洋 姜淑翠]
- 大學(xué)生就業(yè)指導(dǎo) [主編 王麗莉 董宴廷]
- 系統(tǒng)架構(gòu)設(shè)計(jì)師章節(jié)習(xí)題與考點(diǎn)特訓(xùn) [主編 薛大龍 鄒月平]
- 高校學(xué)生工作探索與實(shí)踐 [郭亮 著]
- 大學(xué)生情商管理 [方雄 著]
- 2023年長沙市會展業(yè)發(fā)展報(bào)告 [主編 周棟良]
- 生活經(jīng)管more>>
- 云計(jì)算原理
- Python數(shù)據(jù)分析
- 大數(shù)據(jù)技術(shù)導(dǎo)論
- HBase分布式存儲系統(tǒng)應(yīng)用(第二版)
- Hive編程技術(shù)與應(yīng)用(第二版)
- Python 語言程序設(shè)計(jì)實(shí)踐指導(dǎo)
- Spark大數(shù)據(jù)處理技術(shù)
- 數(shù)據(jù)清洗
- R語言基礎(chǔ)及應(yīng)用
- 數(shù)據(jù)庫原理及應(yīng)用(MySQL版)
- 大數(shù)據(jù)導(dǎo)論
- 大數(shù)據(jù)可視化技術(shù)
- Python語言程序設(shè)計(jì)
- Java編程基礎(chǔ)
- Java編程基礎(chǔ)實(shí)踐指導(dǎo)
- 深度學(xué)習(xí)—卷積神經(jīng)網(wǎng)絡(luò)算法原理與應(yīng)用