課程特色
1. 本課程盡量避開數學公式,按照“講清思想方法原理—結合具體案例—R語言實現細節(jié)”思路,讓即使是幾乎沒有什么基礎的學員,掌握數據挖掘和可視化的基本思路和模式,打下未來深入的良好基礎,能在工作和學習中結合具體問題立馬上手操作解決;
2. 課程注重學練結合的方法,會采取課中練習的方法,充分調動大家思考的積極性,在做中掌握相關知識和技能;
3. 課程緊緊抓住基于R語言的數據挖掘和可視化的重點和難點,詳細的分析和講解,在理解難、容易出錯的地方反復提醒,以便學員在課后容易的進行自己復習和相關拓展。
課程大綱
第一天
上午數據處理及復雜數據可視化(一)
第一講 大數據挖掘及可視化介紹
數據挖掘及可視化背景
數據挖掘流程
常用挖掘工具介紹
R語言的優(yōu)勢
R數據挖掘可視化工具-Rattle快速上手
R語言對復雜數據可視化的優(yōu)勢
R語言快速入門
利用caret包做數據抽樣及虛擬化處理
第一天
下午數據處理及復雜數據可視化(二)
第二講 數據質量分析及高級可視化
缺失值處理的高級方法
異常值甄別的高級方法
數據可視化進階:lattice及ggplot2包介紹
數據交互可視化:rCharts、recharts、networkD3、plotly等包介紹
第二天
上午數據挖掘模型實戰(zhàn)(一)
第三講 聚類分析及R語言實現
聚類分析是一種原理簡單、應用廣泛的數據挖掘技術。顧名思義,聚類分析即是把若干事物按照某種標準歸為幾個類別,其中較為相近的聚為一類,不那么相近的聚于不同類。
案例一:對著名的鳶尾花數據進行K均值聚類分析
案例二:對汽車數據進行K均值聚類分析
案例三:對洛杉磯街區(qū)數據進行層次聚類
案例四:對汽車數據進行層次聚類
第四講 關聯規(guī)則及R語言實現
關聯規(guī)則(著名的“啤酒和尿布”)是數據挖掘的基礎和核心技術之一,本講將著重圍繞經典的Apriori算法,闡明關聯規(guī)則的支持、置信和提升程度與控制,使用R語言快速完成關聯規(guī)則分析,并通過arulesViz擴展包對關聯規(guī)則進行可視化展示。
案例:利用超市購物籃Groceries數據進行關聯規(guī)則分析
第二天
下午數據挖掘模型實戰(zhàn)(二)
第五講 KNN近鄰算法及R語言實現
KNN(k-Nearest Neighbor)分類算法是數據挖掘分類技術中較簡單的方法之一。所謂k最近鄰,就是k個最近的鄰居的意思,說的是每個樣本都可以用它最接近的k個鄰居來代表。
案例一:對鳶尾花數據集進行knn分類
案例二:對乳腺癌數據進行knn分類
案例三:對文本數據進行knn分類
第六講 決策樹分類及R語言實現
決策樹是數據挖掘的經典方法,其原理容易被理解。本講主要講授兩種最為普遍的決策樹算法:CART和C5.0算法,使用rpart和C50函數進行R語言分析。
案例一:對鳶尾花數據集運用C50算法分類
案例二:對鳶尾花數據集運用CART算法進行分類
案例三:對汽車數據運用CART對汽車重量進行預測
第三天
上午行業(yè)應用案例分享(一)
第七講 深度挖掘用戶付費行為及社會網絡分析
對用戶的購買行為進行購物籃分析
智能推薦系統(tǒng)常用算法介紹
對用戶購物行為構建智能推薦系統(tǒng)
社會網絡圖基本知識
利用R語言繪制社會網絡圖
利用Gephi繪制社會網絡圖
對用戶購物行為進行聚類分析,發(fā)現社群
第三天
下午行業(yè)應用案例分享(二)
第八講 航空公司客戶價值分析
背景與挖掘目標
分析方法及過程
數據探索分析
數據預處理
模型構建
模型應用
第九講 漏斗模型及路徑分析
漏斗模型的主要應用場景
路徑分析的主要應用場景
漏斗模型與路徑分析的不同點
sunburst事件路徑圖的繪制方法
利用基于時序的關聯規(guī)則對點擊事件進行分析
第四天學習考核與業(yè)內經驗交流
授課師資
謝老師 計算機碩士,數據分析與可視化專家,高級培訓講師。中國R語言資深顧問,WOT“互聯網+”大數據技術、百城沙龍大數據沙龍廣深兩地特邀顧問。目前就職于某集團上市公司的高級數據分析師,主要利用R語言進行大數據的挖掘和可視化工作。本人從事數據挖掘建模工作已有8年,曾經從事過咨詢、電商、電購、電力、游戲等行業(yè),了解不同領域的數據特點。有豐富的利用R語言進行數據挖掘實戰(zhàn)經驗,部分研究成果曾獲得國家專利。培訓過的精品課程有:《R語言基礎培訓》、《Rattle:可視化數據挖掘工具》、《數據分析之R語言實戰(zhàn)》、《機器學習與R語言實踐》、《R語言與文本挖掘》
鐘老師 現任職于中科院某研究所,高級工程師,副高職稱,博士畢業(yè)于中國科學院計算技術研究所,獲工學博士學位(計算機系統(tǒng)結構方向)。中培教育的大數據、云計算、移動互聯網系列課程建設與教學專家。近七年來帶領團隊主要從事大數據與云計算技術項目的研發(fā)與IT項目管理工作。鐘老師有著多年的企業(yè)內訓和公開課培訓講師經歷,主講大數據平臺技術、云計算、移動互聯網、電子商務、IT信息軟件項目管理、企業(yè)信息化規(guī)劃與管理、IT戰(zhàn)略規(guī)劃與企業(yè)架構、數據中心主機規(guī)劃與IDC系統(tǒng)運營等企業(yè)實戰(zhàn)類培訓課程。
許林芳
李金城
徐周
潘俊
武魏巍
凌黎
吳斌
李良德
高圣皓
張珂
黃道雄
袁小勇
甘建榮
