基于Spark和Hadoop的規(guī)?;瘮?shù)據(jù)科學(xué)
時(shí)長:3天
課程概述:了解數(shù)據(jù)科學(xué)家的工作內(nèi)容、需要解決的問題以及其處理現(xiàn)實(shí)問題時(shí)應(yīng)用的方法, 以獲得來自不同行業(yè)數(shù)據(jù)的業(yè)務(wù)價(jià)值。實(shí)施自動(dòng)推薦系統(tǒng)。
培訓(xùn)對(duì)象:面向具備 Hadoop 基礎(chǔ)知識(shí)(HDFS、MapReduce、Hadoop Streaming、Hive) 的工程師、數(shù)據(jù)分析師、統(tǒng)計(jì)人員。培訓(xùn)對(duì)象應(yīng)具備熟練的腳本語言能力:Python 是;熟悉Perl或者Ruby也可。