隨著大數(shù)據(jù)時(shí)代的來(lái)臨,大數(shù)據(jù)分析也應(yīng)運(yùn)而生。大數(shù)據(jù)作為時(shí)下最火熱的IT行業(yè)的詞匯,其爆炸式增長(zhǎng)在大容量、多樣性和高增速方面,全面考驗(yàn)著現(xiàn)代企業(yè)的數(shù)據(jù)處理和分析能力;同時(shí),也為企業(yè)帶來(lái)了獲取更豐富、更深入和更準(zhǔn)確地洞察市場(chǎng)行為的大量機(jī)會(huì)。對(duì)企業(yè)而言,能夠從大數(shù)據(jù)中獲得全新價(jià)值的消息是令人振奮的。
然而,大數(shù)據(jù)時(shí)代是到來(lái),那么大數(shù)據(jù)意味著什么,它到底會(huì)改變什么?如何從大數(shù)據(jù)中發(fā)掘出“真金白銀”則是一個(gè)現(xiàn)實(shí)的挑戰(zhàn)。僅僅從技術(shù)角度回答,已不足以解惑。如果來(lái)個(gè)必須,大數(shù)據(jù)只是賓語(yǔ),那么離開(kāi)了人這個(gè)主語(yǔ),它再大也沒(méi)有意義。所以我們需要把大數(shù)據(jù)放在人的背景中加以透視,理解它作為時(shí)代變革的力量。
作為通用的一種分析手段,我們不妨把這個(gè)主語(yǔ)化成“涂料行業(yè)”,分析大數(shù)據(jù)對(duì)涂料行業(yè)的影響,解讀為何大數(shù)據(jù)分析能為涂料行業(yè)帶來(lái)時(shí)代變革的力量。
涂料大數(shù)據(jù)應(yīng)用案例
數(shù)據(jù)時(shí)代下 涂料行業(yè)的大數(shù)據(jù)分析
之一:油水之爭(zhēng)
近兩年,涂料行業(yè)討論最激烈的問(wèn)題就是水性漆將代替油性漆的時(shí)代已經(jīng)到來(lái)了。涂料行業(yè)發(fā)展到今天已經(jīng)算得上是成熟的行業(yè),傳統(tǒng)的油性涂料和現(xiàn)代創(chuàng)新性的水性涂料,究竟誰(shuí)的優(yōu)勢(shì)強(qiáng),亦或者有界別于兩者的一種特殊涂料的存在,符合人們的時(shí)代發(fā)展需求。大數(shù)據(jù)分析的優(yōu)勢(shì)是可以通過(guò)收集起來(lái)的數(shù)據(jù),預(yù)測(cè)未來(lái)涂料行業(yè)發(fā)展的大趨勢(shì),通過(guò)這些預(yù)測(cè),涂料企業(yè)便可以進(jìn)行有效的改革創(chuàng)新。
之二:電商領(lǐng)域的涂料企業(yè)
越來(lái)越多的涂料企業(yè)開(kāi)始涉足大數(shù)據(jù)平臺(tái),利用大數(shù)據(jù)精準(zhǔn)的分析能力,和海量的信息庫(kù),對(duì)市場(chǎng)的需求方向進(jìn)行整體把握。對(duì)于涉足電商領(lǐng)域的涂料企業(yè)而言,大數(shù)據(jù)存在的意義是,它能通過(guò)網(wǎng)絡(luò)平臺(tái)反映的顧客“大數(shù)據(jù)”信息,使互聯(lián)網(wǎng)企業(yè)可以更加準(zhǔn)確地對(duì)用戶進(jìn)行行為分析、需求挖掘。通過(guò)大數(shù)據(jù)提供分析,涂料企業(yè)便會(huì)對(duì)關(guān)注度高的產(chǎn)品進(jìn)一步加大推廣投入。借鑒服裝行業(yè)"打爆款"的策略思路,將一個(gè)單品做出一個(gè)成規(guī)模的量級(jí),這對(duì)于企業(yè)來(lái)說(shuō)將是極大的利好。
之三:涂料企業(yè)的品牌宣傳
作為社會(huì)上一個(gè)不較為人所了解的領(lǐng)域,涂料行業(yè)一直都是在“摸著國(guó)外的石頭過(guò)河”,其中,國(guó)外的石頭就是指立邦、多樂(lè)士、威士伯等國(guó)際著名涂料品牌。在中國(guó),由于相關(guān)媒體或機(jī)構(gòu)對(duì)涂料行業(yè)的關(guān)注度一直都不高,所有,涂料行業(yè)很多數(shù)據(jù)價(jià)值一直都被人們所忽視,消失在歷史的輪轉(zhuǎn)中。過(guò)去,涂料企業(yè)對(duì)數(shù)據(jù)的認(rèn)知也局限于一些宏觀數(shù)據(jù),例如年產(chǎn)量、年增長(zhǎng)率、月產(chǎn)量等宏觀信息,對(duì)消費(fèi)者的認(rèn)知一般只是通過(guò)線下調(diào)查問(wèn)卷的方式來(lái)攝取。
知識(shí)普及:
大數(shù)據(jù)分析的五階段:
1.Sample:抽取一些代表性的樣本數(shù)據(jù)集(通常為訓(xùn)練集、驗(yàn)證集和測(cè)試集)。樣本容量的選擇標(biāo)準(zhǔn)為:包含足夠的重要信息,同時(shí)也要便于分析操作。該步驟涉及的處理工具為:數(shù)據(jù)導(dǎo)入、合并、粘貼、過(guò)濾以及統(tǒng)計(jì)抽樣方法。
2.Explore:通過(guò)考察關(guān)聯(lián)性、趨勢(shì)性以及異常值的方式來(lái)探索數(shù)據(jù),增進(jìn)對(duì)于數(shù)據(jù)的認(rèn)識(shí)。該步驟涉及的工具為:統(tǒng)計(jì)報(bào)告、視圖探索、變量選擇以及變量聚類等方法。
3.Modify:以模型選擇為目標(biāo),通過(guò)創(chuàng)建、選擇以及轉(zhuǎn)換變量的方式來(lái)修改數(shù)據(jù)集。該步驟涉及工具為:變量轉(zhuǎn)換、缺失處理、重新編碼以及數(shù)據(jù)分箱等。
4.Model:為了獲得可靠的預(yù)測(cè)結(jié)果,我們需要借助于分析工具來(lái)訓(xùn)練統(tǒng)計(jì)模型或者機(jī)器學(xué)習(xí)模型。該步驟涉及技術(shù)為:線性及邏輯回歸、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、偏最小二乘法、LARS及LASSO、K近鄰法以及其他用戶(包括非SAS用戶)的模型算法。
5.Assess:評(píng)估數(shù)據(jù)挖掘結(jié)果的有效性和可靠性。涉及技術(shù)為:比較模型及計(jì)算新的擬合統(tǒng)計(jì)量、臨界分析、決策支持、報(bào)告生成、評(píng)分代碼管理等。數(shù)據(jù)挖掘者可能不會(huì)使用全部SEMMA分析步驟。然而,在獲得滿意結(jié)果之前,可能需要多次重復(fù)其中部分或者全部步驟。
|