近年來,我們?cè)谛畔⒓夹g(shù)領(lǐng)域取得了巨大進(jìn)步,在技術(shù)生態(tài)領(lǐng)域中取得的一系列革命性成果也確實(shí)值得稱贊。在過去的十年到二十年里,數(shù)據(jù)和分析一直是非常熱門的詞匯。因此我們需要明確它們是如何相互關(guān)聯(lián)的,市場(chǎng)中扮演什么角色,以及將如何重塑商業(yè)業(yè)務(wù)。
對(duì)于那些已經(jīng)意識(shí)到其潛力的人群來說,科技是一種福音,然而對(duì)于那些無法跟上其快速發(fā)展的人群來說,這也是一種考驗(yàn)。如今,幾乎每個(gè)行業(yè)都離不開數(shù)據(jù)分析。
在本文中將總結(jié)近年來數(shù)據(jù)分析的發(fā)展和演變,簡(jiǎn)化各種術(shù)語(yǔ),對(duì)一些常見應(yīng)用場(chǎng)景進(jìn)行解釋。讓我們開始吧!
這是數(shù)據(jù)倉(cāng)庫(kù)的興起時(shí)期,客戶(業(yè)務(wù))和生產(chǎn)過程(交易)被集中到巨大的存儲(chǔ)庫(kù)中,如eCDW(企業(yè)整合數(shù)據(jù)倉(cāng)庫(kù))。在對(duì)商業(yè)現(xiàn)象的客觀理解方面取得了真正的進(jìn)展, 從而讓管理者在做出決策時(shí)能夠基于對(duì)事實(shí)的理解,而不是僅憑直覺。
這個(gè)階段中數(shù)據(jù)通過ETL和BI工具收集、轉(zhuǎn)換和查詢。分析類型主要分為描述性(發(fā)生了什么)和診斷性(為什么會(huì)發(fā)生)。
然而,這個(gè)階段的局限在于數(shù)據(jù)僅在公司企業(yè)內(nèi)部使用,即商業(yè)智能活動(dòng)只能處理過去發(fā)生的事情,而不能對(duì)未來趨勢(shì)進(jìn)行預(yù)測(cè)。
隨著各大企業(yè)都紛紛走出舒適區(qū),試圖用更廣泛的方法進(jìn)行更復(fù)雜的分析時(shí),前一階段的數(shù)據(jù)分析局限性變得更加突出。
企業(yè)都開始通過外部資源獲取信息,比如點(diǎn)擊流、社交媒體、互聯(lián)網(wǎng)等,與此同時(shí)對(duì)新工具的需求也越發(fā)明顯。不可避免地,“大數(shù)據(jù)”一詞出現(xiàn)了,為了區(qū)分那些純粹來自公司內(nèi)部系統(tǒng)的小數(shù)據(jù)。
在這個(gè)階段,公司希望員工能夠通過快速處理引擎幫助處理大量數(shù)據(jù)。他們沒預(yù)想到的是,因此應(yīng)運(yùn)而生的新興的群體,即如今所稱的“開源社區(qū)”將產(chǎn)生巨大的影響力,這也是數(shù)據(jù)分析 2.0時(shí)代的標(biāo)志。
在社區(qū)前所未有的支持下,大數(shù)據(jù)工程師,Hadoop管理員等角色在就業(yè)領(lǐng)域發(fā)展壯大,并且對(duì)每個(gè)IT企業(yè)都至關(guān)重要??萍脊炯庇陂_發(fā)新的框架,這些框架不僅能夠收集、轉(zhuǎn)化處理大數(shù)據(jù),而且還能在集成預(yù)測(cè)性分析。而且,進(jìn)一步通過描述性和診斷分析的結(jié)果檢測(cè)趨勢(shì)、聚類和異常,并預(yù)測(cè)未來趨勢(shì),這也使其成為重要的預(yù)測(cè)工具。
在今天的技術(shù)生態(tài)系統(tǒng)中,我個(gè)人認(rèn)為“大數(shù)據(jù)”這個(gè)術(shù)語(yǔ)已經(jīng)被大量使用,甚至濫用。從技術(shù)上講,如今“大數(shù)據(jù)”指的是所有數(shù)據(jù),或者只是指數(shù)據(jù)。
開創(chuàng)性的大數(shù)據(jù)公司開始投資數(shù)據(jù)分析,從而支持面向客戶的產(chǎn)品,服務(wù)和功能。它們通過更好的搜索算法、購(gòu)買建議以及針對(duì)性廣告吸引用戶訪問其網(wǎng)站,所有這些都是由數(shù)據(jù)分析所驅(qū)動(dòng)的。大數(shù)據(jù)現(xiàn)象迅速蔓延,如今不僅是科技公司在通過數(shù)據(jù)分析開發(fā)產(chǎn)品和服務(wù),幾乎每個(gè)行業(yè)的公司都是如此。
另一方面,大數(shù)據(jù)技術(shù)的普及帶來了好壞參半的影響。在科技巨頭收獲大量利潤(rùn)取得成功的同時(shí),大多數(shù)企業(yè)和非科技公司卻因?yàn)楹雎詳?shù)據(jù)而失敗慘重。因此,數(shù)據(jù)科學(xué)領(lǐng)域應(yīng)運(yùn)而生,旨在使用科學(xué)方法、探索過程、算法等從各種形式的數(shù)據(jù)中獲得知識(shí)和分析見解。
實(shí)際上,數(shù)據(jù)科學(xué)領(lǐng)域是跨學(xué)科的,它被定義為“結(jié)合統(tǒng)計(jì)、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等相關(guān)方法的概念”,從而用數(shù)據(jù)“理解和分析實(shí)際現(xiàn)象”。換句話說,良好的數(shù)據(jù)加上出色的訓(xùn)練模型能夠產(chǎn)生更好的預(yù)測(cè)結(jié)果。新一代的量化分析師被稱為數(shù)據(jù)科學(xué)家,他們擁有計(jì)算和數(shù)據(jù)分析技能。
科技行業(yè)在數(shù)據(jù)科學(xué)的幫助下迅速發(fā)展,并充分利用預(yù)測(cè)性和規(guī)范性對(duì)未來趨勢(shì)進(jìn)行預(yù)測(cè)。企業(yè)間也開啟了數(shù)據(jù)分析的競(jìng)爭(zhēng),公司不僅通過改善內(nèi)部決策等傳統(tǒng)方式,而且還在不斷開發(fā)更有價(jià)值的產(chǎn)品和服務(wù)。這是數(shù)據(jù)分析 3.0時(shí)期的精髓。
如今數(shù)據(jù)分析產(chǎn)生了巨大轉(zhuǎn)變。公司正以超乎想象的速度發(fā)展,在內(nèi)部設(shè)立更多的研發(fā)部門,比如數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師、解決方案架構(gòu)師、首席分析師等人員構(gòu)成的數(shù)據(jù)分析團(tuán)隊(duì)。
主要有四種分析類型:描述,闡述過去; 診斷,利用過去的數(shù)據(jù)研究現(xiàn)在; 預(yù)測(cè),通過基于過去數(shù)據(jù)的見解來預(yù)測(cè)未來; 規(guī)范,通過模型指導(dǎo)最佳行為。
雖然數(shù)據(jù)分析3.0包含了上述所有類型,但它強(qiáng)調(diào)的是最后一種,并且引入了小規(guī)模自動(dòng)化分析的概念。
通過機(jī)器學(xué)習(xí)創(chuàng)建更多模型,從而讓預(yù)測(cè)變得更加細(xì)化和精確。但是,部署這類定制模型的成本和時(shí)間是十分昂貴的。最終,通過智能系統(tǒng)實(shí)現(xiàn)自動(dòng)化的數(shù)據(jù)分析4.0時(shí)代到來了。
毫無疑問,人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)將帶來深刻的影響。機(jī)器翻譯、智能回復(fù)、聊天機(jī)器人、會(huì)議助理等功能將在未來幾年內(nèi)得到廣泛應(yīng)用。數(shù)據(jù)挖掘技術(shù)、機(jī)器學(xué)習(xí)算法都已取得了大量成果,自動(dòng)化分析將成為數(shù)據(jù)分析的新階段。
我們可以將自動(dòng)化理解為,人與智能機(jī)器的強(qiáng)強(qiáng)聯(lián)合,從而實(shí)現(xiàn)更好的成果。
與其思考“人類的哪些工作將被機(jī)器取代?”我寧愿樂觀地考慮,在機(jī)器的幫助下,企業(yè)能取得哪些新成就?我們?cè)撊绾卧跒?zāi)難易發(fā)地區(qū),通過人工智能程序減少傷亡人數(shù);或者如何在貧困地區(qū)建立人工智能驅(qū)動(dòng)的電子學(xué)校等。
總而言之,我對(duì)數(shù)據(jù)分析的發(fā)展充滿自信,關(guān)鍵在于我們能否積極地接受和應(yīng)對(duì)其帶來的影響。
違法和不良信息舉報(bào)投訴電話:0377-62377728 舉報(bào)郵箱:fbypt@ex12580.com
網(wǎng)絡(luò)警察提醒你 a> 中國(guó)互聯(lián)網(wǎng)舉報(bào)中心 網(wǎng)絡(luò)舉報(bào)APP下載 掃黃打非網(wǎng)舉報(bào)專區(qū)