人類(lèi)93%的行為是可以被預(yù)知的;大數(shù)據(jù)可以幫你解決決策和選擇的問(wèn)題;基于你的歷史行為,判斷出你可能的喜好乃至需求;大數(shù)據(jù)并非數(shù)據(jù)統(tǒng)計(jì)。
現(xiàn)在市場(chǎng)上甚至很多企業(yè)人很喜歡新名詞,似乎只要掛上邊就顯的很牛逼,很崇高。但似乎都從來(lái)不會(huì)去花點(diǎn)精力去思考,這些概念到底表達(dá)了什么含義,跟人交流也會(huì)顯的很奇怪。
現(xiàn)在大家都在講所謂大數(shù)據(jù),AI,但是多少人似乎只是為了蹭熱度,好像嘴邊不掛上這些詞匯就顯的不那么高大上了。就好比我們祖國(guó)得一些事業(yè),比如讓打乒乓球的去管理科技企業(yè)等奇怪的現(xiàn)象。但是你讓那打乒乓球的去指導(dǎo)一幫打工的科技人員,他們會(huì)反對(duì)你提出的意見(jiàn)和指導(dǎo)方針嗎?假設(shè)打乒乓球的領(lǐng)導(dǎo)給你大談技術(shù),大談大數(shù)據(jù),大談AI,可能在專(zhuān)家團(tuán)里面,大家都會(huì)說(shuō)好,說(shuō)棒,但是在行業(yè)里面就顯的有點(diǎn)尷尬了。
中國(guó)的科技互聯(lián)網(wǎng)發(fā)展了這幾十年間,我們見(jiàn)證了太多的歷史,我們看到了很多經(jīng)典的文章,比如:《汗顏!別整天談工業(yè)4.0了,先把網(wǎng)線整理好再說(shuō)》等經(jīng)典文章,很多專(zhuān)家,領(lǐng)導(dǎo)都是看到個(gè)名詞就胡亂套弄,可也導(dǎo)致我們整體行業(yè)會(huì)有很多概念無(wú)法普及,仗著自身是專(zhuān)家的角色,占據(jù)發(fā)言的主要渠道和平臺(tái),誤導(dǎo)了很多非專(zhuān)業(yè)人群的認(rèn)知,導(dǎo)致很多行業(yè)發(fā)展中受到大量的障礙,整個(gè)行業(yè)缺乏最基礎(chǔ)的溝通基礎(chǔ)。其實(shí)最核心的問(wèn)題就是大部人根本不關(guān)心概念的原理基礎(chǔ),只想通過(guò)概念快速的包裝自己和變現(xiàn)。
隨著近幾年的發(fā)展,民間整體老板氛圍已經(jīng)越來(lái)越好。就比如十年前根本沒(méi)老板關(guān)心設(shè)計(jì),沒(méi)有老板關(guān)心架構(gòu),只關(guān)心做出來(lái)東西,到現(xiàn)在越來(lái)越多的老板關(guān)心數(shù)據(jù)的安全,關(guān)注設(shè)計(jì)的合理,更關(guān)注了架構(gòu)的核心;比如最近三五年,甚至出現(xiàn)了前端架構(gòu)師的崗位,也整體說(shuō)明了整個(gè)行業(yè)的進(jìn)步。當(dāng)然還有很多老板企業(yè)主根本不關(guān)心這些內(nèi)容,也從來(lái)不關(guān)心規(guī)劃和團(tuán)隊(duì)合作和以及資源整合配置等。還有一部分企業(yè)采用非常傳統(tǒng)的工廠管理模式或者政府機(jī)關(guān)管理模式來(lái)管理創(chuàng)意、科技工作人員,也是目前市場(chǎng)上常見(jiàn)的現(xiàn)象。
這些都是目前存在的核心問(wèn)題,導(dǎo)致大量的專(zhuān)家、領(lǐng)導(dǎo)和從業(yè)工作者缺乏最基礎(chǔ)的溝通基礎(chǔ)。
我們來(lái)聊整個(gè)時(shí)代的變遷,從信息化到數(shù)字化,很多人到現(xiàn)在還沒(méi)想明白。數(shù)字化的前提是信息化,但是很多企業(yè)根本沒(méi)有做過(guò)信息化,卻侃侃而談數(shù)字化。再到大數(shù)據(jù),把大數(shù)據(jù)看作數(shù)據(jù)統(tǒng)計(jì),當(dāng)然很多企業(yè)目前宣傳大數(shù)據(jù)稍微一看都是數(shù)據(jù)統(tǒng)計(jì)的概念。雖然很奇怪,但是把大數(shù)據(jù)當(dāng)作數(shù)據(jù)統(tǒng)計(jì)我們認(rèn)為還是比較好的,至少不會(huì)那么奇葩,很多專(zhuān)家莫名其妙的把大數(shù)據(jù)神話,說(shuō)的天花亂墜,但是卻不理解大數(shù)據(jù)從何而來(lái),能解決什么問(wèn)題,到底解決什么問(wèn)題。大數(shù)據(jù)的大到底是多大也根本無(wú)從思考,甚至有專(zhuān)家領(lǐng)導(dǎo)認(rèn)為有幾萬(wàn)條數(shù)據(jù)的就覺(jué)得很牛逼;也不會(huì)去考慮大數(shù)據(jù)的數(shù)據(jù)從何而來(lái),數(shù)據(jù)要怎么做。或者很多專(zhuān)家領(lǐng)導(dǎo)認(rèn)為找個(gè)大數(shù)據(jù)專(zhuān)業(yè)的大學(xué)生,就能實(shí)現(xiàn)它偉岸的目標(biāo)。
我們回來(lái)看大數(shù)據(jù)的概念定義。
百度百科對(duì)大數(shù)據(jù)的定義是這樣的:大數(shù)據(jù)(big data)或稱(chēng)巨量資料,指的是所涉及的資料量規(guī)模巨大到無(wú)法透過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。
Gartner給出了這樣的定義:“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
如果你認(rèn)為大數(shù)據(jù)就等于Hadoop,那就大錯(cuò)特錯(cuò)了。Hadoop只是大數(shù)據(jù)時(shí)代的一個(gè)必要條件,大數(shù)據(jù)還有一個(gè)明顯的標(biāo)志是數(shù)據(jù)挖掘和人工智能的緊密結(jié)合。這也是我理解的“大數(shù)據(jù)”與現(xiàn)在很多所謂“大數(shù)據(jù)”項(xiàng)目最明顯的區(qū)別之一。除了上面的“新處理模式”上的區(qū)別,個(gè)人認(rèn)為還有一個(gè)最主要的區(qū)別是:數(shù)據(jù)統(tǒng)計(jì)分析是基于已有數(shù)據(jù)的縱向歸類(lèi),而大數(shù)據(jù)是基于對(duì)已有海量數(shù)據(jù)的處理,對(duì)還未產(chǎn)生的數(shù)據(jù)作出預(yù)測(cè)和推薦。數(shù)據(jù)統(tǒng)計(jì)是已經(jīng)發(fā)生的事情,而大數(shù)據(jù)往往被用于還沒(méi)有發(fā)生的事情預(yù)測(cè)或者推薦中。目前主要的推薦算法大致可以分為兩類(lèi)。一個(gè)是基于行為,一個(gè)是基于內(nèi)容。當(dāng)然,針對(duì)不同的領(lǐng)域,不同的預(yù)測(cè)和推薦的對(duì)象,又會(huì)有十余種算法。這就不是本文展開(kāi)的內(nèi)容了。
基于行為的分析,顧名思義,即對(duì)用戶在互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)留下的“痕跡”,即瀏覽、點(diǎn)擊、收藏、購(gòu)買(mǎi)、二次購(gòu)買(mǎi)的分析,得出未來(lái)會(huì)選擇購(gòu)買(mǎi)的預(yù)測(cè)和推薦結(jié)果。基于行為的分析,屬于群體智慧,綜合利用群體用戶的行為偏好。用戶之間會(huì)相互影響,更加符合現(xiàn)實(shí)世界中的用戶行為。
基于內(nèi)容的分析, 包括對(duì)文字、圖片、音頻、視頻等信息的分析,得出預(yù)測(cè)和推薦的結(jié)論。內(nèi)容的“基因”和用戶的偏好相匹配,最有代表的是潘多拉的音樂(lè)推薦項(xiàng)目,其將曲庫(kù)中所有歌曲都由400多位專(zhuān)家打上標(biāo)簽,然后建立個(gè)人與音樂(lè)的聯(lián)系,從而完成音樂(lè)的推薦。內(nèi)容的分析只針對(duì)個(gè)人,與用戶之間關(guān)系無(wú)關(guān)。
大數(shù)據(jù)到底能做什么?
現(xiàn)在談這個(gè)問(wèn)題可能會(huì)讓大家笑話,似乎所有人都知道大數(shù)據(jù)能干這個(gè),能干那個(gè),最后連我們自己都覺(jué)得可笑。大數(shù)據(jù)已經(jīng)都不是被“妖魔化”了,是“娛樂(lè)化”。大數(shù)據(jù)似乎是個(gè)離我們忽遠(yuǎn)又忽近的事物了,變得不真實(shí)起來(lái)。還有很多專(zhuān)家領(lǐng)導(dǎo)還有認(rèn)為,大數(shù)據(jù)可以讓你快速的找到東西的層面。比如你搜索”沉香“,它可以幫你快速的找到跟”沉香“相關(guān)的所有內(nèi)容。
其實(shí)簡(jiǎn)單了說(shuō),大數(shù)據(jù)可以協(xié)助您做出解決決策和選擇的問(wèn)題。比如基于您的歷史行為,判斷出您可能的喜好甚至需求,講最佳的結(jié)果建議,推薦給你。當(dāng)然大數(shù)據(jù)中我們會(huì)著重強(qiáng)調(diào)可能,預(yù)測(cè)你的行為,都是可能性,最可能發(fā)生的,最可能選擇的,都是可能,而不是一定。大數(shù)據(jù)主要解決所謂的信任問(wèn)題,不是像人與人之間單純的信任,而是基于數(shù)據(jù)、軌跡綜合給出的比較有參考價(jià)值,有數(shù)據(jù)歷史依托的更可靠的建議和結(jié)論。而不是信息化系統(tǒng)單純的一個(gè)結(jié)果。就好比我們?cè)谌粘9ぷ髦谐Uf(shuō)的,拿數(shù)據(jù)說(shuō)話,不是靠編故事,講道理說(shuō)結(jié)論。
說(shuō)個(gè)簡(jiǎn)單的結(jié)論,如果我們有收集充分的數(shù)據(jù),那么人類(lèi)93%的行為是可以預(yù)知的,是有規(guī)律的。
2024-07-11 16:25:16
2024-07-08 16:52:55
2024-07-01 11:17:11
2024-05-17 16:26:26
2024-05-15 14:37:53
2024-05-09 18:08:16
2024-04-29 16:29:55
2024-04-24 15:58:15
2024-04-22 17:27:24
2024-03-18 15:17:11
本文版權(quán)歸作者所有!如有侵權(quán),請(qǐng)聯(lián)系管理員刪除。文章僅代表作者觀點(diǎn),不代表行迪醫(yī)管立場(chǎng)。
網(wǎng)友評(píng)論
未登錄