當(dāng)前位置:中工網(wǎng)理論頻道科教天地-正文
先用好現(xiàn)有數(shù)據(jù)富礦
史文釗//8858151.com2013-12-30來源:人民日?qǐng)?bào)
分享到:更多

  

  大數(shù)據(jù)究竟能給我們帶來什么??jī)H僅是要我們不斷增加存儲(chǔ),不斷提高帶寬,不斷進(jìn)行數(shù)據(jù)的處理嗎?當(dāng)然不是,我們真正要從大數(shù)據(jù)得到的,是大數(shù)據(jù)中那些有用的知識(shí)。

  大致上講,目前的大數(shù)據(jù)來源有兩塊:交易數(shù)據(jù)和關(guān)聯(lián)交互數(shù)據(jù),前者指業(yè)務(wù)系統(tǒng)或交易系統(tǒng)產(chǎn)生的數(shù)據(jù)庫,小體量卻高價(jià)值;后者則是社交網(wǎng)絡(luò)產(chǎn)生的數(shù)據(jù),大體量卻低價(jià)值。對(duì)于這兩大數(shù)據(jù)來源,人們基于大數(shù)據(jù)理論提出一些解決方案,如把社交網(wǎng)站的數(shù)據(jù)和電商平臺(tái)的交易數(shù)據(jù)關(guān)聯(lián),進(jìn)行精準(zhǔn)廣告投放,產(chǎn)生更大的價(jià)值。然而問題是,為何交易系統(tǒng)要共享這些數(shù)據(jù)?擁有電子商務(wù)網(wǎng)站、微博或即時(shí)通訊工具的那些互聯(lián)網(wǎng)巨頭,很難說愿意把自己的這些核心數(shù)據(jù)在沒有重大利好前提下與人分享。同時(shí),需要進(jìn)一步思考的是,即使這些數(shù)據(jù)能夠共享,該用哪一種技術(shù)才能實(shí)現(xiàn)較高的關(guān)聯(lián)性,來挖掘出潛在的巨大價(jià)值?

  那么,作為從傳統(tǒng)數(shù)據(jù)挖掘概念延伸而來的“大數(shù)據(jù)”,現(xiàn)在為何這么熱?很大一部分原因,是源自管理學(xué)界和商業(yè)媒體對(duì)于大數(shù)據(jù)的推崇備至,他們認(rèn)為大數(shù)據(jù)是信息技術(shù)改變商業(yè)世界的殺手級(jí)應(yīng)用。有不少人沉醉于大數(shù)據(jù)的大容量、快速和多樣性,卻忽視了大數(shù)據(jù)真正能給用戶帶來的價(jià)值。我們不難發(fā)現(xiàn),現(xiàn)在關(guān)于大數(shù)據(jù)成功案例的報(bào)道并不多見,尤其缺少那種系統(tǒng)性大項(xiàng)目的成功經(jīng)驗(yàn)。谷歌預(yù)測(cè)系統(tǒng)和亞馬遜精準(zhǔn)廣告投放系統(tǒng),和最近斯諾登爆出的美國(guó)棱鏡計(jì)劃,這些可被視為大數(shù)據(jù)解決方案的“成功”案例。然而,棱鏡的“成功”不是由于其技術(shù)或方法的先進(jìn),而是在于美國(guó)政府有著強(qiáng)大的能力來整合谷歌、臉譜網(wǎng)、雅虎等各大互聯(lián)網(wǎng)服務(wù)商的信息,通過數(shù)據(jù)挖掘?qū)崿F(xiàn)自己的應(yīng)用。除此之外,很難覓得其他具有實(shí)際意義的案例。

  現(xiàn)在,學(xué)術(shù)界對(duì)于大數(shù)據(jù)的態(tài)度相較以前已經(jīng)冷靜很多,不再是一窩蜂地為其叫好。更多的人開始反思大數(shù)據(jù)的局限性,如曾利用大數(shù)據(jù)準(zhǔn)確預(yù)測(cè)出美國(guó)總統(tǒng)大選結(jié)果的納特·西爾弗,著書討論大數(shù)據(jù)帶來的究竟是信號(hào)還是噪音;也有曾力推大數(shù)據(jù)的學(xué)者認(rèn)為,大數(shù)據(jù)不僅僅是海量數(shù)據(jù)的集合,更重要的是要挖掘出其背后真正的價(jià)值。近來,人們也開始反思大數(shù)據(jù)的真正含義,冷靜思考大數(shù)據(jù)背后的真正價(jià)值,嘗試構(gòu)建各種大數(shù)據(jù)解決方案并應(yīng)用于各行各業(yè)。尤其是在智慧城市建設(shè)中,更是不斷探索如何盤活已有數(shù)據(jù)存量,用好大數(shù)據(jù)增量,來提升城市公共服務(wù)能力和管理決策水平。

  因此,我們需要意識(shí)到,IT技術(shù)經(jīng)過這些年來的發(fā)展,已經(jīng)從數(shù)據(jù)產(chǎn)品時(shí)代步入數(shù)據(jù)應(yīng)用時(shí)代,而大數(shù)據(jù)的核心不在于其體量、速度和類型,而是如何發(fā)揮數(shù)據(jù)的價(jià)值。如果現(xiàn)有的數(shù)據(jù)富礦我們都不去很好的整合、分析加工和利用,何談還有必要去挖掘新礦?

  (作者為神州數(shù)碼大數(shù)據(jù)專家)

中 工 網(wǎng) 版 權(quán) 所 有 ,未 經(jīng) 書 面 授 權(quán) 禁 止 使 用
Copyright © 2008-2010 by 8858151.com. all rights reserved
瀏覽本網(wǎng)主頁,建議將電腦顯示屏的分辨率調(diào)為1024*768