當(dāng)前位置:中工網(wǎng)理論頻道嘉賓訪談-正文
袁 衛(wèi):如何擁抱大數(shù)據(jù)時代
——訪中國人民大學(xué)中國調(diào)查與數(shù)據(jù)中心主任袁衛(wèi)
//8858151.com2014-06-30來源:中國教育報
分享到:更多

  

  大數(shù)據(jù)應(yīng)用是把雙刃利劍

  記者:大數(shù)據(jù)在商業(yè)以及城市安全防范等領(lǐng)域已經(jīng)有很多應(yīng)用的成功案例,大數(shù)據(jù)將會給教育領(lǐng)域帶來怎樣的變革?

  袁衛(wèi):大數(shù)據(jù)將對教育產(chǎn)生非常深遠(yuǎn)的影響。目前可以預(yù)見的,我想主要有兩個方面:一是通過大數(shù)據(jù),分析學(xué)生成長環(huán)境、興趣愛好、能力特長等,有利于教育者對學(xué)生加深了解,有利于因材施教,使得根據(jù)學(xué)生個人興趣、特長、能力進(jìn)行個性化教育成為可能;二是帶來教學(xué)內(nèi)容、教學(xué)方式方法上的改變,立體化教學(xué)、案例教學(xué)、互動教學(xué)等方式的運用使得教學(xué)更加生動,MOOCs(慕課)就是大數(shù)據(jù)時代教學(xué)變革的一個例子。大數(shù)據(jù)可以促進(jìn)全世界優(yōu)質(zhì)教育資源共享,發(fā)揮每個教師的優(yōu)勢特長。大數(shù)據(jù)將對教育產(chǎn)生一系列的深遠(yuǎn)影響,不可低估。

  記者:但是,大數(shù)據(jù)的廣泛應(yīng)用,可能會導(dǎo)致侵犯他人隱私的情況發(fā)生,對此您怎么看?

  袁衛(wèi):在大數(shù)據(jù)時代,個人的相關(guān)數(shù)據(jù)信息輕易可得,個人隱私越來越不安全。其實不僅僅是個人隱私,包括國家安全和企業(yè)的商業(yè)機(jī)密,也受到很大的威脅。怎么辦?我認(rèn)為對于國家而言,一方面要積極推進(jìn)數(shù)據(jù)對外開放,凡是不涉及個人隱私、國家安全和商業(yè)機(jī)密的數(shù)據(jù),都應(yīng)該公開,這樣才能避免形成數(shù)據(jù)孤島,充分發(fā)掘和利用數(shù)據(jù)資源;另一方面,在開放數(shù)據(jù)的同時要加強(qiáng)相關(guān)立法,這兩個方面是互相補(bǔ)充的,只有這樣,才能趕上時代發(fā)展的步伐,充分發(fā)揮我們這個人口大國、經(jīng)濟(jì)大國的數(shù)據(jù)資源優(yōu)勢。

  從個人的角度講,要加強(qiáng)個人信息防護(hù)意識,在上網(wǎng)發(fā)布相關(guān)信息時,要了解哪些是可以發(fā)的,哪些是不能發(fā)的,以免給自己帶來困擾。

  兩個“交叉”探索人才培養(yǎng)之道

  記者:據(jù)了解,中國人民大學(xué)、北京大學(xué)、中國科學(xué)院大學(xué)、中央財經(jīng)大學(xué)和首都經(jīng)貿(mào)大學(xué)5所高校組建了一個協(xié)同創(chuàng)新平臺,以“應(yīng)用統(tǒng)計專業(yè)碩士”為載體培養(yǎng)大數(shù)據(jù)分析方面的人才。為何要采取這種多校合作的培養(yǎng)模式?

  袁衛(wèi):之所以采用這種協(xié)同創(chuàng)新、5校合作的培養(yǎng)模式,完全是由大數(shù)據(jù)人才的特點決定的。第一個特點,大數(shù)據(jù)人才是多學(xué)科交叉型人才,不是某一個學(xué)科可以單獨培養(yǎng)的。大家知道,現(xiàn)在進(jìn)行數(shù)據(jù)分析,要有數(shù)據(jù)庫和軟件等計算機(jī)方面的知識,還要有數(shù)學(xué)和統(tǒng)計方面的知識和能力。這就涉及到中國學(xué)科體系中“統(tǒng)計學(xué)”和“計算機(jī)科學(xué)與技術(shù)”兩個一級學(xué)科。培養(yǎng)出的畢業(yè)生到了單位,可能還需要財經(jīng)、新聞、生物醫(yī)學(xué)和管理等方面的知識。所以,大數(shù)據(jù)人才的培養(yǎng),也需要計算機(jī)、統(tǒng)計學(xué)、數(shù)學(xué)等多學(xué)科共同參與。

  第二個特點,這是一類應(yīng)用型人才,必須重視實踐環(huán)節(jié)。他們畢業(yè)后不是去做研究,而是投身業(yè)界,要能很快上手。這樣的人才培養(yǎng),不是僅在學(xué)校、在實驗室、研究室里就能夠培養(yǎng)出來的,而是要到實踐中去,解決實際問題。因此,這個協(xié)同創(chuàng)新平臺,不僅有5所高校參與,還有人民日報、新華社、中央電視臺等十余家媒體,中國移動、中國電信、中國聯(lián)通、百度、阿里巴巴、騰訊等大數(shù)據(jù)公司和用人單位,包括云計算的一些基地共同參與,是一個“政、企、產(chǎn)、學(xué)、研”一體的人才培養(yǎng)平臺,也就是說,人才培養(yǎng)環(huán)節(jié)是交叉的。

  還有一點需要指出,為什么把人才培養(yǎng)的層次定位于碩士?目前全國有200多所本科院校開設(shè)統(tǒng)計學(xué)專業(yè),75所高校設(shè)有統(tǒng)計學(xué)博士點,78所高校開辦“應(yīng)用統(tǒng)計碩士”專業(yè)學(xué)位。在大數(shù)據(jù)時代,我們改革最急需的人才是碩士層次的,正好我們有“應(yīng)用統(tǒng)計專業(yè)碩士”這樣一個新的專業(yè)學(xué)位,利用這樣一個協(xié)同創(chuàng)新平臺來培養(yǎng)大數(shù)據(jù)人才,也與專業(yè)學(xué)位的改革精神相一致。

  記者:這個大數(shù)據(jù)人才的培養(yǎng)方案,如何體現(xiàn)出“兩個交叉”?

  袁衛(wèi):5所學(xué)校參與培養(yǎng),就是出于學(xué)科交叉的考慮。中國人民大學(xué)統(tǒng)計學(xué)院的學(xué)科、專業(yè)設(shè)置是綜合的、應(yīng)用的,理論和應(yīng)用兼而有之,應(yīng)用領(lǐng)域涉及衛(wèi)生、健康、經(jīng)濟(jì)、社會、管理等,總體實力較強(qiáng)。而北京大學(xué)和中國科學(xué)院大學(xué),大家都知道,他們在計算機(jī)、數(shù)學(xué)和統(tǒng)計理論研究方面相當(dāng)強(qiáng),掌握大數(shù)據(jù)分析技術(shù)的前沿。中央財經(jīng)大學(xué)和首都經(jīng)貿(mào)大學(xué)是財經(jīng)類為主的院校,這兩所學(xué)校側(cè)重于應(yīng)用人才的培養(yǎng),特別是面向經(jīng)濟(jì)、管理、社會這樣的領(lǐng)域。他們和很多行業(yè)企業(yè)、金融機(jī)構(gòu)有著密切聯(lián)系。這5所高校分別屬于教育部直屬高校、中國科學(xué)院的高校和地方高校3種類型,各有特色,優(yōu)勢互補(bǔ),能夠建成一個很好的、學(xué)科交叉的人才培養(yǎng)協(xié)同體。

  培養(yǎng)環(huán)節(jié)的交叉,主要體現(xiàn)在企業(yè)、用人單位的參與上。上面提到,有這么多的大數(shù)據(jù)企業(yè)、媒體單位參與合作。他們把實際工作中遇到的問題帶來,大家一起研究解決;他們把企業(yè)運作過程中產(chǎn)生的大數(shù)據(jù)拿過來,學(xué)生直接用這些真實的數(shù)據(jù)進(jìn)行訓(xùn)練和研究。

  記者:據(jù)了解,對這批大數(shù)據(jù)人才的培養(yǎng),將采取團(tuán)隊教學(xué)的方式?

  袁衛(wèi):我們經(jīng)過多次研討,并參考了美國頂尖的20所大學(xué)大數(shù)據(jù)人才培養(yǎng)的方案和課程,確定了“大數(shù)據(jù)分析計算機(jī)基礎(chǔ)”、“大數(shù)據(jù)分析統(tǒng)計基礎(chǔ)”、“大數(shù)據(jù)分布式計算”、“大數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)”、“非結(jié)構(gòu)化大數(shù)據(jù)分析”和“大數(shù)據(jù)建模案例研究”6門必修核心課程。每門課程不是由一位老師來上,而是一個教學(xué)團(tuán)隊,5所學(xué)校各選一名最優(yōu)秀的教師,然后5位老師一起研究一門課程、同上一門課程,而且還有大數(shù)據(jù)企業(yè)的專家參與。初步估計,每門課程的教學(xué)團(tuán)隊會在10個人左右。教學(xué)方式也有別于傳統(tǒng)的課堂講授,會采取案例教學(xué)和討論班的方式,也可能是一個團(tuán)隊共同完成一個項目。我們還采取雙導(dǎo)師制,兩位導(dǎo)師一位來自大學(xué),一位來自企業(yè)界,50名學(xué)生,就有100名導(dǎo)師。在這個協(xié)同創(chuàng)新機(jī)制里,還有一個特點,就是采取個性化的教學(xué)方式,從生源來看,首批學(xué)生主要來源于計算機(jī)和統(tǒng)計兩個學(xué)科,計算機(jī)專業(yè)背景的本科生進(jìn)來以后,將重點加強(qiáng)統(tǒng)計分析能力的培養(yǎng),而統(tǒng)計、數(shù)學(xué)、物理等專業(yè)背景的本科生進(jìn)來后,將重點加強(qiáng)計算機(jī)、大數(shù)據(jù)軟件等方面的學(xué)習(xí)。

  “黃埔一期”的歷史使命是探路

  記者:目前國內(nèi)大數(shù)據(jù)方面的人才供求情況如何?

  袁衛(wèi):2012年美國麥肯錫咨詢公司提供了一份報告,對美國大數(shù)據(jù)人才需求進(jìn)行了分析。他們把大數(shù)據(jù)人才分為兩類,一類叫做“數(shù)據(jù)經(jīng)理或數(shù)據(jù)工程師、數(shù)據(jù)分析師”;另一類叫做“數(shù)據(jù)科學(xué)家”。數(shù)據(jù)科學(xué)家熟練掌握計算機(jī)、統(tǒng)計、經(jīng)濟(jì)管理等技能,能夠領(lǐng)導(dǎo)團(tuán)隊從海量數(shù)據(jù)中找出規(guī)律,發(fā)現(xiàn)知識,做出決策,創(chuàng)造價值。根據(jù)麥肯錫的報告,到2018年,美國數(shù)據(jù)分析師的人才需求將達(dá)150萬人左右,高層次的數(shù)據(jù)科學(xué)家的需求缺口在14-18萬人。中國的情況,目前在百度、阿里巴巴、京東等電子商務(wù)企業(yè)和騰訊等網(wǎng)絡(luò)媒體大數(shù)據(jù)公司中有一些大數(shù)據(jù)方面的人才,但是能稱得上大數(shù)據(jù)科學(xué)家的人才,非常非常少。我國相關(guān)部門預(yù)計3到5年內(nèi),來自政府、媒體、企業(yè)等方面的數(shù)據(jù)工程師和數(shù)據(jù)分析師的需求將達(dá)100萬人左右,而目前的人才培養(yǎng),無論是規(guī)模還是質(zhì)量水平,都遠(yuǎn)遠(yuǎn)達(dá)不到要求。

  記者:首批50人的培養(yǎng)計劃,只是一個試點探索。對于大規(guī)模培養(yǎng)大數(shù)據(jù)人才,您有什么建議?

  袁衛(wèi):在大數(shù)據(jù)時代,數(shù)據(jù)分析,越來越成為我們工作生活中一個最基本的技能。大數(shù)據(jù)人才的培養(yǎng),正是基于這樣一個時代的發(fā)展背景。大數(shù)據(jù)人才的適用領(lǐng)域非常廣泛,有著巨大的社會需求。他們的就業(yè),遍及生物、醫(yī)學(xué)、經(jīng)濟(jì)、社會、媒體、金融、教育、政府各個方面,只要有數(shù)據(jù)的地方,他們都可以施展才華。這個實驗班,其意義在于探索一種新的人才培養(yǎng)模式。如果實踐證明比較成功的話,我們“應(yīng)用統(tǒng)計碩士專業(yè)學(xué)位教育指導(dǎo)委員會”會推動在全國推廣,比如上海的一些學(xué)校今年就希望送學(xué)生來學(xué)習(xí)。將來大城市的一些高校,完全可以參考我們這個實驗班的模式,F(xiàn)在全國有78所高校開辦應(yīng)用統(tǒng)計專業(yè)碩士,他們絕大多數(shù)都有條件開展類似的人才培養(yǎng),都可以進(jìn)行積極探索,相關(guān)企業(yè)參加的積極性也非常高。

  記者:對于“黃埔一期”的這50名幸運兒,您有什么期待?

  袁衛(wèi):我希望他們畢業(yè)后,到用人單位經(jīng)過幾年的鍛煉,能夠主管大數(shù)據(jù)研究項目或大數(shù)據(jù)分析部門,成為數(shù)據(jù)科學(xué)家這個層面的高級人才。這類高層次的大數(shù)據(jù)人才是國家最緊缺的。探索培養(yǎng)高層次大數(shù)據(jù)人才的路徑、滿足國家日益增長的需要,這是中國人民大學(xué)等五校組建大數(shù)據(jù)人才培養(yǎng)協(xié)同創(chuàng)新平臺的目標(biāo)和使命。

  【大數(shù)據(jù)應(yīng)用案例】

  PRADA的試衣間

  PRADA(普拉達(dá),一個意大利的奢侈品牌)在紐約的旗艦店中每件衣服上都有RFID(射頻識別)碼。每當(dāng)一個顧客拿起一件PRADA衣服進(jìn)試衣間,RFID會被自動識別。同時,數(shù)據(jù)會傳至PRADA總部。每一件衣服在哪個城市哪個旗艦店什么時間被拿進(jìn)試衣間,停留多長時間,數(shù)據(jù)都被存儲起來加以分析。如果有一件衣服銷量很低,以往的做法是直接干掉。但如果RFID傳回的數(shù)據(jù)顯示這件衣服雖然銷量低,但進(jìn)試衣間的次數(shù)多,也許這件衣服的下場就會截然不同,也許對某個細(xì)節(jié)作微小改變就會重新創(chuàng)造出一件非常流行的產(chǎn)品。

  中國的糧食統(tǒng)計

  中國的糧食統(tǒng)計是一個老大難的問題。傳統(tǒng)的統(tǒng)計辦法,依靠統(tǒng)計人員層層上報,水分很大,數(shù)據(jù)的真實性令人懷疑。在前兩年北京的一次會議上,原國家統(tǒng)計局總經(jīng)濟(jì)師姚景源講述了他們是如何進(jìn)行糧食統(tǒng)計的。他們采用遙感衛(wèi)星,通過圖像識別,把中國所有的耕地標(biāo)示、計算出來,然后把中國的耕地網(wǎng)格化,對每個網(wǎng)格的耕地抽樣進(jìn)行跟蹤、調(diào)查和統(tǒng)計,然后按照統(tǒng)計學(xué)的原理,計算(或者說估算)出中國整體的糧食數(shù)據(jù)。這種做法是典型采用大數(shù)據(jù)建模的方法,打破傳統(tǒng)流程和組織,直接獲得最終的結(jié)果。

  公安部門的“犯罪地圖”

  作為2014年亞太經(jīng)合組織(APEC)領(lǐng)導(dǎo)人非正式會議的舉辦地,北京市懷柔區(qū)警方通過運用大數(shù)據(jù)、云計算和科學(xué)分析模型,整合歷年案件信息,建立了犯罪數(shù)據(jù)分析和趨勢預(yù)測系統(tǒng),能夠預(yù)測犯罪趨勢,指導(dǎo)警力投入。這套系統(tǒng)共收錄了懷柔區(qū)近9年來1.6萬余件犯罪案件數(shù)據(jù),通過標(biāo)準(zhǔn)化分類后導(dǎo)入系統(tǒng)數(shù)據(jù)庫,同時采用地圖標(biāo)注,將懷柔分成16個警務(wù)轄區(qū),抓取4700余個犯罪空間坐標(biāo),實施空間網(wǎng)格編號。

  通過對越來越多數(shù)據(jù)的挖掘分析,某一區(qū)域的犯罪率以及犯罪模式都將清晰可見。大數(shù)據(jù)可以幫助警方定位最易受到不法分子侵?jǐn)_的區(qū)域,創(chuàng)建一張犯罪高發(fā)地區(qū)熱點圖和時間表。

1 2 共2頁

中 工 網(wǎng) 版 權(quán) 所 有 ,未 經(jīng) 書 面 授 權(quán) 禁 止 使 用
Copyright © 2008-2010 by 8858151.com. all rights reserved
瀏覽本網(wǎng)主頁,建議將電腦顯示屏的分辨率調(diào)為1024*768