| |
北京大學電子政務研究院副院長楊明剛:大數(shù)據(jù)重新定義變革 |
|
[ 通信界 / 田軼 / m.sese521.com / 2018/5/13 12:25:52 ] |
|
|
|
| |
2018中國IT市場年會——工大數(shù)據(jù)與云計算高峰論壇”在北京香格里拉酒店隆重舉行。北京大學電子政務研究院副院長、北京大學博雅數(shù)據(jù)研究中心主任楊明剛在大會上發(fā)表了主題演講。
以下為演講實錄: 各位朋友下午好,今天北京陽光明媚,春暖花開,也非常高興我們來這一場大數(shù)據(jù)的盛會,非常有幸跟大家一起分享我們在過去的一段時間里面,在政府大數(shù)據(jù)以及我們上夜大數(shù)據(jù)里面的一些感想或者所想所得,我分享的主題是變革與創(chuàng)新,大數(shù)據(jù)重塑社會治理和公共服務。因為我們北京大學電子政務研究院基本上從事的是政府大數(shù)據(jù)相關的研究應用。在商業(yè)大數(shù)據(jù)我們也做了一些探索和嘗試,今天分享更主要圍繞政府大數(shù)據(jù)。 下面主要分享兩大塊兒,第一塊有關社會治理以及黨中央國務院提出的國家治理能力,治理體系現(xiàn)代化,治理能力現(xiàn)代化,大數(shù)據(jù)在中間能扮演什么樣的作用。第二部分,在未來商業(yè)變革中,大數(shù)據(jù)會起到什么樣的作用。在講到社會治理以及政府大數(shù)據(jù)相關內容之前,跟大家先分享幾個事件,為什么會分享社會的熱門事件呢?他給我們的社會智力,給政府大數(shù)據(jù)的應用其實特別有關系。去年11月18號北京大興發(fā)生了一次大火,北京市出臺了相關的政策,但是這些政策后來廣受非議,包括網(wǎng)絡輿論大面積的非議。我們在政策出臺之前,要做真正的大數(shù)據(jù)決策,相關的支撐,不能拍腦袋。這個小女孩的形象可能大家記得很清楚,這個照片在互聯(lián)網(wǎng)上廣為流傳,后面還有幾幅圖片全世界再灌注,這些圖片在網(wǎng)上已經(jīng)看不見了。在很多公共政策決策中,是我們有沒有通過大數(shù)據(jù)的方法,對我們市政的措施提供科學依據(jù),決策依據(jù),包括驅趕低端人口,還有煤改氣等等。這幾個措施后來都是北京叫停,對整個政府的治理,對黨和國家的形象帶來了非常大的負面?zhèn)Α?BR> 我們用大數(shù)據(jù)的方法梳理相關的節(jié)點,事件他社會的傳播影響力非常有價值,經(jīng)驗或者教訓在這些事件中我們可以看的非常清楚。包括在國內外,在海外也引起了大量媒體的熱議。很多人會質疑社會治理一刀切,通過大數(shù)據(jù)的方法,如果我們在座是市委書記,市長,通過這張圖,我們公共治理政策決策出來的時候,公交卡的數(shù)據(jù),出行的數(shù)據(jù),大致可以判斷出來哪些人在多少公里之間移動,我們通過相關的特征分析,基本上可以鎖定哪些人在城市,主城區(qū)跟郊區(qū)之間的往來,基本上可以判斷出來他住的哪些區(qū)域,我們發(fā)現(xiàn)所有的低端人口,或者是外來人口,主要集中在北部,昌平區(qū),朝陽區(qū),豐臺區(qū)。大家可以看大興的分布并不是很顯著,這是公交卡的數(shù)據(jù),是呈現(xiàn)正相關的。我們對出行數(shù)據(jù)分析以后,我們在天津大張旗鼓的搞這樣的事情,在大興可能方向本身就是有問題的,通過大數(shù)據(jù)方法,如果政策出臺之前聽取大數(shù)據(jù)相關分析,可能我們政策就不會有很多的盲目性,當然也不會有后來那么多負面的東西。通過這個事件,我們基本上可以總結出來,用大數(shù)據(jù)來決策,可能比拍腦袋決策來的更靠譜,更準確。 這些事件都是這樣的,通過公共事件的分析,公共事件網(wǎng)絡的數(shù)據(jù)也可以把他歸為政府大數(shù)據(jù),或者政務大數(shù)據(jù)的一部分,其實也很牽強,大家知道在今天政府作為一個數(shù)據(jù)的重要生產(chǎn)方,他占據(jù)了目前份額里面60%以上的社會數(shù)據(jù),隨著我們整個智慧城市,以及我們現(xiàn)代城市發(fā)展,以及現(xiàn)代商業(yè)發(fā)展,很多數(shù)據(jù)由社會產(chǎn)生的,這塊兒的數(shù)據(jù)量越來越多。而且隨著智慧城市以及電子政務的發(fā)展,我們城市管理中也產(chǎn)生了大量的實時數(shù)據(jù),這些數(shù)據(jù)包括我們的水務數(shù)據(jù),交通數(shù)據(jù),人口移動數(shù)據(jù),電力等等,圍繞城市相關的所有數(shù)據(jù),有了這些數(shù)據(jù)之后我們才能做更多的大數(shù)據(jù)分析。今天互聯(lián)網(wǎng)公開這些數(shù)據(jù),每個企業(yè)都可以拿到,每個企業(yè)在上面做了很多工作。過去一段時間,攝象頭的數(shù)據(jù),在我們北京市的攝象頭基本上遍布大街小巷,對我們從事社會治理,或者說城市管理的人來說是非常好的東西。這種數(shù)據(jù)跟個人的隱私也相關,比如電子商務平臺購物數(shù)據(jù),社交媒體上溝通數(shù)據(jù),表達數(shù)據(jù)。通過這些數(shù)據(jù)我們可以鎖定這個人現(xiàn)實活動的軌跡,網(wǎng)絡上的態(tài)度傾向,或者對某類事件的態(tài)度。基本上能夠對我們每一個人進行很精準的數(shù)據(jù)畫像。 說到大數(shù)據(jù)不是大水漫灌的概念,他有了大數(shù)據(jù)以后,讓我們可以更精準的關切到每一個人的關切,也就是說,有了大數(shù)據(jù),其實我們不是講這一群人怎么樣,我們要鎖定每一個人個體需求,通過大數(shù)據(jù)。我們能捕捉到這個城市中,或者我們社會中需要給予關切的人,比如精準扶貧,城鄉(xiāng)一體化建設,其實需要我們每一個個體通過大數(shù)據(jù)給予更多的關注,這才是大數(shù)據(jù),大數(shù)據(jù)不是一個籠統(tǒng)的概念。有了這種數(shù)據(jù)的精準畫像,通過大數(shù)據(jù)的方法,讓我們把真正需要給予關注的信息給予關注。比如說我們在研究社會治理中,那些極端的事件,那些個案數(shù)據(jù),其實就是我們需要關切的數(shù)據(jù)。換一個場景來說,比如說在社會綜合治理中,我們涉恐涉暴的信息,一定是跟這些大的數(shù)據(jù)不同的,他帶有異常的數(shù)據(jù)特征,包括電信詐騙。尤其去年有那么多的學生馬上入學了,遭遇詐騙,后來想不通心臟病復發(fā)出現(xiàn)人命,從某種意義上說銀行或者電信部門,對異常的數(shù)據(jù)流動我們可以監(jiān)測的,或者說異常數(shù)據(jù)在合規(guī)的樣本中間之占10%。我們通過一種方法完全可以發(fā)現(xiàn)這些數(shù)據(jù),這些數(shù)據(jù)就是電信詐騙的數(shù)據(jù),或者說涉恐涉暴的數(shù)據(jù),或者說異常的業(yè)務流動數(shù)據(jù),我們完全可以發(fā)現(xiàn),或者通過一種方法預警,及早的發(fā)現(xiàn)。 說到大數(shù)據(jù),有很多概念性的東西我就不說了,在整個大數(shù)據(jù)中間還有一個結論性的東西,美國有一個叫巴拉巴西的一個人,翻譯過來叫爆發(fā)。他提到人類行為的93%是可以預測的,換句話說我們今天在互聯(lián)網(wǎng)的活動,包括我們今天來開會,完全可以畫像。也就是說有了這種畫像,可以對未來一個月我們的消費行為,社交行為,或者說我們的出行行為都能夠做出基本上方向上的判斷。其實這就是大數(shù)據(jù),在今天每個人,在網(wǎng)絡的時代,在數(shù)據(jù)時代我們都是透明的,再換句話說其實沒有什么隱私,我們的銀行消費數(shù)據(jù),網(wǎng)上表達數(shù)據(jù),換個馬甲一樣可以發(fā)現(xiàn),我們在微信上的討論,溝通,其實都是有跡可尋的,那些犯罪分子,包括暴恐分子他們會隱藏這些數(shù)據(jù),不用手機,也不用傳統(tǒng)互聯(lián)網(wǎng)手段,面對面溝通,他想方設法的掩蓋這種數(shù)字的痕跡,或者數(shù)字的蹤跡。對絕大部分人來說這些數(shù)據(jù)其實我們是心理很坦蕩,也無所謂,這里會引出更嚴重的問題,數(shù)據(jù)隱私權邊界問題,我們登陸一個網(wǎng)站的時候,我們已經(jīng)默認了數(shù)據(jù)全部交給他了,登陸淘寶,京東的時候會默認家庭住址,購物偏好,都交給他了。所以在今天大數(shù)據(jù)的時代,說到隱私權的話題延展起來比較寬泛。 在過去很長時間,我講過很多課,有一次我去東北某一個公安廳,跟負責技術的一個領導在溝通,都是好朋友了,在內部的會議上就問到我一個問題,他說楊老師,有很多人跟我講大數(shù)據(jù),其實我到今天我都搞不懂什么是大數(shù)據(jù)。第二個問題,這個大數(shù)據(jù)對我有什么用,大家知道在很多行業(yè),比如說金融、電信、政府部門已經(jīng)覺得過去20年里面,建了很多信息化的系統(tǒng),盡管這些系統(tǒng)之間是互相屏蔽的,或者數(shù)據(jù)是隔離的,目前沒有融合,這也是我們大數(shù)據(jù)企業(yè)要做的事情,目前刑偵系統(tǒng),交管系統(tǒng),反恐系統(tǒng),社會治安管理系統(tǒng)等等,垂直的系統(tǒng),在部門內部有很多垂直系統(tǒng),我用的非常好,提高多少破案率,提高多少案件的結案率,非常好。為什么要用大數(shù)據(jù)?其實這個話也問給我們在座每一個做大數(shù)據(jù)的這些企業(yè)界,或者學界的人,為什么客戶要去做大數(shù)據(jù)系統(tǒng)?去做數(shù)據(jù)融合系統(tǒng)?去做數(shù)據(jù)整個可視化展現(xiàn)系統(tǒng)。這里面有一個問題,用一句話點破企業(yè)政府的顧慮,在過去比如說緝毒的部門跟兇殺案部門,跟交通管理部門,數(shù)據(jù)是沒有在一起的,但今天這些數(shù)據(jù)如果放在一起,可以很精準的還原一個人立體的畫像,這個時候我們很容易發(fā)現(xiàn)犯罪線索之間某種潛在的關聯(lián)關系,比如銀行卡關系跟犯罪分子出境數(shù)據(jù),住店數(shù)據(jù),網(wǎng)絡上的消費數(shù)據(jù),是有某種關聯(lián)關系的。也就是說我們常規(guī)大數(shù)據(jù)分析,當然是像天氣預報一樣,分析股票趨勢一樣,我們可以分析的非常好。因為數(shù)據(jù)之間是強關聯(lián)關系,但是在某些場景下面,比如說涉恐涉暴,公共治安管理,犯罪分子想方設法的降低關聯(lián)關系,這個時候我們就需要用一種獨特的分析方法,區(qū)別于傳統(tǒng)的,像股票分析那樣的他是有規(guī)律的,強關聯(lián)關系,弱關聯(lián)關系,我們要發(fā)現(xiàn)異常點之間潛在的關聯(lián),或者發(fā)現(xiàn)新的知識。 第一張圖我在很多場合也講過,跟大家分享過,在草中間發(fā)現(xiàn)一根針,每個草的物理屬性我們是知道的,每根針物理屬性我們也是知道的,就像中國古代沒有計算機的時候,用數(shù)據(jù)統(tǒng)計的方法發(fā)現(xiàn)某個特征。比如找尋中共黨員民族是漢族的,或者博士畢業(yè)的,本科畢業(yè)的,檢索出來而已,這張圖其實是傳統(tǒng)的數(shù)據(jù)分析,他只是大數(shù)據(jù)分析中很簡單的一部分,基礎的部分,真正大數(shù)據(jù),在目前社交網(wǎng)絡,或者現(xiàn)代社會治理,潛在的數(shù)據(jù)關聯(lián)才是我們大數(shù)據(jù)分析的本質。比如說金融詐騙,反洗錢的線索,或者誰可能是犯罪分子,哪一筆交易可能存在問題,這個時候我們要通過傳統(tǒng)方法是看不見的,要借助某些必要的工具去發(fā)現(xiàn),就像這樣的立體圖我們很多人都看過,看半分鐘才能看見里面有字或者里面有小動物,真正大數(shù)據(jù)分析,或者未來的大數(shù)據(jù)分析其實是這樣的東西,在一堆看似沒有關聯(lián)的數(shù)據(jù)中,發(fā)現(xiàn)某些潛在的數(shù)據(jù)邏輯。 這是可視化的分析方法,這里面有很重要的一個體系,我見過很多大數(shù)據(jù)的企業(yè),做大數(shù)據(jù)分析,包括做底層融合,數(shù)據(jù)整個結構化處理,其實用的都是基于二維表這樣的關系數(shù)據(jù)庫,但是某一類場景中,比如說電信詐騙,商業(yè)欺詐案件,我們需要用一種圖數(shù)據(jù)庫方法,去發(fā)現(xiàn)數(shù)據(jù)之間某些關聯(lián)關系。這些圖數(shù)據(jù)庫不知道在座有沒有企業(yè)做,很少見到有企業(yè)專門研究圖數(shù)據(jù)庫數(shù)據(jù)分析,但是這方面是很大的市場,很大的場景需求,用圖數(shù)據(jù)庫分析異常的數(shù)據(jù),或者說某些數(shù)據(jù)之間的關聯(lián)關系。 這是圖數(shù)據(jù)庫在某些領域的應用,包括在公共安全或者是社會網(wǎng)絡,以及金融行業(yè)的應約。很容易發(fā)現(xiàn)某一類事件特殊的數(shù)據(jù)表現(xiàn),這是分析一些公共事件,也是很有名的一次暴恐事件的分析。 在過去幾年,我經(jīng)常碰到做政府信息化的企業(yè),過去兩三年他們的名片已經(jīng)換了,從系統(tǒng)集成公司,系統(tǒng)公司搖身一變,變成了大數(shù)據(jù)公司。大數(shù)據(jù)在這些行業(yè)都存在,都有做大數(shù)據(jù)公司,但是這些基本都脫胎于過去的信息化基礎工程,很多時候大數(shù)據(jù)不應該成為大忽悠。大數(shù)據(jù)我們在座很多都是業(yè)界的,跳過了。在政府領域里面,其實大數(shù)據(jù)才剛剛開始,剛才我講的場景,我在公安廳給他們講課,問到過大數(shù)據(jù)有什么用,在犯罪的關聯(lián)關系中,數(shù)據(jù)源掌握的越充足,數(shù)據(jù)樣本占有越多,預測分析,某種關聯(lián)關系才能發(fā)現(xiàn)的更精準。很簡單的一個道理,目前整個政府的大數(shù)據(jù)這塊兒,在過去兩年中,不同的部門,包括工信部出臺了二三十個文件,不包括地方大數(shù)據(jù)規(guī)范。但這里面其實像中國的電子政務一樣,過去是九龍治水,在今天大數(shù)據(jù)應用中,依然可能會面臨這樣的問題。在智慧城市或者是數(shù)字城市中我們會發(fā)現(xiàn)很多省市都是摸著石頭過河,而且基本上信息系統(tǒng)都是有賴于一把手首長,他要懂就可能推進很快,他要不懂就很慢。我們今天還是存在這樣的問題,每個省之間是不通的,甚至在每一個省里面每個地區(qū)之間,每個市之間也是不通的。這就是我們整個智慧城市,電子政務的現(xiàn)狀,在這個基礎上,我們的大數(shù)據(jù)應該怎么做。 我們在過去的幾年里面,也跟相關的部門做大數(shù)據(jù)云政務的頂層設計,但是帶有強制性,規(guī)范性的標準沒有出來,從技術層面。所以今天我們每個城市都在搞大數(shù)據(jù),基本上都是圍繞產(chǎn)業(yè)園區(qū)做產(chǎn)業(yè),沒有人,或者沒有太多人去關注數(shù)據(jù)底層應該怎么構建,或者未來共享架構應該怎么布局,還沒有。所以我很擔心我們的大數(shù)據(jù)每個企業(yè),政府這邊有選擇性的去做,最后發(fā)現(xiàn)大數(shù)據(jù)有很多云,這些云之間還是不能相通,其實這才是我們這個行業(yè)未來面臨的很大問題,我們所有人都會面臨,你今天做了一個行業(yè),但是你要做其他省這個行業(yè),障礙非常大,就是因為數(shù)據(jù)底層不相通,包括政府部門也是這樣。 大數(shù)據(jù)一定是一個趨勢了,黨中央國務院習總書記去年12月8號在中央政治局第二次學習會議上也特別提到數(shù)字中國,他把大數(shù)據(jù)提到了非常高的高度,無論大數(shù)據(jù)在社會治理,政府發(fā)展,公共服務,或者說未來整個的一帶一路布局中,大數(shù)據(jù)一定會起到非常重要的作用。所以今天我們已經(jīng)迎來了一個非常大的大數(shù)據(jù)領域機遇,在座的業(yè)界我們遇到了非常大的機遇,或者說大數(shù)據(jù)的風口。但是大數(shù)據(jù)在今天跟三年之前,更回歸于傳統(tǒng)實用的本質,如果說三年之前大數(shù)據(jù)是為了忽悠政府,希望政府來投入,政府上項目,在今天大數(shù)據(jù)已經(jīng)落在地上了,真正腳踏實地用大數(shù)據(jù),為我們政府管理,為我們企業(yè)真正提供一些東西。不能再靠概念了,就像云計算一樣,云計算在頭五六年也是吹的天花亂墜,但是今天剩下的就那幾個了。 大數(shù)據(jù)目前應用困境也是跟電子政務一樣的,從根子上是一模一樣的,因為大數(shù)據(jù)說實在話,他也是屬于政府信息化的一類應用而已,他只是跟場景。他脫離不了中國電子政務大環(huán)境,或者說某些體制性的環(huán)境,更主要是標準,另外是應用場景。這個標準如果定不下來,應用場景再復雜多樣,哪個公司都在做,哪個業(yè)界的人都在里面研究,但是我們永遠形不成一種聲音,形不成一種趨勢的力量。所以我們也希望業(yè)界,相關學界,以及政府部門聯(lián)合推動大數(shù)據(jù)相關的標準設計。這個非常重要,我們經(jīng)常會發(fā)現(xiàn),悶著頭走,走錯了。經(jīng)常要低著頭,還要抬頭看路。 大數(shù)據(jù)在未來的智慧城市中,所扮演的角色會越來越重要。無論從我們的政府治理,以及我們對城市的有效管理,或者是城市的治理,大數(shù)據(jù)一定會起越來越重要的作用,比如說智慧交通,智慧水務,電力,相關能源布局等等,包括霧霾,北京今年的霧霾相對比較少,關停了很多周邊的工廠。但是一個大城市,或者中國的城市,在過去幾年我去了很多的城市,發(fā)現(xiàn)很多城市開始有霧霾,而且都出現(xiàn)了堵車,其實當然一方面是因為我們基礎建設沒有跟上,另一方面也是因為城市發(fā)展擴張,比過去要加快了很多。所以所有的城市都面臨一個問題,通過大數(shù)據(jù)方法,通過信息化方法提升城市的運轉效率。基本上我跟大家分享的也就是這么多了,說來說去大數(shù)據(jù)還是要回到一句話,讓大數(shù)據(jù)真正的為老百姓服務,為人民服務。用十九大報告中的一句話,不忘初心,方得始終,謝謝。 |
|
|
| |
|
|
|
|
|
|
| 版權與免責聲明: ① 凡本網(wǎng)注明“合作媒體:通信界”的所有作品,版權均屬于通信界,未經(jīng)本網(wǎng)授權不得轉載、摘編或利用其它方式使用。已經(jīng)本網(wǎng)授權使用作品的,應在授權范圍內使用,并注明“來源:通信界”。違反上述聲明者,本網(wǎng)將追究其相關法律責任。
② 凡本網(wǎng)注明“合作媒體:XXX(非通信界)”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
③ 如因作品內容、版權和其它問題需要同本網(wǎng)聯(lián)系的,請在一月內進行。 |
|
|
|
|
|