日前,中央全面深化改革委員會第二十六次會議審議通過了《關于構建數據基礎制度更好發揮數據要素作用的意見》,明確要加快構建數據基礎制度體系,統籌推進數據產權、流通交易、收益分配、安全治理。數據作為一種新的生產要素,需要新的基礎制度體系來配套運用。當前,我們在數據確權、隱私保護、安全治理等方面仍有待探索。
數據正成為越來越重要的生產要素
數據作為一種新的生產要素,與傳統的生產要素如土地、資本、勞動力和技術等,有很大的不同。傳統生產要素,往往有越用越少的性質,因此它的積累很難實現量的躍升。有的要素用完了就沒有了,或是有折舊。除了技術要素以外,其他要素有邊際報酬遞減的特征。
但是,數據資源有報酬遞增的效果,也即當數據規模越大、種類越多的時候,它越能煥發出強大的生產力作用。此外,數據如果被運用在一些傳統領域如生產鏈、物流等方面,還會產生強大的網絡正外部效應。
數據要素不會隨著使用逐漸減少,還與數據的另外一種特征有關,也就是數據是在生產和消費的過程中產生的。因此,數據是越生產、越消費,資源越多。
在數據產業方面,中國經濟當前正在這個領域彎道超車。中美兩國是數據產業的兩個超級巨頭。由于數據資源成為越來越重要的生產要素,如果中國能把握住這一輪機遇,那么在引領新興產業發展過程中,我們就有強大的人口規模和經濟規模優勢。這些優勢在一些領域已經可以看到,例如在城市管理方面,中國應用大數據在城市管理方面所產生的一些先進的模式,應該說是走在世界前列。
我們要更好地利用機遇,一方面充分發揮市場的作用,發揮企業的積極性,另一方面,能夠通過制度的規范,更好地促進和推動數據相關的產業的發展,和應用場景的實現。在加強管理和推動數據產業發展之間如何平衡,還有很多的問題需要認真探討,要避免在傳統思維方式之下的一些管理思維和模式,可能會形成新興產業發展的阻礙因素。
五大問題待解
數據作為一種新的生產要素,需要新的基礎設施建設來配套運用。就當前而言,我們還有以下幾個基礎制度沒有很好地建立起來,這也是全人類共同面臨的問題。
第一是數據的產權。傳統生產要素的產權相對來說比較明確,所有者、使用者和受益者分別是誰,一目了然。但是數據作為一種資源,存在產生數據的人沒有很好地獲得回報的問題。
比如消費者在進行消費的時候,產生了數據資源,這些數據對于企業和公共管理者而言,有很大的利用價值,但這種利用價值并不一定被消費者本人所獲取。因此,這個數據到底是屬于個人,還是屬于企業,企業有沒有權利利用個人所產生的數據去牟利?如果僅限于在與消費者互動的過程中使用,以提高生產者的效率,那還可以另當別論,但企業有沒有可能把消費者產生的數據拿去轉讓獲利,這就比較有爭議。
此外,消費者產生的數據具有公共性,當這種公共性被用來進行公共管理的時候,也會涉及到授權的問題。這些問題需要有制度建設來進行明確,數據產權的所有權、使用權和收益權需要好好界定。
第二是隱私保護。公共用途以及企業用途,如何做到保護個人隱私?一段時間以來,在國內外都出現一些大數據被轉讓、買賣、公開甚至濫用的現象。這些問題讓公眾對于個人數據隱私安全產生擔憂。如何有效地避免,公共權力跟個人隱私的邊界在哪里?這些也值得去探討。
第三是對大數據壟斷的擔憂。傳統經濟學對于壟斷,主要是由市場份額來進行判斷。但是在大數據時代,一些平臺經濟如果要發揮功能,天然就需要有大規模的用戶和數據。這一方面有利于提高資源配置效率,但也客觀上存在一些“大數據殺熟”等企業利用大數據優勢來侵犯消費者利益的問題;也有一些用戶認為,在與平臺進行互動的過程中,用戶往往因為是弱小的個體而缺乏談判力。
因此,在大數據時代對壟斷的定義,以及對壟斷的危害如何界定。這些問題在國內外學術界和政策制定界都還在進一步的探索,還沒有完全的定論。
第四是數據的公共安全。這既包括我們把數據匯總到某一公共平臺的時候,如何防止數據泄露、濫用或被用于私人進行牟利,也包括一些平臺經濟在涉及跨國經營的時候,如何保障一國的數據能與其他國之間,既能有效地建立安全邊界,又能在特定領域進行跨國協調和配合。
因為大數據本身具有規模經濟性,如果數據不流通,可能難以實現應用價值。對此,目前一個比較一致的看法是,算法可以無邊界,但原始數據要設立好防火墻。但也有例外,如在抓捕跨境犯罪時,光有算法共享可能也不夠,可能還會涉及數據的溝通。再如跨國界的聯合開發,如果僅有算法的共享,終端的研發者可能很難在數據上發現價值或者問題,會影響開發效率。這都是理論和實踐上需要去探討的問題。
第五是數據開放共享。公共數據平臺在發揮用途的時候,需要向研究者進行開放。正如前文所說,數據具有正外部性的特征,把不同的數據匯集到同一個平臺上,比單獨利用數據,所煥發出來的效能更大,甚至可以呈幾何級數的增長。但這里面就涉及到幾個問題:首先是我們通過什么樣的機制,讓不同的數據歸集到同一個平臺上來。中國目前在這方面走在世界前列,比如通過政府的協同來打造大數據中心、智慧城市、城市大腦等。但協調仍是一個難題,且不說去協調企業所擁有的大數據,連政府不同的部門之間,其所擁有的數據都很難歸集到同一個平臺上來。
其次,就算數據都匯集到同一個平臺,誰來開發也是個問題。一些平臺的數據建設者,本身并不一定直接去開發數據,產出可以解決實際問題的應用場景。而能夠開發應用場景的科學家們,如何能夠用平臺上的數據來做科學研究,科學家利用這些大數據所產生成果如何界定其知識產權?
大數據應用前景廣闊
展望數據未來的應用,應該說問題很多,但是前景和前途也非常廣闊。不妨結合筆者團隊所做的工作,來描繪大數據的一些應用場景。有些應用結果,可能具有科學價值,也可能具有公共政策價值,也有可能具有商業價值,或者兼而有之。
第一,將數據應用于構建經濟指數,動態地反映經濟和社會發展的狀態。一個共識是,數據是指導政策和商業運行的非常重要的資料。傳統的一些數據,往往有不夠及時、度量的指標比較主觀等特點,特別是一些依賴于問卷信息構成的指數。此外,一些傳統數據的更新頻率和顆粒度都不高。但是大數據能夠及時、動態和客觀地反映真實,只要算力足夠,就可以刻畫細顆粒度的一些特征。
例如,我們與一家位于昆山的靈活就業平臺合作。這個平臺上面有數量龐大的流動人口,其主要會員是農民工群體。平臺的一端,連接了流動人口群體,另外一端,則連接了有用工需求的制造業企業。隨著企業用工需求的波動,如這個月A企業有大量用工需求,B企業沒有,而下個月B企業用工需求旺盛,A企業用工需求減少,靈活就業群體可以根據用工需求在不同企業之間變換就業。這樣一種在不同企業之間靈活就業的模式,既可以提高企業的用工柔性,又有利于保證靈活就業群體的充分就業。
平臺上的用工數量和用工價格,能夠很好地反映制造業發展的景氣度。我和上海大學的向寬虎利用這個數據,構建了長三角、珠三角地區制造業景氣先行指數。這個指數對于政府決策把握宏觀經濟動態,以及商業機構把握未來制造業的發展趨勢,都具有很強的借鑒和指導意義。
第二,將數據應用于指導公共政策。今年3月,《中共中央 國務院關于加快建設全國統一大市場的意見》發布,我與鄭怡林、李杰偉等在“評價科技”的汽車大數據支持下,通過分析城市與城市間的車流的強度,很好地度量了城市與城市間的經濟聯系,并可以在觀察城市聯系緊密度的基礎上,來界定城市群。我們還用汽車大數據回答了中國當前地區之間的市場分割有多嚴重,并指出了市場不夠統一與地方政府行為之間的關系。
我們也曾用來自某超大城市的公共管理投訴大數據,包括公共衛生、公共安全,市政建設等方面的投訴,通對這些大數據進行分析,可以發現城市的人口密度與公共管理之間的關系,有力地回答了很多人擔心的,人口規模高會使公共管理變得更加困難的誤解。我們用數據告訴大家,其實人口密度的提高有利于提高公共管理的效率。
第三,將數據應用于科學研究?茖W研究是大量依賴于實際數據的,但是傳統的數據具有頻率不夠高、時間有滯后性、采樣代表性不充分等等問題,大數據給科學研究發現規律,提供了非常重要的數據資源。現在大數據越來越多地用在科學研究上,特別是社會科學研究方面。
比如最近我們用手機信令數據,識別了早高峰時期上海的人口流動方向。可以非常清晰地看到,人們無論是居住在外環以內,還是在外環以外,早高峰時期都在大量向中心城區通勤,表現出一種“向心城市”的特征。也就是說,當一個城市進入到服務業為主的階段,大量的就業崗位和消費場景,是集中在中心城區的。這個時候,如果把人口從中心城區向外疏散,有可能造成一些產業(特別是服務業)生產效率下降,或者加重城市擁堵的后果。
這又會引起另一個話題,是不是我們也可以同時把產業向外疏散?但我和彭沖通過對大眾點評的餐館消費數據研究表明,人口密度可以提高服務消費的數量、質量和多樣性,而這對建設國際消費中心城市而言非常重要。疏散城市人口有可能會產生降低人口密度從而導致不利于服務業發展的后果。
以上例子,希望能幫助讀者更好地理解數據資源,在我們今天這個時代,所能煥發的巨大的能量,數據既有利于提高企業的生產效率,又能夠提高公共管理的效率,還能夠提高居民的福利。關鍵在于我們能不能通過一種制度,去規范數據資源的應用,讓數據資源的應用造福于人民,同時必須警醒,數據濫用會造成對企業和社會福利的傷害,這是我們當下全人類共同面臨的主題。
陸銘(上海交通大學安泰經濟與管理學院特聘教授、中國發展研究院執行院長)