【
中國智能制造網 學術論文】大數據具有數量大、數據多樣化、價值密度低、速度快的特征,通過技術提供獨特的也是全新的思維奠定了我們的學習創新(深度學習)、科技創新和管理創新。大數據科學與管理科學的結合從而產生大數據的管理,大數據獨特的收集功能、儲存功能、分析功能、價值挖掘功能和預測功能,促使公共管理從封閉性的管理結構轉向開放性的管理結構;從官僚科層制轉向扁平化結構;從公共管理與政治管理邊界模糊的結構轉向公共管理與政治管理邊界清晰的結構;從專注于對人的管理轉變為對數據的管理并借助于大數據來為人服務的模式;從被動應對性的公共決策轉向基于大數據之上的主動性的優化決策。當然,這些變革也就意味著風險,其中包括導致公共管理中的不確定性風險和不可靠性風險。
關鍵詞:大數據/公共管理/大數據功能/公共管理變革
作者簡介:胡鍵(1968-),男,湖南道縣人,上海社會科學院研究員,博士研究生導師,從事中國軟實力研究,上海 200020
基金項目:國家社會科學基金項目“中國軟實力評估及增進方略研究”(14BKS064)
公共管理是公權力的行使者決定公共資源在公共領域配置的過程。公權力配置公共資源并不是隨意性的,科學配置公共資源必須建立在對公共領域詳細了解的基礎上;否則,公共資源的配置就會出現扭曲,終導致公共資源的浪費和無效配置。傳統的公共管理是借助于歷史經驗的反復比較,正所謂“以史為鑒,可知興替”。今天雖然歷史縱向的比較仍然可以獲得經驗,但這并非的方法,甚至可以說是一種陳舊的方法論。新的方法是基于大數據的公共管理,大數據將帶來公共管理的重大革命。
一、大數據的內涵和特征
“大數據”是近年來的一個技術熱詞,也是一個學術熱詞,同時也是一個政府施政的熱詞①。大數據究竟是什么?并非一個人人都能回答的問題。有學者把大數據視為一種統計工具,并將大數據解釋為“不是基于人工設計、借助傳統方法而獲得的有限、固定、不連續、不可擴充的結構型數據,而是基于現代信息技術與工具可以自動記錄、儲存和連續擴充的、大大超出傳統統計記錄與儲存能力的一切類型的數據”[1]。在這些學者看來,大數據對人類思維的影響也僅僅是表現在“認識數據思維的變化”、“收集數據思維的變化”和“分析數據思維的變化”[1]。即便有學者對大數據有比前者更深入的理解,認為“大數據將深刻影響人類的決策模式和社會經濟的運行模式”,但也仍然是從統計學的角度來思考大數據的意義[2]。從技術上來看,大數據可以歸人統計工具之內,但大數據與統計工具是存在巨大差別的。傳統統計工具是以傳統統計方法為代表的“以算法為中心”的,而大數據是以數據挖掘為核心的“以數據為中心”的統計[3]。前者通常需要提前對數據分布和誤差結構等做出假設,在某種意義上其結果只是人工擬合的近似世界而非真實世界,而后者基于總體數據可以給出更加的描述和預測[4]。由此可見,大數據雖然可以歸入統計工具之內,但它不是一般意義上的統計,一般的統計只是基于既有數據的分析,而大數據是透過既有的數據可以挖掘出既有數據隱藏著的數據和價值。尤其是大數據中的非結構性數據本身就隱藏著巨大的價值,這是戰略預測的重要依據;相反,傳統統計工具一般不會對非結構性數據產生興趣。也有學者認為,大數據既是數據,也是一種技術和能力,“是數據收集、分析的前沿技術,是從各種類型的龐大數據中快速獲得有價值信息的能力”[5]。持這種觀點的學者認為,大數據實際上是用來決策的工具。但是,大數據在于它的全數據、混雜性和相關性,大數據根本無法提供決策的工具。不過,大數據卻能夠提供一種獨特的思維。也就是說,大數據并不是提供決策的具體工具的,而是提供全新的決策思維的。指望用大數據來提供一種的決策工具是不可能的,但大數據思維的確使決策對數據產生嚴重的依賴性,然而,正如舍恩伯格所說的那樣,“數據遠遠沒有我們想象的那么可靠”[6]208,“大數據為我們提供的不是終答案,只是參考答案”[6]233。還有學者認為,大數據就是指人們借助于云技術運用數據的能力,當然這種數據不是一般的數據,而是海量數據包括結構性數據和非結構性數據。也即是人們借助于云技術使用結構型數據和非結構性數據的能力,而這種能力體現在國家治理、隱私保護、公共服務、醫療衛生等。這方面的成果不少,但基本上都是從集體的領域來分析的,這里不一一列舉。
大數據固然是數據,也是技術、能力和價值,也正因為如此,人們都是從這些方面來認識大數據特征的,即通常用4個V(即Volume,Variety,Value,Velocity)來概括大數據的特征。
1.數據體量巨大(Volume)。據估計,人類生產的所有印刷材料的數據量是200PB(1PB=2[10]TB),而歷史上全人類說過的所有的話的數據量大約是5EB(1EB=2[10]PB)。當前,典型個人計算機硬盤的容量為TB量級,而一些大企業的數據量已經接近EB量級②。
2.數據類型繁多(Variety)。這種類型的多樣性也讓數據被分為結構化數據和非結構化數據。相對于以往便于存儲的以文本為主的結構化數據,非結構化數據越來越多,包括網絡日志、音頻、視頻、圖片、地理位置信息等,這些多類型的數據對數據的處理能力提出更高的要求。
3.價值密度低(Value)。價值密度的高低與數據總量的大小成反比。以視頻為例,一部1小時的視頻,在連續不間斷的監控中,有用數據可能僅有一兩秒。如何通過強大的機器算法更迅速地完成數據的價值“提純”,成為目前大數據背景下亟待解決的難題[7]。由于數據多、總量大、價值密度低,因此,人們對數據(信息)的關注度就非常低。正如約瑟夫·奈所說:“豐富的信息導致關注的貧乏。當我們被大量的信息淹沒在其中之時,我們難以確定關注什么。注意力取代信息成為稀有資源,而可以將有價值的信號與白噪音區分開來的人就獲得了權力。”[8]奈所說的“將有價值的信號與白噪音區分開來”,在大數據中就是數據挖掘;而“獲得了權力”的意思在大數據中就是指獲得價值。另外,Value還有一層意思是指大數據所蘊含的巨大價值。大數據雖然因信息超大規模而導致關注度降低,進而使數據的價值密度降低,但是,大數據之大在于數據具有“再生性”,數據的價值具有巨大的增值效應。大數據的使用者并非停留在對表層數據的使用和發現表層數據的價值,而是通過表層數據不斷挖掘,既可挖掘更深層次的數據,也可通過深層次的各種數據(包括結構性數據和非結構性數據),從而挖掘出更大的價值。
4.速度快(Velocity)。大數據框架內的速度包括兩個方面:一方面,指如何加快數據的導入;另一方面,指如何加快分析和利用新導入的數據。前者的一個重要原因是大數據時代數據產生迅速,而大數據本身要求的是全數據,如果沒有快速導入數據的技術,那么就很難做到全數據,不是全數據就不能成為大數據。后者則是由大數據的目標所決定的。大數據的目標是利用大數據進行科學分析和科學預測,新數據不斷產生,那就意味著新問題、新情況也迅速產生。沒有快速分析和利用新數據的能力,那么,所有的預測都是滯后的。滯后的預測會導致大數據喪失其預測功能。因此,在如此海量的數據面前,處理數據的效率就是一個機構的生命力所在。
除了上述四個特征,大數據更重要的還是提供一種獨特的思維,即大數據思維。什么是大數據思維呢?(1)開放性思維。由于大數據的來源是多源性、多路徑的,也就是說,數據本身是開放性的。因此,在分析數據和基于大數據進行預測的時候也需要一種開放性的思維來進行分析和預測。(2)非線性思維。這種思維要求我們在分析問題的時候不能僅僅憑幾個要素來進行決策,而是要把所有相關性因素都要納入分析框架。尤其是不能用簡單的因果關系來進行決策,要充分考慮問題的復雜性。(3)價值思維,不能把數據僅僅看作數據,要認識到數據背后的巨大價值。傳統的數據思維是數理統計思維,認為數據的本質在于統計,統計的目的是揭示歷史過往中的基本特征和基本規律,根本沒有通過數據來獲得價值的思維。大數據思維就是通過數據的導人、分析,挖掘出巨大的價值。這種思維是完全不同于傳統思維的全新思維。這種思維奠定了我們的學習創新(深度學習)、科技創新和管理創新。
二、大數據與公共管理的結合
公共管理的數據來自何處?弄清楚這個問題,首先要清楚數字和數據的區別,以及數據科學與管理科學是怎樣結合在一起的。不但數字與數據有巨大的差別,而且傳統數據與大數據也有本質的區別。一個數字只是一個符號,表現為一個數值或者是文本型數字,數字只是數據的一種形式。而數據則是一個很寬泛的概念,“只要是對客觀事物記錄下來的、可以鑒別的符號都可以稱之為數據,包括數字、文字、音頻、視頻等等”[9]。也就是說,數據是關于某個(些)方面的一組數字,表現形式就不只是數字,而是有更多的表現形式。數字毫無疑問是統計科學的基本素材,但統計主要是對結構化數據進行統計分析,對非結構化數據一般都不會納入傳統統計之內,而實際上,云技術普及應用之后,90%的數據是非結構性數據,而且是富含大量價值的數據。由此可見,數字和數據不但在形式上完全不一樣,而且在內容上也是大相徑庭的。在云技術出現之前,數據仍然主要表現為以結構性數據為主的傳統數據。這種數據雖然也會用于分析和研究,也表現為定量的微觀分析,但它所詮釋的仍然是一個問題的宏觀和整體的狀況,而且根據這種數據所進行的決策也仍然是宏觀決策。這主要是受制于傳統數據的采集方法、分類方法和采集標準。然而,云技術誕生以后,大數據的采集、分類、分析等方法和手段都徹底精細化,這樣大數據才能對所涉及的對象進行微觀性和個性化的分析。換言之,傳統的數據只能算是小數據,小數據揭示問題的宏觀現象,而大數據則可以揭示問題的內在本質。
大數據產生之后,數據科學迎來劃時代的變革,這種變革的大表現是數據科學與其他科學的內在結合,并形成基于大數據的新興科學。數據科學初與企業管理結合得緊,主要原因是:隨著社會化分工越來越細,企業生產的社會化程度也越來越高,因而企業的管理包括預測、決策等都越來越復雜,越來越依賴于完整的客觀數據。而基于云平臺和云計算的大數據可以為企業提供這種大數據服務。隨著數據科學的迅速發展,公共管理、社會管理等也都全面引入數據科學。尤其是在新世紀,各國在繼20世紀90年代推行的各行各業包括政府的“上網工程”之后,各國在新世紀又大力推行大數據戰略。所以,大數據已經全面介入公共管理、社會管理之中。在這種情形下,數據科學與管理科學的高度相符嵌入而實現管理實踐的巨大飛躍,尤其是使基于大數據之上的精細化管理和微觀管理成為現實。在繼西方各大國大數據戰略之后,中國政府也頒布相應的大數據戰略,制定“建立‘用數據說話、用數據決策、用數據管理、用數據創新’的管理機制,實現基于數據的科學決策,將推動政府管理理念和社會治理模式進步”的行動方案[10]。這也表明,大數據將在短期內成為公共管理等領域內的主要技術工具,也是提升政府治理能力的重要技術手段。
既然大數據全面嵌入公共管理,那么,公共管理所依賴的大數據又來自何處呢?眾所周知,公共管理的內容非常廣泛,公共管理以社會公共事務作為管理對象,而社會公共事務的具體內容分為公共資源、公共項目、社會問題等內容。因此,用于公共管理的大數據并不是單一性的,而是來自各個領域的大數據。幾十年互聯網的發展為數據積累提供了重要技術平臺,加之大數據搜索引擎的發展,使社會產生的所有數據都能夠獲得迅速且有效的收集和儲存。特別是世界各國的電子政務建設為公共管理積累了大量數字化的業務數據,既是政府大數據的重要來源,也是用于公共管理的大數據。這些數據主要來自以下四個方面: