I
農業大數據研究
分析報告
II
目錄 第一章大數據背景與動態 ................................................................ 3 1.1 大數據的宏觀價值與背景 ........................................................ 3 1.1.1 國家 ——保障數據安全,促進數據開放 ..................................... 3 1.1.2 政府 ——轉變理念,集成信息,抓住機遇 ................................... 5 1.1.3 學術 ——科學的研究數據,用數據來研究科學 ............................... 6 1.1.4 產業 ——產業需要變革,行業需要互融互通 ................................. 7 1.1.5 公司 ——平臺化競爭,特色應用化生存 ..................................... 8 1.1.6 投資 ——大數據將提供價值分析新視角 ..................................... 9 1.2 國內外大數據發展動態 ......................................................... 10 1.2.1 國外大數據發展動態 ..................................................... 10 1.2.2 我國大數據發展動態 ..................................................... 15 1.2.3 大數據相關社區 ......................................................... 18 1.2.4 我國大數據行業協會 ..................................................... 22 第二章農業大數據分析 ................................................................. 24 2.1 農業大數據應用現狀 ........................................................... 24 2.2 農業監控預警 ................................................................. 26 2.3 農業精準種植 ................................................................. 30 2.4 農業大數據發展趨勢 ........................................................... 34
3
第一章大數據背景與動態
1.1 大數據的宏觀價值與背景
從大歷史觀來看,“大數據”的內涵遠遠超越物聯網、云計算等信息技術的概念,它的意義可以比肩“活字印刷術”的發明,大范圍的消除信息不對稱的現象,釋放巨大的生產力,深刻改變社會的面貌,提升國家治理,革新科學研究的思想,促進產業間的跨界、融合和顛覆,并將極大的促進文明的傳播、凝聚、和升華。
數據自古存在。烏龜殼、樹皮、綢緞都曾經是記錄數據的媒介,現在都已經退出了舞臺;留聲機、磁帶機也曾經風靡一時,也已難覓蹤影;現在當紅的信息技術,像個人電腦、智能手機、 IPad 在不遠的將來也將被陳列在博物館。唯有數據,雖然不斷的變換表現形態,將一直伴隨人類走向未來。
物聯網本質上是器物層面的技術, 從大數據的視角而言, 是采集數據的終端。云計算本質上是IT
服務交付手段的變革,并由此引發一系列技術基礎架構的更新。物聯網和云計算都是信息技術發展的一定階段的自然延伸, 依然屬于信息技術范疇。而大數據可以看成是數據積累到一定規模后, 引發的質變。
大數據超越信息技術, 使人們重新界定國家競爭的主戰場, 重新審視政府治理水平, 重新認識科學研究的新范式, 重新審視產業變遷的驅動因素, 重新理解投資的決策依據, 重新思考公司的戰略和組織。
綜上所述,大數據將是保障國家安全、 社會治理和推動經濟發展的恒久主題!
1.1.1 國家——保障數據安全,促進數據開放
2012 年 3 月份,奧巴馬發布了美國版的 《大數據發展計劃》,通過這個計劃, 可以看出:
國家層面大數據技術領域的競爭事關一國的安全和未來。
國家數字主權體現為對數據的占有和控制。數字主權將是繼邊防、海防、空防之后,另一個
大國博弈的空間。大數據必須上升為國家意志,落實為國家戰略。歐盟、日本、
新加坡等國家已經開始紛紛行動。
4
2013 年,美國人斯諾登給世人揭開了 “數據戰爭” 的冰山一角, 美國的“棱鏡計劃”事實上把所有國家、個人都可以玩弄于股掌之上。連其多年的盟友,德國總理默克爾的手機,都在 NSA(美國國家安全局)的監控之下。面對默克爾的 憤怒的質問, 奧巴馬只能言辭閃爍的聲稱 “現在沒有監控, 未來也保證不會監控您的手機!” 人們把戰略核潛艇稱為“國之重器” ,的確,神出鬼沒的毀滅力量令人望之生畏。但是,如果導彈賴以導航的坐標數據被人為修改或者提前探知了呢?如果
不具備保護這些核心數據的能力, 恐怕就會應了那句老話, 搬起石頭砸自己的腳。
參與棱鏡計劃的公司包括谷歌、 雅虎、Facebook、微軟、蘋果、思科、Oracle 、 IBM等科技巨頭。
可以看到, 大數據時代, IT 產業強大與否已經直接決定一個大國是否成為強國的最為關鍵的因素。
沒有數據安全, 就不會有國家安全, 沒有強大的 IT 產業,就不會成為一流國家,也就談不上中國夢!
保護國家層面的數據安全,恰恰是以數據開放為基礎的。開放是一種態度,
更是一項能力。
一些重大基礎數據開放, 可以構成社會的數據基礎, 按照大數據定律之一“數據之和的價值遠遠大于數據價值的和” 來推斷, 來自不同領域的數據聚合在一起,開放給社會,將會產生類似核聚變一樣的價值發現效應。
現在,電子商務、社交網絡、基礎通信、國家各部委的數據,具備聚合的效
應和產生核聚變價值的基礎。
國家統計局聯合百度、 阿里巴巴, 已經做了一些探索性的嘗試,這是非常好的開端。與此同時, “數據割據、擁數自重”的現象也是普遍存在的。譬如氣象觀測數據,這類數據對于研究大氣變化、氣候演變、農
業指導等具備非常重要的科學意義。
但目前來看, 類似此類的數據應用范圍還有很大提升空間。再如住建部的購房數據, 這類數據對于防止腐敗、 研究經濟走勢、人口遷移, 甚至制定國家決策都具有至關重要的數據。
這類數據如果開放給社會各界,一定程度上會繁榮多學科、 跨領域交叉研究, 就此有可能會推動中國在各個方面的進步。
開放的數據是基礎,促使信息產業繁榮,才能誕生真正的數據驅動的企業,
企業反過來在數據領域的技術進步, 才是確保國家數據安全的長治久安之策。
很難想象, 如果沒有谷歌、 微軟、Facebook 這樣的公司, 單憑美國政府一己之力, 難以實施如此龐大的“棱鏡”計劃。所以制定國家大數據戰略,需要重新思考傳
5
統的所謂的“國家機密”和國家安全的關系。應當把消除部門數據割據,建立公開、透明、共享的數據公共平臺作為長期的戰略目標。
多年以后,回顧中國這段歷史,也許今天的一些舉措,將會是社會“數字文明”的起點。
1.1.2 政府——轉變理念,集成信息,抓住機遇
近年來,繼云計算、物聯網之后,又一股技術革命理念席卷而來
--- 大數據。海量、動態、多樣的數據,如何讓它具備“巨大價值”
,是這次被稱作“顛覆性技術革命” 的關鍵。傳統的思維方式和行為方式將面臨巨大挑戰, 尤其在公共服務領域,它有效集成信息資源的能力,將會為政府管理理念和治理模式的轉變,
提供強大的技術支撐。當前世界上越來越多的國家開始從戰略層面認識大數據,
在政府治理領域融入大數據思維和技術。
在此背景下, 我國政府也應順應時代發展趨勢,契合推進國家治理能力現代化的時代要求, 充分利用大數據提升國家治理能力。
大數據時代政府治理能力將面臨更多的機遇與挑戰!進入 21 世紀,世界上 越來越多的國家開始重視和推進大數據的發展。英國 2006 年啟動“數據權”運動,韓國 2011 年提出打造“首爾開放數據廣場” ,美國 2012 年啟動“大數據研究和發展計劃”,聯合國 2012 年推出“數據脈動”計劃,日本 2013 年正式公布以大數據為核心的新 IT
國家戰略。我國也已開始推動大數據發展,政府、企業和科研院所正在進行多方位布局。
對于政府治理而言, 大數據時代在帶來機遇的同時也充滿挑戰。
大數據為政府治理能力的提升帶來了發展機遇。
首先是為推動政府治理理念和模式的變化帶來機遇。在政府治理領域,通過讓海量、動態、多樣的數據有效
集成為有價值的信息資源, 推動政府轉變管理理念和治理模式, 進而加快治理體 系和治理能力現代化。
其次是為推動政府治理決策精細化和科學化帶來機遇。
在 大數據時代, 互聯網數據的價值隨著海量積累而產生質變, 能夠對經濟社會運行規律進行直觀呈現, 從而降低政府治理偏差概率, 提高政府治理的精細化和科學化。再次是為推動政府治理提高效率和節約成本帶來機遇。
利用大數據, 可以使政府治理所依據的數據資料更加全面, 不同部門和機構之間的協調更加順暢, 進
6
1 1 作者:西北大學經濟管理學院吳建樹 而有效提高工作效率,節約治理成本。
大數據對提升政府治理能力的重要性不言而喻, 但在實際工作中具體運用大數據卻任重而道遠。
現階段, 大數據在政府治理領域還未得到足夠重視。
我國政府部門目前幾乎沒有使用大數據技術, 很多政府部門并未對大數據提升業務能力 予以足夠重視, 大數據資源管理的思維尚未建立。
大數據在政府治理中的技術運用尚在探索。
隨著我國信息化技術應用不斷擴展, 國家及企業層面產生了巨量大數據,但總體集成、掌握、整合、分析這些數據需要成熟的技術投入,目前如何
利用大數據進行精細分析仍處于摸索階段。大數據本身的管理還需要綜合完善。
如何管理大數據,我國各部門還缺乏統一標準,各部門的數據來源、數據架構、 數據體系各自為政,不能有效整合,大大降低了數據的使用效率 。
1.1.3 學術——科學的研究數據,用數據來研究科學
學術界在大數據時代有了更為廣闊的舞臺。
某種程度而言, 近幾年計算機領域的發展是谷歌、 亞馬遜等一線的互聯網公司所推動的。
雖然學術界在算法方面具備無可替代的優勢,但在算法工程應用領域,由于缺乏實踐場景而裹足不前。
之所以呼吁學術界像谷歌公司學習, 正是看到了學術界不能再走一條從文獻到文獻的封閉道路。
在大數據時代,許多學科表面上研究的方向大不相同,但從數據的視角看, 其實是相通的。例如自然語言處理和生物大分子模型中都用到隱式馬氏過程和動 態規劃方法。
其最根本原因是它們處理的都是一維的隨機信號。
再如用于圖像處理的算法和用于壓縮感知的算法也有著許多共同之處。
以自然語言的機器翻譯研究為例。
最初科學家們試圖為計算機建立一系列的語法規則,按照語法、詞義,來翻譯成另外一門語言。該思路非常直觀,因為人 們就是如此理解學習語言的。
但在實踐中困難重重, 基于語法規則的翻譯器, 幾乎沒有商用過。而當科學家們改弦易張, 計算每一個詞, 每一句話的“合理概率” 時,復雜的機器翻譯就簡化成了文字的概率計算。通俗來講就是:
“如果大多數人都這么說,就認為是對的!
” 這種思想在越來越多的領域得到應用, 宏觀尺度研究的天體信息學、 社會行
7
為學、微觀尺度上分析人類的基金組, 追蹤物理學家們夢寐以求的 “上帝粒子”。隨著社會的數字化程度逐步加深,越來越來多的學科在數據層面趨于一致。
可以采用相似的思想來進行的統一的研究。
而這恰恰是數學家的特長。
因此數據科學在數學和實際應用之間建立起了一個直接的橋梁。
而這些實際應用正是來自于像信息服務等現代產業中最為活躍的一部分。
對數學來說, 這是一個千載難逢的機會。
通過建立大數據實驗室, 搭建產業界和學術界的橋梁, 為學術界優秀的算法 提供演練的舞臺, 為產業界困擾的難題提供破解的機會。
從而間接推動數據科學領域學科建設與人才培養的工作。
1.1.4 產業——產業需要變革,行業需要互融互通
產業需要變革,行業需要互通互融。所謂“大數據 +”,就是將大數據思維嫁接到不同的產業中,推動大數據在各行各業落地。
大數據不僅僅只關系到 IT 行業。眾多行業龍頭公司,都已經意識到了大數 據新思維的巨大沖擊。
給企業家們帶來沖擊的并不是大數據本身, 而是一些新興公司不可思議的跨界能力。
行業之間的界限變得越來越模糊, 這些新興公司所采用新的技術、新的模式,大規模采集數據,迅速形成預判,并迅速擴張到相關企
業行業。譬如樂視網,已經涉及電視銷售,電影拍攝;小米公司除手機銷售外, 也開始涉及電視銷售; 百度、360 等企業也都開始做各種硬件, 如百度影棒, 360 隨身 WiFi 等。
互聯網金融行業發展快速, 該行業對傳統金融行業造成的沖擊非常之大, 彷佛一夜之間就成了傳統金融業的公敵,阿里巴巴旗下的余額寶產品僅僅用了
5 個多月的時間,累積申購金額就超過了 1000 億元人民幣。事實上,目前互聯網 金融還是在發展的初級階段, 僅僅是把線上渠道對接了線下金融資源, 但就是這種“對接”行為,已經引發了行業性的“地震” 。下一步將是線上渠道向智慧方向演進,這個階段大數據才真正派上用場。正是:
“互聯網顛覆金融,大數據重構信用”!借此回顧阿里集團的戰略排序是:平臺、金融、數據。數據是在金融 之后的第三個發力點。
類似案例將在各行業輪番上演。
信息化程度越高的行業, 受大數據沖擊的可
8
2 能性越高,被顛覆的可能性越大。
所以,以大數據的視角來看, 任何產業中, 數據資產都將成為最核心的競爭
力!
傳統產業、各行各業, 都面臨在大數據和移動互聯網時代如何徹底轉型和再
造的問題。
產業整合, 將在大數據時代出現全新的整合邏輯和實現契機。
傳統產業、各行各業,都可能在大數據和移動互聯時代,重現生機、煥發青春。當然,
與此對應的是, 如果不能跟上這個時代步伐的企業和行業, 命運可能就將永久地走進過去,退出未來的舞臺。
1.1.5 公司——平臺化競爭,特色應用化生存
碎片還是平臺?這是一個問題!
諸如像小米公司和樂視網之間的競爭, 很可能會成為一種奠定產業格局的競爭,一旦格局奠定, 一些公司淪為炮灰或人家平臺上的碎片化應用的可能性就非常大了。至于這兩家公司是否可以最終勝出, 尚難下定論。
但是這兩家公司所代 表的商業模式,很可能造就出偉大的企業 。
未來,各行業只有兩類公司得以生存, 一類是平臺,一類就是有特色的應用。這種“星空格局”將呈現眾星拱月的景象。平臺的競爭可能更加殘酷,一個行業
甚至只可能存在唯一一個壓倒性的平臺; 應用的競爭同樣殘酷, 產業成熟周期將縮短到 1 年,決勝期短至 2 個月。
在星空格局之下,公司的競爭力更多的體現在“平臺 +特種部隊”的模式。就好比美軍前線的一個小分隊, 甚至單兵,可以直接指揮后方的導彈、 飛機一樣。以星空格局作為產業演化的最終形態, 以特種部隊作為業務競爭的基本單元, 那么公司的戰略、組織、文化等方面需要徹底的重組。
例如國內的某些公司,組織層級被高度壓縮為兩級,員工、合伙人。每個合
伙人管理一方面的事務,譬如營銷、采購、制造等等。但是合伙人直接管理許多
員工(團隊),完全顛覆了一般管理學上定義的, 管理跨度不要超過 7 人的界限。而另外有些公司 ,
直接向公司最高管理層匯報的團隊有多達數十個。在組織高度扁平化的公司里,企業文化必然有其獨到的地方,關鍵詞無外乎包括:
“專注、
2 上述兩家公司的商業模式稱為泛互聯范式,詳情可參考《大數據時代的歷史機遇》第七章
9
極致、口碑、快速、用戶體驗、全面體察等” 。
傳統公司的確需要重新審視自己的戰略,重構組織,再育文化。否則,勝利 的天平總是向這些類似泛互聯網范式的公司傾斜。
這也便是為什么要強調大數據思維的原因。
1.1.6 投資——大數據將提供價值分析新視角
由于各家公司的成立及上市時間不同,運營結構、體制機制也各具特色 , 如果單從某些指標著手 , 評價結果難免有失偏頗 , 導致投資價值評估不具備典型性 , 無法實現投資價值評估的目的 ,
也無法向投資者正確反饋上市公司投資價值高低的信息。
其中,“高科技”行業尤其難以研究。隔行如隔山,以軟件公司為例,雖然
都是軟件公司,但是他們服務的行業不同, 采用的技術不同, 產業成熟周期不同, 最為關鍵的是, 產業成熟周期有越來越短的趨勢。
但是一旦發現機會, 就驚世核俗,成為產業的新標桿。谷歌公司僅僅用了 15 年的時間,跨入了千億美元市值公司的行列;小米公司成立三年,估值已達到
100 億美元。如此高速的成長,在傳統行業幾乎是不可能發生的事情。
長期研究分析發現, 以 TM( T 電信、媒體、科技)為代表的高技術含量企業,
雖然發展迅速,機會眾多,但也隨時可能出現潛在的風險,基于此,許多基金經 理因看不懂看不準而從不涉足。
這的確是一個兩難的問題。
基金經理不了解, 資金就會投入的少,客觀上對行業發展不利。用所謂的
WACC方法評估 TMT公司價值,在當前來講已經不那么現實了。
雖然大數據的起源要歸功于互聯網與電子商務, 但大數據最大的應用前景卻在傳統產業。
一是因為幾乎所有傳統產業都在互聯網化, 二是因為傳統產業仍然占據了國家 GDP 的絕大部分份額。隨著數據逐漸成為企業的一種資產,對大量消費者提供產品或服務的企業、 做小而美模式的中長尾企業、 面臨互聯網壓力之下急需轉型的傳統企業, 這三類企業的投資價值與市場發展前景愈發顯得難以看透。
針對這種情況, 有沒有一個簡單明了的邏輯, 可以幫助投資人發現公司的潛 在價值呢?答案是肯定的!
大數據將提供分析公司價值的新視角。
所謂公司的價
10
3 值與其擁有的數據資產的規模和活性成正比, 與其解釋、運用數據的能力成正比。這里提出數據資產的概念, 并強調數據資產的兩個屬性規模、 活性。事實上 書中提出數據資產評估模型, 從五個維度來評估數據資產的商業價值。
規模和活
性僅僅其中的兩個 。
利用數據資產評估商業價值的這種思想, 獲得了越來越多的投資人認可。
大數據已經成為基金經理切入企業發展前景與價值評估的絕好視角和新型工具。
產業界和資本市場溝通的 “紐帶” 在大數據時代將顯得越來越重要。
需要讓 越來越多的投資人理解大數據, 洞察行業發展趨勢, 幫助產業界更好地開拓產融結合的路子。
綜上所述, 不能狹隘的看待大數據, 不能把它當數據挖掘的工具, 不能唯技術論,更不能一概斥之為炒作。從大歷史觀來看, “大數據”的內涵遠遠超越物聯網、云計算等信息技術的概念,它的意義可以比肩“活字印刷術”的發明,在
世界尺度上大范圍的消除信息不對稱的現象, 釋放巨大的生產力, 深刻改變社會的面貌,革新科學研究的思想,促進產業間的跨界、融合和顛覆,并將極大的促
進文明的傳播、凝聚、和升華。
1.2 國內外大數據發展動態
1.2.1 國外大數據發展動態
國際戰略動態 總管世界各國的大數據策略可以發現存在著一下三個共同點:一是推動大數
據全產業鏈的應用; 二是數據開放與信息安全并重; 三是政府與社會力量共同推動大數據應用。
美國 美國從 2009 年至今全面開放了 40 萬聯邦政府原始數據集。日前 Data.gov (美國政府數據庫)宣布采用新“開源政府平臺”管理數據,代碼將向各國開發者開放。奧巴馬政府將“大數據戰略”上升為最高國策,認為大數據是“未來的新石油”,將對數據的占有和控制作為陸權、海權、空權之外的另一種國家核心
3 引自《大數據時代的歷史機遇》第三章趙國棟
11
能力。首批共有 6 個聯邦部門宣布投資 2 億美元,共同提高收集、儲存、保留、管理、分析和共享海量數據所需核心技術的先進性, 并形成合力; 對信息技術研發投入推動超級計算和互聯網的發展。
目前,已有美國大學專門開設了研究大數據技術的課程, 培養下一代的 “數 據科學家” ,一些美國公司也在向大學提供教育研究資助, 并贊助與大數據有關的比賽, 擴大大數據技術開發和應用所需人才的供給, 提高美國的科學發展、 環境與生物醫藥研究、 教育和國家安全的能力; 美國國家衛生研究院開展的免費開放國際千人基因組計劃, 它將創建的人類遺傳變異研究數據集, 供研究人員自由訪問和使用;美國國家科學基金會和美國國家衛生研究院對大數據進行聯合招標, 改進核心科學與技術手段,
提高從各種大型數據集中提取重要信息并對其進行有效管理、分析和可視化的能力; 美國國防部則計劃每年投資
2.5 億美元左右, 在各個軍事部門開展一系列研究計劃, 以創新方式使用海量數據,
通過感知、 認知和決策支持的結合,加強大數據決策能力;美國能源部則將斥資
2500 萬美元建立可擴展數據管理與可視化研究所(
SDAV),幫助科學家對數據進行有效管理,促進其生物和環境研究計劃、美國核數據計劃等的研究成果。
此外,美國紐約州能源研究和發展管理局運用一系列的大數據技術來評估氣 候變化對紐約州的影響, 并為農業、 公共衛生、 能源和交通運輸等領域提供應對 氣候變化的策略。這一應用也被引入美國疾病控制中心,它正與美國其他 10 個州和城市一起開展“閱讀州和城市計劃”,共同研究和應對氣候變化,而大數據 技術是其中一個非常重要的組成部分。
英國 2011 年 11 月,英國政府發布了對公開數據進行研究的戰略政策,英國內閣部長弗朗西斯·莫德說,其實英國政府早有意帶頭建立“英國數據銀行”,政府 想算清楚究竟這個國家或政府創造了什么; 英國不只是要成為世界首個完全公布政府數據的國家, 還應該成為一個國際榜樣, 去探索那些公開數據在商業創新和刺激經濟增長方面的潛力。
2013 年 1 月,英國商業、創新和技能部宣布,將注資 6 億英鎊發展 8 類高 新技術,大數據獨攬其中的 1.89 億英鎊,將近三成。
2013 年 8 月 12 日,英國政府發布《英國農業技術戰略》。該戰略指出,英國今后對農業技術的投資將集
中在大數據上,目標是將英國的農業科技商業化。
12
2013 年英國首個綜合運用大數據技術的醫藥衛生科研中心在牛津大學成立, 這個研究中心總投資達 9000 萬英鎊,可容納 600 名科研人員。中心通過搜集、存儲和分析大量醫療信息, 確定新藥物的研發方向, 減少藥物開發成本, 同時為發現新的治療手段提供線索。同時,以英國為首的歐洲核子中心( CERN )將在匈牙利科學院魏格納物理學研究中心建設一座超寬帶數據中心。
建成后,魏格納數據中心將成為連接 CERN且具有歐洲最大傳輸能力的數據處理中心,未來該設施
在處理大型強子對撞機(
LHC)的數據以及實驗方面發揮重要作用。
日本 日本面臨著由于長期經濟低迷導致國際地位下降、 人口老齡化以及日益增大的社會保險費用和社會基礎設施老化等諸多問題。
為了扭轉這一現狀, 日本政府決定通過大力發展 IT
產業,特別是大數據及開發數據和云計算,以發展開放公共數據和大數據為核心的日本新 IT
國家戰略,要把日本建設成為一個具有“世界最高水準的廣泛運用信息產業技術的社會” ,并且將其發展成就擴展到國際范圍內。
加拿大 隨著大數據在全球范圍內繼續火熱,
加拿大的大數據產業也在慢慢升溫。
例如,在科研領域, 加拿大政府科學、 技術與創新委員會已要求科研組織就與加拿大經濟發展和社會福利密切相關的問題, 為加拿大政府提出基于證據的科技建議。
2007 年,加拿大開始實施數字信息戰略。
2011 年 5 月加拿大廣播電視和電信委員會( CRTC)就發布了新的“國家寬帶計劃”,該計劃顯示,到 2015 年加拿大全體國民將享有 5Mbps的寬帶接入速度。
2012 年 9 月 IBM正式啟動在加拿大國內興建智能數據中心,該中心全稱為 IBM加拿大領導數據中心( IBM Canada Leadership Data Centre )。
法國 雖然法國在數學和統計學領域具有獨一無二的優勢, 但法國的大數據產業發展情況遠不如美國、 英國等國家發展的火熱。
但近年來, 法國在智慧城市建設方面卻投入了大量精力, 包括法國電信、 施耐德集團和達索集團等諸多法國知名企業都在旗下設立了專門從事智慧城市設計和研發的工作室或實驗室, 在政府引導下積極投身智慧城市建設。
2013 年 2 月,法國政府發布《數字化路線圖》,列 出 5 項將會大力支持的戰略性高新技術,其中一項就是大數據。
2013 年 3 月,
13
法國國家教育部推出了四項數字化服務。
2013 年 4 月,法國經濟、財政和工業部宣布,將投入 1150 萬歐元用于支持 7 個未來投資項目,目的在于“通過發展創新性解決方案,并將其用于實踐,來促進法國在大數據領域的發展。” 德國 德國 IT 行業協會 BITKOM日前發表報告稱,大數據業務在德國發展迅速, 2014年有望增長 59%,營業額達 61 億歐元,到 2016 年有望再翻一番達到 136 億歐元。同時因為嚴謹的名族習慣, 德國在數據保護方面做的非常出色, 據了解, 德國在保護個人信息方面的立法已有幾十年歷史, 現在的相關法律對互聯網等領域中個 人數據的使用都做出了明確規定, 還提出設立專職信息保護人員的建議, 較好地維護了德國社會的信息安全。
澳大利亞 澳洲政府關于數據制定了一系列政策措施, 其中包括澳洲公共服務大數據戰略等, 2013 年更是出臺了開放公共部門信息原則( Open PSI),全文提出八條開放數據策略以及實施的難易程度,并提出了需開放數據的首要領域。
印度 印度聯邦內閣批準了國家數據共享和開放政策。
在數據開放方面, 印度效仿美國政府的做法,制定了一個一站式政府數據門戶網站
data.gov.in
,把政府收集的所有非涉密數據集中起來,包括全國的人口、經濟和社會信息。
國際業界動態 互聯網、金融、電信、醫療、政府等是大數據運營的重點領域。而大多數領 域的大數據發展應用仍處在初級階段, 在大數據應用的實踐過程中也遇到了數據資產不明、應用需求不定、平臺建設、技術路線、安全隱私問題等方面的挑戰,
但是,各領域在大數據應用方面還是做出了一些有益的探索, 并取得了一定的成績。
在電信行業,一些發達國家電信運營商一方面提升服務質量, 改善內部管理。包括客戶維系、精準營銷和網絡運營與管理, 這三點的代表企業分別為法國電信、英國 O2、NTTDoCoM和o 沃達豐。法國電信開展針對用戶消費的大數據分析評估, 借助大數據改善服務水平, 提升用戶體驗。英國 O2在英國推出了免費 WiFi 服務, 以積累更多的用戶, 從而收集到更多的用戶數據, 用在精準的媒體廣告和營銷服 務方面。
NTTDoCoM通o 過制作精細化表格,收集用戶詳細信息,大大加強了 CRM
14
系統和知識庫, 準確定位目標客戶, 提高了業務辦理的成功性。
沃達豐愛爾蘭公司的 Tellabs “洞察力分析” 服務是將通信網絡中的大數據轉化為可利用的情報。
另一方面確立商業模式, 創造外部收益。
包括直接出售數據獲取收益和與第三方公司合作項目給運營商創造盈利,代表企業有
AT&T、西班牙電信、DynamicInsights 、Verizon 、德國電信和沃達豐。
AT&T 將與用戶相關的數據出售給政府和企業以獲利。
西班牙電信成立了動態洞察部門
DynamicInsights 開展大數據業務,為客戶提供數據分析打包服務。
DynamicInsights
與市場研究機構Gfk 進行合作,在英國、巴西推出了首款產品名為智慧足跡
(SmartSteps) 。Verizon 成立了精準營銷部門 PrecisionMarketingDivisio
,提供了精準營銷洞察、精準營銷、 移動商務等服務, 包括聯合第三方機構對其用戶群進行大數據分析,再將有價值的信息提供給政府或企業獲取額外價值, 數據業務的盈利在其整個業務中占比非常高。德國電信和沃達豐主要嘗試通過開放
API,向數據挖掘公司等合作方提供部分用戶匿名地理位置數據, 以掌握人群出行規律, 有效地與一些 LBS應用服務對接。
在連鎖零售業中,英國最大的連鎖超市特易購( TESC)
O 已經開始運用大數 據技術采集并分析其客戶行為信息數據集。
特易購首先在大數據系統內給每個顧客確定一個編號, 然后通過顧客的刷卡消費、 填寫調查問卷、 打客服電話等行為采集他們的相關數據, 再用計算機系統建立特定模型, 對每個顧客的海量數據進行分析, 得出特定顧客的消費習慣、
近期可能的消費需求等結論, 以此來制定有針對性的促銷計劃并調整商品價格。
這種有的放矢的營銷和定價模式為特易購提供了更加高效的盈利方法。
在交通運輸方面,美國 Inrix 公司和新澤西州運輸部之間的合作伙伴關系。
Inrix 公司通過汽車和移動電話
GPS裝置上的信號和數據, 采集主干道上的車速數據,然后實時向新澤西州運輸部警示任意主干道上的路況險情,
同時向司機的車載 GPS裝置或移動電話發送警示來提醒司機注意路況險情。
在農業方面,美國氣候公司 (The Climate Corporation) 是一家天氣保險公 司,他們制作保單來彌補聯邦農作物保險和因氣候造成的農民損失之間的差額。
該公司通過龐大的傳感器網絡分析和預測 2000 萬美國農田的氣溫、降水、土壤濕度和產量。
在知曉高溫天的天數以及土壤濕度數據后, 建立的模型來幫助其預判農民需要的天氣保險金額以及公司需要支付的保費。
15
在外包領域,大數據技術也已成為信息技術行業的 “下一個大事件” 。目前, 一些外包行業巨頭也開始進軍大數據市場, 試想瓜分這一塊大蛋糕。
印度全國軟件與服務企業協會預計,印度大數據行業規模在 3 年內將達到 12 億美元,是目 前規模的 6 倍,同時還是全球大數據行業平均增長速度的兩倍。
在信息安全行業, FireEye 和 Splunk 這類國際企業在大數據安全方面發展迅速,他們在大數據安全方面的技術也值得國內安企業借鑒。專做 DLP 產品的Websense公司,他們基于數據流的分析技術十分有利于大數據的分析、挖掘。
1.2.2 我國大數據發展動態
我國政府促進大數據發展的措施 2012 年 8
月份國務院制定了促進信息消費擴大內需的文件,推動商業企業加快信息基礎設施演進升級, 增強信息產品供給能力, 形成行業聯盟, 制定行業標準,構建大數據產業鏈,促進創新鏈與產業鏈有效嫁接。同時,構建大數據研
究平臺,整合創新資源,實施“專項計劃”,突破關鍵技術。廣東率先啟動大數
據戰略推動政府轉型, 北京正積極探索政府公布大數據供社會開發, 上海也啟動大數據研發三年行動計劃。
工業和信息化部為鼓勵和推進大數據產業發展也制定了三大措施。
一是已通過促進信息消費擴大內需的意見、 軟件和信息技術服務業 “十二五” 規劃等政策規劃中,對大數據發展進行了部署。
二是推動全國信息技術標準化技術委員會開展了大數據標準化的需求分析、 標準體系框架研究及相關標準研制工作,
并向相關國際標準化組織提交了大數據研究提案。
三是利用項目資金等手段進行了前沿部署,支持了關鍵技術產品的研發和產業化。
這是工信部對大數據所做的一些安排。
在政府部門數據對外開放, 由企業系統分析大數據進行投資經營方面, 上海 無疑是先行一步。
2014 年 5 月 15 日,上海市自今年起推動各級政府部門將數據 對外開放,并鼓勵社會對其進行加工和運用。根據上海市經信委印發的《 2014 年度上海市政府數據資源向社會開放工作計劃》 ,目前已確定 190 項數據內容作為 2014 年重點開放領域,涵蓋 28 個市級部門,涉及公共安全、公共服務、交通服務、教育科技、產業發展、金融服務、能源環境、健康衛生、文化娛樂等 11
16
個領域。其中市場監管類數據和交通數據資源的開放將成為重點, 這些與市民息息相關的信息查詢屆時將完全開放。
這意味著企業運用大數據在上海 “掘金” 的時代來臨,企業投資和上海民生相關的產業如交通運輸、餐飲等,可以不再“盲 人摸象”。
為推動數字福建(長樂)產業園、中國國際信息技術(福建)產業園加快建
設成為全省大數據產業重點園區和 “數字福建” 建設的重要承載基地, 福建省政府將從完善園區發展規劃、 引進培育產業龍頭、 推動資源匯聚開發、 建設大數據創新平臺、加強人才引進培養、做好園區用地保障、確保園區用電需求、強化園
區網絡支撐、實施財稅優惠政策、提高安全保障能力等 10 個方面給予支持。在引進培育產業龍頭方面,福建省將通過市場開放、資源開發、技術采購、服務外
包等方式,大力引進大企業、大行業、大平臺,吸引國家部委、央企、電信運營
商、金融機構、知名IT
企業、互聯網公司等入園建設新一代信息技術設計、研發、生產基地, 發展一批行業性大數據云平臺; 吸引大數據產業鏈各個業務環節龍頭企業入園,培育一批細分領域全國性領先的大數據服務提供商。
我國大數據企業發展情況 中國移動提出了大數據時代全新的移動互聯網戰略, 即:構筑“智能管道”、搭建“開放平臺”、打造“特色業務”與提供“友好界面”。這 16 字方針,體 現了中國移動在移動互聯時代全面開啟之際的全新戰略定位。中國移動在 2014 年成立了蘇州研發中心, 計劃構建 3000-4000 人的研發團隊和運營團隊, 宗旨就是要進一步完善云計算和大數據產品體系, 盡快形成國際一流的云計算和大數據服務能力。中國移動構建了大云產業聯盟,與技術提供商、集成商、高等院校、
政府機構等超過 50
家單位,在核心模塊合作、授權技術服務、應用開發技術攻關等產業不同層面開展了合作。
百度、阿里、騰訊、 360 等互聯網企業依靠自身的數據優勢,均已將大數據 作為公司的重要戰略。
大數據正在從理論走向實踐, 從專業領域走向全民應用的階段。
百度在大數據方面讓人印象深刻的有百度遷徙這樣的公益項目, 應用在民生和新聞等領域。最新動態是,百度網盟利用基于大數據的
CTR(廣告內容匹配)數據,站長的平均收入提升 70%。
17
大數據是繼云計算、 物聯網、移動互聯網之后的又一個具有國家戰略意義的 新興產業, 正在成為業界概念炒作的焦點。
現今, 大數據已經滲透到每一個行業 和業務職能領域,逐漸成為重要的生產因素,據預測,到 2020 年中國數據產業 市場將達到 2 萬億以上規模。但任何一個技術概念都需要“落地”,先進技術只 有與產業集合, 并切實推進經濟的發展, 才能成為真正的生產力。
只有實現真正 的產業落地, 才能真正推動經濟的發展, 康發展的快車道。
中國大數據產業才能擠掉泡沫, 駛入健 產業園區作為產業集群的重要載體和組成部分, 其經濟效應已引起越來越多 人關注。產業園區能夠有效地創造聚集力,通過共享資源、克服外部負效應,帶 動關聯產業的發展, 從而有效地推動產業集群的形成。
大數據產業園作為大數據 產業的聚集區或大數據技術的產業化項目孵化區, 是大數據企業走向產業化道路 阿里則對外宣稱已經擁有 100PB數據并以令人欣喜的速度增長, 馬云最新的內部郵件將阿里戰略闡述為云端+大數據,阿里要進入數據時代。
2014 年 10 月14 日,阿里巴巴集團宣布無線開放戰略,啟動百川計劃。將全面分享阿里無線 資源,為移動開發者提供技術、數據、商業等全鏈條基礎設施服務。百川計劃作 為阿里無線開發的重要平臺產生, 并將從技術、 數據和電商能力上, 面向移動開發者提供基礎服務。其中,云技術層面將提供架構搭建、數據存儲、安全防護等
服務,并可有專業人員對 APP進行一對一的開發、維護、技術支持;大數據層面則將聯合移動應用統計分析平臺友盟, 幫助開發者完善數據精準挖掘分析及完善個性化推送體系。
2014 年 10 月 10 日,360 舉辦首屆數字世界大會, 并發布三個產品, 幫助廣 告商利用大數據做更有效的營銷。
360 宣稱今后將推出的實效平臺、聚效平臺和來 通等三款產品,就是把集合了數十億用戶信息的數據,免費分享給廣告主。
京東在無線領域也正進行著深層次的探索。
首先是充分利用移動設備去拓展 人性化功能,例如多模式交互,通過京東 APP,用戶可以通過移動設備的攝像頭拍照、掃碼進行購物;另外,京東移動端還在積極通過大數據技術挖掘用戶需求, 提供更精準的服務。
在能夠帶來巨大流量的微信方面, 舉行京東微信購物的眾籌活動,一個月參與的人數達到了 40 萬人次。
我國推動大數據產業園區發展
18
的集中區域。
大數據產業園區可以通過自身的規模、 品牌、資源等價值為區域經濟發展和企業資本擴張起到巨大的推動作用。主要體現在:
?。?)
?。?/p>
提升企業效益 : 大數據產業園的建立會迅速聚集大數據企業發展所需要的 多種資源, 可以吸引眾多互補型企業、 產業鏈上下游企業等, 為企業提供了一個良好的發展空間,是企業騰飛的重要平臺。
?。?)
?。?/p>
提升地區品牌 : 大數據產業園的建立必將帶來大量高科技企業的入駐, 這 必將帶動地區經濟的快速發展,為區域經濟建設提供高效助推器。另外, 隨著國家對大數據等新興技術產業的重視, 建立大數據產業園的地區將領先于國家的發展規劃之前, 提升本地區的知名度, 并且可以借此吸引更多高新技術企業的投資。
?。?)
?。?/p>
創造社會價值 : 大數據產業園區,由于建設規模較大,涉及投資建設金額 巨大,建成后,在年產值、稅收等方面貢獻巨大,并可直接解決部分當地
失業人員的就業問題。除此之外,園區的生產生活配套設施,如住宿、餐
飲、商業區等, 不僅可以滿足園區內工作人員的個人需求問題, 還可以為地區和其他服務型企業帶來巨大的經濟利益。
大數據產業園在為自己創造經濟效益的同時,也獲得了社會效益的大豐收。
總之,通過建立大數據產業園, 能夠更有效地組織和使用大數據, 人類也將得到更多的機會發揮科學技術對社會發展的巨大推動作用。
國內外大數據發展對比分析 我國大數據產業起步較晚,同時由于互聯網技術也有所滯后,使得我國的大
數據發展較領先國家還尚有一段距離。
同時,我國又有得天獨厚的優勢——龐大的用戶群,每日有龐大的數據量不斷生成,同時,受惠用戶量也極為眾多。從政
策環境上看, 我國尚未出臺完善的信息數據相關的法律法規, 對隱私的方面的問題沒有明確可執行的規章制度。在政府數據開放方面也亟需進一步加強。
1.2.3 大數據相關社區
2014
年已經迎來了大數據發展的黃金成長期,大數據以“降低信息不對稱和提高決策有效性”為目標,幾乎能應用于包括金融、互聯網、醫學、生物、教
育在內的所有行業。
然而隨著數據量不斷的劇增, 各個國家、 各組織被迫尋找創
19
新性的方法來管理、 控制并分析利用這些巨量的數據。
但是, 數據孤島現象卻制約著大數據的發展, 各個組織之間的數據封閉, 甚至同一個組織之間各個部門之間的數據也不開放, 這些嚴重制約著大數據的發展。
因此數據開放和共享成為大數據的核心和關鍵。
為了推動數據開放和共享, 世界各國都在不斷尋找新的突破口以推動大數據開放和共享。
世界大數據相關社區 美國在 2009 年設立“ data.gov ”門戶網站,將政府和主要州、城市等持有 的公共數據對外公開。
2014 年 1 月美國的數據每戶( data.gov )全面改版,截至到 2014 年 2 月 10 日,網站共開放了 88137 個數據集、 349 個應用程序、 140 個移動應用、參與的部門達到 175 個;同時還有 40 個州、44 個縣市建立了單獨的數據門戶。
英國在 2010 年開設的數據開放門戶網站 (data.gov.uk )上,政府規定各部委需公開重要公共數據, 政府財政支出、 犯罪高發區域、 市政工程施工等與市民生活密切相關的信息需優先公開共開放了
13670 個公開的數據集以及 4170 個非公開的數據集。此外倫敦、曼徹斯特等地以及索爾福德市議會等
16 個地方和部門還建立了獨立的開放數據門戶。
2011 年歐盟設立公共數據網站,提出了《歐盟開放數據戰略》。
新加坡的數據開放網站( data.gov.sg )實現了全國范圍內的數據整合,是世界上發展最為完善的公共信息資源開放共享網站之一,目前已經匯集了來自
68 個政府部門和機構的 8600 多個數據集。這些數據可以為企業和個人訪問,發現機遇為這些人提供服務。
印度政府建立一站式官方數據門戶網站, 使其成為政府收集的所有數據的總 網站。該網站可以把政府收集的所有非涉密數據集中在一起,包括全國的人口、經濟和社會信息。
2011 年 9 月 20 日,開放政府合作伙伴( OGP ,OpenGovernment Partnership )成立,該組織由巴西、印度尼西亞、墨西哥、挪威、菲律賓、南非、英國、美國 等八個國家聯合簽署《開放數據聲明》。截至 2014 年 2 月 10 日,全球已有 63 個國家加入開放政府合作伙伴。
除政府部門外,民間團體也在積極推進公共數據的靈活利用。
2012 年 7 月日本非盈利性機構 Open Knowledge Foundation
?。∣KF)誕生,旨在促進公共數
20
據的有效利用,其開發的開源軟件 CKAN對于構筑地方政府的公共數據門戶網站起到重要支撐作用。
中國大數據相關社區 中國政府同樣也在做著開放、 共享數據的努力, 建立了類似英美政府的國家數據公開網站——國家數據網(
data.stats.gov.cn
?。?。我國各地也開始了公共信息資源的開放共享,北京、上海等地數據開放網站相繼投入運行。
北京市政務數據資源網通過原始數據( WPS 、CSV)下載、帶有地理坐標信息的空間數據( SHAP)
E 下載和在線調用 API 三種形式提供數據開放共享服務。開發者、分析研究人員、 普通用戶通過互聯網登錄該網站可查詢、 下載數據以及在線調用 API 開發服務。該網站已經整合了北京市 35 個政府部門的信息,為社會提供了土地使用、教育、旅游、交通、文化、醫療等 269 類、多達 36 萬條的原始數據資源。
上海市政府召開推進政府數據資源向社會開放工作會議, 要求在此前包括市公安局、市工商局、 市統計局、 市商務委員會等 9 家試點政府部門公開信息資源的基礎上,所有政府部門在 2014 年內通過“上海政府數據服務網”向公眾提供數據產品瀏覽、查詢和下載等服務,具體涵蓋公共安全、公共服務、交通服務、
教育科技、產業發展、金融服務、能源環境、 健康衛生、文化娛樂等 11 個領域。
中國香港均依托原有網站, 通過進一步增強網站服務功能或者增設網站欄目的辦法,實現政府數據的開放。
中國社會團體也紛紛自發成立數據共享中心, 以期借助大數據技術尋求新的 商機。其中有以推動數據開放為目的的數據開放平臺; 也有為推動大數據技術進步而成立的大數據技術社區; 也有為推動大數據的商業化應用而成立的大數據平臺。
?。?)
?。祿_放社區 百度數據開放平臺 ,是以百度框計算先進技術理念為基礎, 連接站長優質數據和百度搜索結果的開放平臺。
站長通過結構化優質數據, 獲得百度搜索結果頁“即搜即得”的搜索展現。
全國可信網站數據庫開放平臺 ,是在國家主管部門的親切關懷和指導下, 由 中網依托“可信網站” 驗證數據庫為基礎搭建的全國最大的可信網站數據庫開放平臺。該平臺收錄對象先由網站自行申請或公眾推薦(含合作伙伴等),然后由
21
4 http://openresearch.baidu.com/?locale=zh_CN 5 http://www.dataguru.cn/ 中網按照“可信網站” 驗證審核規則或流程對商家或網站的身份信息完成交互審核后予以收錄。該平臺將面向瀏覽器、搜索引擎、電子商務平臺、微博等諸多領 域實現免費開放, 幫助各大互聯網平臺快速、 高效的實現平臺上各類商家、 網站的真實身份驗證, 形成無所不在的商家、 網站身份驗證查詢途徑, 方便網民按照上網習慣快速便捷的甄別網站真偽,識破網絡釣魚騙局。
百度開放研究社區 4 提供了 100G的百度真實的數據集以及由 250 臺服務器組 成的開放研究云平臺, 并利用網絡社區沒有地域限制、 自由、靈活、快捷等特點, 為科研人員提供一個互動交流的平臺, 讓技術溝通和海量的數據分析變得簡潔而高效。
開放爬蟲系統 主要面向高校和科研單位的大數據研究團隊, 提供個性化、 定 制的互聯網數據獲...