變現。數據,終將成為企業的核心資產。但是要落實以數據為核心的改變、讓數據發揮策略性的價值,在實際運作上還有許多環節要打通。
企業建立以數據驅動為核心的智慧商業模式,包括:如何從工作流中尋找數據化的切入點、如何設定數據收集策略與數據流通策略,已成為重要致勝關鍵。
數據像電力一樣不可或缺
而隨著計算與儲存能力的增強,數據資源的供應將如同電力一樣不可或缺,為企業提供源源不斷的優化能力。既然是核心資源,數據資產的營運就變得日益重要,對建立在數據基礎上的互聯網公司來說更是如此。盤點這些資源並不簡單,我在阿里工作時共做過三次,並歸納了一些經驗:
1. 什麼樣的數據用量大、覆蓋率高?—具公共屬性的數據。
2. 什麼樣的數據稀缺、但重要?—具戰略性的數據。
3. 重要數據不可再生,因此必須備份的數據。
4. 數據資源用完可以再用,因為複製成本極低。
5. 大數據的關聯特性,使得數據權屬的邊界變得越來越模糊。
幾次的資產盤點讓我認識到,數據的盤點與實物不一樣,數據可以無限衍生,而且,多並不代表有用。
對傳統產業來說,擁有數據資源,將使企業擁有創新的可能性,並降低被淘汰的可能性,可以更好地適應高速變化的市場環境和用戶需求,從而更具競爭力。可惜的是,傳統產業往往在資訊化和數位化建設方面存在缺失,彌補短處是當務之急,當然,這急切性往往與公司的經營方向相關。
無論是新興產業還是傳統產業,選擇人工智慧與大數據的切入點,場景尤為重要。在執行智慧專案時,必須考慮數據是否足以成為解決問題的要素,同時,場景的業務邏輯穩定性相當重要。
數據讓企業實現商業價值
數據作為資產,能夠幫助企業更有效地進攻及防守。有效地創建、生產智慧工具及產品,強化顧客關係,預測顧客的消費習慣趨勢及流失,靠近並滿足消費者的需求。用大數據做行銷,已經是許多企業的常規性行銷手段,也就是利用數據加強對顧客的獲取、活躍、保留等服務能力。
在互聯網領域,數據的規模、活躍程度以及收集、運用數據的能力,已經成為企業的核心競爭力之一。要深入洞悉市場、快速精準地找出應對策略時,數據已經成為企業實現更大商業價值的最強驅動力。當然,數據作為一種企業資產,需要與其他資產,如人力資源、硬體等相互組合,才能發揮出最大的價值。
大數據是來自多源異構的資料,「亂」是其特性,為避免出現無用輸入、無用輸出(garbage in, garbage out)的問題,在使用數據之前,需要對數據資產進行加工,從而帶來了「數據治理」這一重要課題。
大量、來源廣泛的數據,看起來往往是一團亂麻,我還記得,2013年時,我當時的老闆淘寶網總裁三豐就跟我說過:「我們不能總坐金山吃饅頭。」企業採集和儲存PB(千兆位元組)級別數據的成本卻是分文不少,而且有越演越烈的趨勢。一方面要治理數據資產,同時也要證明數據有大價值。
今天,數據的價值其實已無須再多言。開發AlphaGo而一舉成名的DeepMind團隊,被收購後,成功地幫助Google數據中心的冷卻系統節約用電40%,未來幾年還將會幫助Google省下數億美元支出,而據說,該專案僅有五、六個團隊成員。
難怪《人類大命運》(Homo Deus)的作者哈拉瑞(Yuval Noah Harari)認為,我們將會進入一個無機智慧(inorganic intelligence)的世界,未來,我們可能受演算法主宰。當機器具備深度學習的能力之後,人工智慧的定義有可能被改寫,人類的感知和普世價值也會改變,商業元素也將會發生巨變。就如我在《大數據的關鍵思考》一書中所說:未來,人與人之間的差別,拚的是他可使用的數據量和演算法。
企業「養」數據的六大要點
人工智慧因大數據而重生,但制約人工智慧在各領域實現更廣泛應用的,並不是演算法不夠先進,而是缺乏高品質的數據。若想開發最先進的機器學習技術,能否獲得高品質的訓練數據極為關鍵,如何啟動是大部分企業的一個難題。
對於從事機器學習研究的初創公司來說,起步時數據十分有限,難以建立起高品質的大數據資源。甚至有些企業在聘請數據科學團隊、購置昂貴的設備之後,才知道還未制訂「養數據」的策略。
數據來源的選擇必定與商業模式相關,我的經驗是,從小問題入手,弄清楚問題的本質,往往是選擇數據和演算法的前提。每家公司的數據獲取策略不盡相同,但回想這麼多年我在阿里也算面對了不少類似的困難,拋磚引玉與大家分享幾點:
1. 要從零開始創建好的專有數據集。
幾乎永遠意味著,要預先投入大量人力收集數據。但更痛苦的是,在業務變化的同時,數據結構也需要時時更新,正如前輩所說:「數據集成的同時已經在斷裂。」
2. 即使表面上擁有很多數據,但在運用機器學習時,仍會發現數據量不足。
你需要的數據量與你試圖解決的問題緊密相關。
3. 數據的收集、處理、運用,短期來說肯定是越貼近業務越有效率。
從長遠看並不利於數據的標準化及重複使用,將導致開發週期變得漫長。我的經驗是,起點可以從最小化應用做閉環,基於眾多應用做長線規畫。
4. 確保早期創造的應用有足夠的吸引力,讓業務方及使用者甘願交出他們的數據。
讓大數據落地,除了關乎技術問題,亦繫於業務方及個人的意願是否足夠,只有互利互惠,才有長久合作。
5. 在大範圍使用大數據之前,必須嚴肅地面對數據的標準和品質問題,否則後果堪憂。
數據驅動型企業必須明白,數據品質是全部員工的責任,並不僅僅是技術問題。
6. 大數據安全是一個命門,數據越多,責任越大。
有時候會超出你的想像,原以為很安全的數據,拼合其他數據之後,可能成為機密級別。
我曾經對朋友說,我在阿里的數據治理過程可謂九死一生,很多人聽了不明白,看到上面的內容,再設想我要面對幾十個不同業務方的情境,你可能就了解了吧。
出自:《數據的商戰策略》/天下雜誌出版社(本文經編修)