編者按:“三分技術、七分數據,得數據者得天下”,作為最新最熱的技術話題,大數據受到各行業的廣泛關注。而其在石化行業的應用,更是業內的熱門話題。
事實上,大數據在石化行業并不是什么新鮮的詞匯。現如今,面對節能的挑戰、新能源的發展、兩化融合等多項問題,石化行業必須通過大數據的創新與應用來應對挑戰,通過大數據分析,完成相關信息采集,并對數據進行存儲、檢索和智能分析,從數據深度關聯、可視化查詢、數據報告等多個方向,為石化企業實現企業決策、生產管理的智能化提供數據支持。
當前,涉及數據的行業越來越廣,數據種類越來越多,數據量越來越大,使人們逐漸意識到數據蘊藏的巨大財富和商機。
近年來,“大數據”一詞在各種媒體上頻頻出現,而且越來越被人們所重視。其實,大數據問題早就存在了。
對于現代企業,采集生產和經營過程中形成的數據,分析這些數據,由此產生一系列的決策對過程進行干預和調整,這是現代工業管理所遵循的基本原則。石化行業早就重視生產經營活動中的數據采集和分析,隨著計算機技術的成熟和普及,數據采集越來越密集,范圍越來越廣,數據越來越多。例如,乙烯生產裝置需要監控的參數約5000余點,一個中等規模的石化企業需要監控的生產參數約10萬點,DCS或SCADA系統的采樣周期為秒級,實時數據庫保存數據的周期通常為1分鐘,如此算來,一個星期內,中型石化企業實時數據庫累積的生產參數即可達10億條。作為石化產業鏈上游的石油勘探也是如此,一個普通的油田勘探項目即可產生十幾個TB的地震勘探數據,勘探公司每年的勘探數據量達1500個TB(一個TB為十的十二次方字節)。數據量之大可見一斑,由此可見,對于石化業來說,大數據問題早就有之。
大數據涉及行業廣泛
隨著IT技術和互聯網的迅速發展,各行各業都在與各種數據打交道,就連普通百姓也在使用數據、產生數據,這些數據又被人們收集、儲存和分析。例如,人們在互聯網上產生數量巨大的各類數據,據統計,社交網站Facebook每天更新的信息量達5000萬條,微博Twitter每天刷新的信息約6500萬條,這里的數據除了傳統的數字之外,還包括文本、圖形、圖像、聲音等其它形式的數據。
當前,涉及數據的行業越來越廣,數據種類越來越多,數據量越來越大,使人們逐漸意識到數據蘊藏的巨大財富和商機。2011年5月,麥肯錫全球研究院發布了題為《大數據:創新、競爭和生產力的下一個新領域》的報告。報告指出,數據已經滲透到每個行業和業務領域,逐漸成為一種重要的生產因素,人們對于大數據的運用預示著新一波生產率增長浪潮的到來。2012年3月,美國政府宣布“大數據研究和發展倡議”,并斥資啟動大數據研究和發展計劃。大數據上升為國家意志,大數據被認為是“未來的新石油”。
如何迎接大數據的挑戰
提出大數據已有幾年了,如今人們對數據的認識更加深刻,認為大數據的提出正在醞釀和促進一場工業革新,應該采取對策,制定措施,迎接大數據的挑戰。2013年3月,中國電機工程學會信息化專委會發布《中國電力大數據發展白皮書》,該文件分析了電力大數據特征和大數據發展的挑戰;提出了電力大數據關鍵技術,以及電力大數據發展策略;指出了電力大數據是電力工業技術革新的必然過程,以及重塑電力核心價值和轉變電力發展方式是中國電力大數據的兩條核心主線;展望了大數據的應用前景。其他行業也都在根據自身特點制定相應對策。
石化行業有重視數據的傳統,例如,在企業的控制、執行和管理三個層面上分別設置數據收集、儲存和處理的機制和相應設備,許多企業正在或已經建立了MES和ERP信息系統。但是,目前數據處理和應用僅僅限于統計和查詢,數據中蘊含的潛在價值遠遠沒有被挖掘出來。隨著數據量的不斷增長,數據的大容量儲存、管理和數據安全性問題,以及隨著企業在更大范圍的布局而產生的分散分布與數據集成之間的矛盾等,這些問題均給我們提出了新的課題。正如麥肯錫全球研究院在其分析報告中指出的那樣:大數據是一定時間內無法用傳統數據庫軟件工具對其內容進行抓取、管理和處理的數據集合。傳統的數據處理模式不能解決大數據問題,我們必須在大數據背景下重新審視對數據的認識,梳理出石化行業大數據的特點,關鍵技術和應對策略。
首先,我們應從兩個方面來認識大數據,即:大數據既是一種新資源,又是一種新的商業模式。
如同石油、鐵、煤等自然礦物一樣,大數據也是一種重要資源,需要勘探、采掘、提煉等一系列步驟才能加工成有用的物質,轉化成財富。對數據的統計查詢只能從數據中提取一些信息,而從數據中獲取更有價值的知識就需要用數據挖掘、機器學習等非傳統的數據處理方法。數據、信息、知識是人們描述和認識世界的三個不同境界。數據只是記錄客觀事物的符號,只是一種資源;數據只有與某事物聯系才能有意義,成為有用的信息;知識是描述事物的某個客觀規律,反映深層次的本質屬性,需要從數據中提煉。我們從大數據中要獲取的不光是信息,更要獲取的是知識,猶如從礦石中提煉出寶貴的金屬。對于大數據的資源屬性而言,除了數據分析方法之外,大數據設備同樣面臨許多新問題。
所謂大數據是一種新的商業模式是指:由于從大數據中發現有價值的結果,使人們突破傳統的思維,產生更多的增值服務,催生新的管理模式,拓展新的業務領域,轉變原有的發展方式,引發技術創新和產業革新,甚至改變傳統的社會管理模式。正如牛津大學教授維克托說的那樣:大數據開啟了一次重大的時代轉型,無論是商業、思維還是管理,都無時無刻不在受到數據的影響和改變。總之,根據大數據的特點需要改變和設計企業的管理模式。可以設想,在不久的將來企業將設置大數據分析部門,他們專門分析企業內部和周邊相關的數據,從中發現問題,洞察形勢,預測未來,并將這些結果分發給相關人員,及時作出相應決策。實際上,電商已經在應用大數據技術轉變其銷售方式,他們從互聯網數據中獲取客戶的需求信息,根據客戶需要主動將相關信息推送到客戶端,做到有的放矢,提高了銷售效率。
我們還應該改變傳統的數據分析方法,注重應用大數據分析方法。數理統計學是傳統數據分析方法的理論基礎,統計分析主要包括描述性分析,相關性分析和回歸分析等,數理統計基于來自對象的少數樣本分析來推斷總體。大數據不再是少數樣本,而是對象的全體,使人們有機會俯視總體,而無需通過樣本來窺視對象。對于龐大的數據體,大數據分析常常采用聚類分析、分類分析、模式分析、關聯分析等分析手段,從中發現感興趣的,重要的,或異常的模式,而不必拘泥于追求尋找變量之間精確的函數表達式。實際上,石化生產過程是復雜的物理化學變化過程,影響過程的因素多,機理十分復雜,難以用線性手段描述和精確方程表達。通過大數據分析,可以從中發現某些異常,或事故模式,對安全生產具有重大意義。大數據分析同樣可以用于優化生產,以及企業管理的各個領域。與傳統數據分析相比,大數據技術注重關聯性分析,大數據使我們在更大的范圍內,在眾多的因素中研究事物之間的關聯性,會發現一些有價值的新現象和新規律,而傳統數據分析方法限于某個局部,造成了數據之間的斷裂,數據中的規律無法充分挖掘。傳統數據分析方法強調事物之間的因果關系,而大數據分析只強調業已存在的關聯性,無需探究誰是因,誰是果。總之,大數據將帶來全新的分析問題思路和視角。
為了迎接大數據時代的到來,石化企業應該切實做好技術改造,技術儲備和技術攻關,特別在以下幾個方面:數據管理上,建立大數據管理體系和架構,大數據的軟、硬件平臺;數據分析上,研究數據挖掘、機器學習、模式識別等新分析方法的應用;數據處理上,研究分布計算式和儲存技術,云計算技術等;數據展現上,研究如何生動展示數據和數據分析結果,如可視化,三維和虛擬現實等技術;人才培養上,盡快培養解決大數據問題的技術人才。
作者簡介
陸治榮,畢業于清華大學工程數學力學系,曾在航天二院、南京煉油廠、霍尼韋爾公司高技術執行部,思華數據技術有限公司,北京石油化工工程有限公司等單位工作。近十余年,專注于數據挖掘和數據分析技術的研究、開發和應用,期間,主持了兩項數據分析軟件的研發,獲發明專利一項,出版專著一部。
摘自《自動化博覽》2月刊