電站設備溫度數據分析探索實踐

來源:北極星電力網

點擊:2835

A+ A-

所屬頻道:新聞中心

關鍵詞:智慧電廠 火力發電

    ?工業設備的溫度預警技術方法嚴重滯后,所以要研究電站設備的鍋爐、齒輪箱、軸承溫度等部件運行參數的變化過程,分析關鍵部件溫度運行數據復雜性、多樣性、不確定性等重要問題,基于不同的溫度異常檢測方法,利用大規模的運行數據,探索并研究基于異常檢測的溫度預警方法。


    2019年8月22日,由中國能源研究會節能減排中心聯合華北電力大學國家大學科技園共同舉辦的“2019年智慧電廠論壇(第二期)”在北京召開。主旨報告環節,華北電力大學能源動力與機械工程學院副教授 宋光雄作了題為“電站設備溫度數據分析探索實踐”的報告。


    我是2005年到北電力大學教書,一直做電站設備的狀態監測與故障診斷的研究工作。我今天到會場之后真是大開眼界,看到了智慧電廠的建設真是很厲害,終于發現有這樣的市場空間。我的題目是《電站設備溫度數據分析探索與實踐》。


    溫度能干什么事情呢?我想溫度至少可以做這兩件事情,可以對軸承狀態進行預警和評價,第二件事情,可以對鍋爐的溫度進行檢測,我就想說一下,有關于鍋爐的溫度我們能不能做一些溫度異常檢測。


    首先介紹一下軸承狀態的預警評價。軸承狀態的預警評價的本質就是劣化過程的評價。劣化過程什么意思?前面很多人說過故障診斷,我是來自于故障診斷領域的,故障的發生往往就是劣化過程的一個階段,我們說任何事物人有生老病死,我們說事物的發生發展,比如產生了、形成了,會發生發展,可能有前期、中期、后期、晚期的階段,這些階段過程中肯定會有劣化,這是毋庸置疑的。這個劣化過程,比方我們說我們今天的主題是討論軸承的劣化,軸承是很關鍵很關鍵的,我們工業運行如果沒有軸承是根本轉不動的。


    軸承的劣化怎么去評價?現在工業界軸承評價有四種方式,第一種油力檢測,測潤滑油狀態。第二種用工業內窺鏡,觀察軸承內部摩擦面的摩擦情況。但是這兩種狀況,人員成本、設備停機成本是很高的。第三種,通過劣化數據能不能對軸承進行評價呢?可以。我們可以比較一下,利用溫度數據、利用振動數據,溫度有什么優勢呢?他的數據成本、檢測成本、采集成本上溫度是遠遠低于振動的,比方說可能有的人很熟,我們的汽輪機振動,它的一個測點1秒鐘要采大概1000、2000、3000、4000個點,溫度數據用不用采這么多呢?溫度可能10秒鐘采一次或者20秒、1分鐘、3分鐘、5分鐘就則夠反映一些問題。這樣一個數據的采集成本、分析成本不是對等的,所以我們現在就談用溫度來做一件事情。


    軸承的監測,實際是一個老話題,你不管滑動軸承也好、滾動軸承也好都有ISO的標準,它的閾值到了80度或者85度,當然國內外的軸承情況不一樣,這個規程已經用了10年、15年、20年了,到80、85度是一個報警,到了90、95度是要停機的。我們說已經有了這樣的閾值判斷標準,我們在這樣一個基礎上能不能做一些事情,有沒有改善的空間,能不能做的更好呢?我們現在想說這么一件事情。我們的目標,當然也有一些問題,我們說在研發過程當中是不是需要這樣新的觀測方式,我們能不能做一些定性及定量的分析呢,我們下面進一步介紹。


    我們說介紹任何一件研究言必之國外的,因為國外是我們的研究目標或者趕超目標。Vestas是供電巨頭,Vestas說他自己大數據的應用是這樣的,我們用5千臺的數據,利用歷年來電機軸承的前換端溫度進行比較對比,這樣的數據規模如果判斷有比較大的溫差可以進入評價環節,看是不是要修,或者到下一個階段要集中關注它,Vestas是這樣做的。這里有一個問題,你做這樣一個事情需要什么樣的數據規模,還有就是我們需要有一個什么樣的基礎呢、還有什么樣的條件呢,我們需要不需要新的數據分析工具呢,需要不需要長期的工程驗證。比方很多技術說我很厲害,說怎么怎么樣,但是你一定要經得起長期的工具鏈,尤其是在工程界,你技術再先進、再發展一定要經得起各方的質疑。


    我們這個探索用了什么樣的數據規模,我們用了100多個供電機組的軸承數據,因為一個傳動鏈有一個關鍵點,軸承有兩個測溫點,一個在前、一個在后,我拿到的數據是這樣一個規模,有66臺的數據,我們在清洗的過程中ETL的過程中清洗了6個T,這個數據如果跟大的企業相比不是很大、量不是很多,但是我對專業的做這方面的研究人來說,我也是在近三年看到這么大的數據,以前我們做檢測最多看的就是幾十個K,或者再多一點就是幾十兆,或者再運氣好可能見到幾百兆的數據,但是如果說你面臨幾百個G或者幾個T的數據的時候,你會發現,我們都是從同樣一個理論背景下受的教育,我們發現很多問題、很多理解、很多解釋和我們的教材情況是不一樣的,我們回頭再來說這個事情。


    我們研發過程中發現,就需要多維的面向溫度的工具,這個基礎上我們就可以建立個性化的異常定量分析數據模型,也需要在大規模數據基礎上反復驗證、不斷優化。我也會介紹驗證和優化的過程,我這項工作是從2016年6月份開始的,現在已經三年多了。最近三個月我又反過來看這些數據的時候,因為我是連續的做這樣的,我見到的數據越來越多,反過來看的時候,我們對它認識會加深。這樣的數據是不是在試驗臺或者很局限的環境中?不是!所有的過程當中我是在工業云上做過這樣的,比如說數據給我電廠或者大規模數據讓我采集、分析、整理一直到結果的輸出,我們整個流程是可以在工業云上完成閉環操作的。


    這是什么意思呢?一模一樣的數據,我用不同的觀測方式得到的信息、得到的定制標準是不一樣的,這是一個軸承的兩年數據,我們觀測這個數據,軸承的溫度數據得到的信息是不一樣的,無機分布,我們從很少到很集中,這個可以告訴大家,密度最強或者稍弱情況下的分布,這是一個散點分布,這個就是對溫度進行切片,在不同的條件下對溫度進行切片,我們進行更系統的觀察。


    定性觀察夠不夠呢?我們該需要定量的分析、定量的計算,這樣的分析過程是怎樣的結果?是好還是壞?好、壞我們是必須要通過數據來反映的,這樣一個計算過程不是那么一蹴而就的,這是一個艱苦的探索過程,這不是一年、不是幾個月,我的經歷就是。我在一年前對它的了解和三年前對它的了解和現在對它的了解是不一樣的。這個就是一個評價的過程,這有一個問題,評價你用一個指標夠不夠呢?它的一個基本的數據原理是什么呢?你不能憑空造一個原理說,這個是靠譜的,不能這么干,因為我說服不了自己、也說服不了大家,因為大家都是工科出身的,是不那么容易被說服的。


    這個就是我通過兩個指標,累積量,我們出現異常的累積的數量是多說,比方我們永遠是的方式80度,超過80度的情況點有多少個呢,我們現在閾值的標準是動態的,隨著時間的退役是有動態變化的。我們超過閾值的一種方式,數量有一個累積量,但是還有一個程度的差異。比方有的軸承過了60度,有的機組超過70度、80度也有,也就是說你超過60度或者50度、70度、80度,程度是有差異的,一般我們說超過七八十度,嚴重程度就相對很嚴重了,劣化的程度上也有計量,一個是數量上、一個是質量上要分別進行差異的計算。這是我們前面說10號機組相對好的兩年情況是這樣的。相對比較差的情況是什么樣的,無論在數量上、程度上有很大的不同。


    以上我簡單介紹了一下評價的過程,怎么預警呢?我總說預測,實際上是預警,預測是很難做到的,當然每個人對預測的理解不一樣,我就是說嚴格的預測我們還是做不到的,比方說地震的預測就做不到,但是地震的預警我們可以做到。什么叫地震的預警,你發生了之后我能夠提前10秒、20秒、1分鐘、3分鐘可以做到,但是預測為什么做不到呢?因為我們對它的運行規律的理解是非常有限的,工藝設備就這樣了。


    我們說軸承溫度是不是也這樣,我們看怎么預警的呢?我們預警的結果是這樣的,我這個預警覆蓋了所有的極端情況,也覆蓋了我認為它是一個不正常的情況,這是什么意思呢?比方說我今天從11點半下來到12點要下去的,這個過程我要在這里做一個介紹,如果這種場景下,大家可能監測我的軌跡,我頂多就是在這個舞臺上來回走,但是如果說你一旦監測到我的軌跡跑這兒去了或者跑那兒去了,這跟我的場景是不對稱的,溫度也是這個溫度,就是我在一段時間內有一個確定的溫度范圍,這種確定的溫度范圍是誰定的呢?是數據給出來的,是100臺機組一年到兩年的數據確定了他能夠給出這樣的軌跡范圍,這是統計量,這不是人定的,這很難推翻。在這樣的一個范圍下我就能夠預警,你一旦超過了他的統計范圍的話肯定是異常。并且這種異常和80度、90度異常的特征是連貫的,就是他這個特征和極端的報警和停機閾值的特征是一致的。這樣我們說,我們報警是能夠提前到多少呢?原來是80度,我們至少能夠提前到60度,時間的提前量有多大呢?一般說兩個小時左右。


    這是剛剛介紹的單機的情況,我們說需要在一個大環境下進行橫向對比、縱向對比,我們總說沒有最壞的、也沒有最好的,但是我們通過橫向對比就能夠知道,你好能好到什么程度、你壞能壞到什么程度,怎么做對比呢?下面這個圖就是兩個點它的異常量數量兩年情況下,當然我們可以做某一段時間,三個月、半年或者一年情況的對比,我們發現好的是真好,壞的它的問題也是很嚴重的,這個東西有什么用呢?我們就能夠根據這個東西來判斷,或者延伸的話我們就能夠為維修決策提供依據,你下次去的時候可以著重看一些高得多的技術。


    做一個總結,分三點:


    第一點,什么是人工智能?人工智能我想至少是分成兩個部分,一個是人工部分、一個是智能部分。人工部分就是專業經驗、就是專業角度出發的理解。什么是智能呢?就是算法。算法還不是那么準確,實際上我們人工智能在工業領域要做的就是,要有一定量的數據用一定的方法描述和理解一定的設備。這也比較抽象,我舉個故事,也是一個解讀。昨天我剛剛看的,《大數據文在》說AlphaGo是什么現象,說AlphaGo中日韓的圍棋高手正在華山論劍,突然上來一個端機關槍的把這些高手全都打敗了,你如果是那個端機關槍的你就是很厲害的。但是我們在工業領域所謂的人工智能機關槍是什么東西呢?是有明確的實務和軟的東西支撐的,一個是數據,一個不一定是人工智能,你可能是很簡單的數據算法,也可能是很復雜的數據算法;還有一個是編程環境,因為我們現在沒有一個可靠的分析工具給你用,你肯定要自己摸索、自己探索。


    我們在工業領域面臨的情況,往往是我們可能要走到用更多的數據、用更好的方法在一個可編程的環境里去對工業設備進行探索或了解、理解,了解和理解是最重要的。


    第二點,下面還有鍋爐數據異常或者溫度異常檢測,我們說異常檢測是不是只限于溫度呢?不是,我只是把注意力集中在溫度而已。比方我們說過,前面有幾位老師也說過變壓器異常放電,比方說油溫、油壓,某一個KPI值,我們說能不能做到異常檢測,當然可以,甚至電磁電壓,所有你可以見到的任何一種,只要參數是可測的,都肯定是有異常的,你只要給我數據,我們就能做到異常檢測。并且我堅信,ABB也在做、霍尼韋爾也在做。


    第三點,我就想說數據是可以增值的,怎么個增值法呢?你交給的人,比方你把這個數據交給十個人,你就有十次增值的機會,為什么這么說呢?因為我的經驗告訴我,我對數據的理解,三年前、一年前、現在我們對數據的理解是不一樣的,就是我們對算法的解釋或者算法的理解。所有這個情況在現在的背景下就可以得到一個倍增,什么樣的倍增?舉個例子,三年前、五年間我們計算機、我們工作站的內存可能是幾個G,現在工作站的工作內存是幾十個G的情況,或者再過一兩年可能幾百G的情況,這是一個單機版,這樣的情況下我們就可以對大規模的數據進行預算,就是現在是個計算時代。


    還有一個問題,我經常說我們有一個模型,某些電廠有一萬個模型,你怎么去優化?肯定是需要優化的、肯定是需要管理的,你怎么去管理它呢?這是個問題。因為你在三年前、五年前對這段數據的理解和三年后對它的理解肯定是不一樣的,為什么?國際象棋上卡斯帕羅夫被擊敗過了若干年之后有AlphaGo把圍棋選手干掉了,現在也是這樣的,因為對事物的理解是越來越加深的,電廠數據是不是這樣呢?毋庸置疑肯定是,但是能不能改善、能不能優化、能不能進步呢?這需要考慮。


    我們下面簡單說一下鍋爐。鍋爐這個數據我是7月份拿到的,現在是8月份,我們前后間隔一兩個月,如果時間再長我可能會做的稍微更好一些。


    這是一個機組,是2014年、2015年、2016年、2017年四年的數據,92根,下面是機組的負荷,這么看是看不出來的。我們對它的趨勢進行了劣化處理,我們得到這樣的,是其中一組,因為92根分6種。我們看一下2017年的1月份,三根線三個測點,原理就是,我們三四個人一起走,齊步走,在2014年、2015年、2016年的時候,他們是嚴格按照齊步走的順序一直在走,可是到了2017年1月份的時候出現了交叉,不齊步走了。如果說這一組數據是在一個月的時間跨度下觀察,半年或者一年的時間跨度,我們是得不到明確的結論的。大數據是什么呢?至少時間跨度會很大,這樣我們對事物的理解會更多。


    這個東西是不是偶然的呢?不是,我們如果連續觀測92根輪流來一遍,有人會問我你為什么敢這么算呢?因為背景有算法。我們背后的算法什么意思呢?齊步走是什么意思?大白話簡單來講就是長的差不多,長的差不多是什么呢?再用學術點的意思說,持續數據保持同步變化。你在這樣的過程中,我用92根輪流來一遍,如果說1、3、5、2號數據點不做處理是這樣的情況,你根本不知道有這樣的趨勢變化。


    你把92根輪流來一遍之后會發現,在1月份某一階段之前有一個集中的爆發,就是說這一點肯定發生了一些事情,并且是我有非常確實的證據來證明這肯定是異常的。再看下一個算法,摘取其中兩個,這樣就會發現,2017年1月份前后的確是有一個很異常的情況,但為什么我不知道,因為我只是拿數據說話。但是這里頭的問題是什么呢,恰恰是在4、5月份,我們知道2017年1月份到7月份有一個中間落差階段,正好那個機組爆管,是這么一個背景。


    以上是我最核心部分的講解,再補充講一些內容。


    異常檢測,絕對有普適性。油壓有普適性,各種狀況有異常情況,所有的運行參數都可能出現異常,我們不一定要延用十年前、二十年前ISO的標準,我們可以用數據做一些積極的開發。比方昨天有嘉賓就說數據打通,這個數據打通意義是很大的,我們經常也跟電廠的人交流,我們設備不出毛病,可是你要保持現在狀態的時候要做很多工作,就是說設備要養生,怎么養呢?肯定需要有數據的支撐。還有,你數據打通有真正意義呢?可以對別的比你更好的或者比你更差的設備提供一個參照的可能。


    我想跟大家分享一下什么是工業大數據,為什么我們總說現在到了第四次工業革命,因為我們對數據的理解進入了一個新的階段,就是大數據,大數據想干嗎呢?實際想說的是能夠理解多樣性是什么、能夠理解復雜性是什么、能夠理解不確定性是什么。這塊怎么說的呢?我們總說金無足赤,可是我們看到理工科所有教材的公式、定理、定律的時候,我們都說的是一種理想情況,但是這種理想情況存在不存在呢?毋庸置疑是不存在的,那你怎么辦?實際任何一種事物是有多樣性、復雜性的,就是你看到任何一種情況是理想情況的,但是每一個機組、每一個設備是變化的,你怎么去理解這種變化呢,教科書上沒有,現在這樣的技術、這樣的條件下能不能往前走呢?肯定,為什么?技術上已經有一種積累,數據上有積累,我們也要這么去做。


    我今天的介紹就是這么多,謝謝大家!


    來源:北極星電力網


    (本文根據現場速記整理,未經發言人審核。)


    (審核編輯: Doris)

    双色球投注单详解