人工神經網絡法燃氣日負荷預測輸入變量選取

摘 要

摘要:研究了RBF神經網絡在城市燃氣日負荷預測中的應用及輸入變量的選擇問題,提出了基于逐步回歸的輸入變量選取方法。對實例進行了預測,對不同輸入變量方案進行了對比分析。以

摘要:研究了RBF神經網絡在城市燃氣日負荷預測中的應用及輸入變量的選擇問題,提出了基于逐步回歸的輸入變量選取方法。對實例進行了預測,對不同輸入變量方案進行了對比分析。以逐步回歸選取的輸入變量為基礎,增加日期類型、前一天平均氣溫兩項數據作為輸入變量,完全滿足神經網絡用于城市燃氣日負荷預測精度的要求,且合理可行。
關鍵詞:神經網絡;城市燃氣;負荷預測;輸入變量;自變量
Selection of Input Variables in Daily Gas Load Forecast Based on Artificial Neural Network
YAO Jian,ZHOU Wei-guo,ZHANG Zhong-xiu
AbstractThe application of RBF neural network to daily city gas load forecast and the selection of input variables are studied. The selection method of input variables based on stepwise regression is put forward. A case forecast is carried out,and a comparison among schemes with different input variables is made. Based on the input variables selected by stepwise regression,adding date type and average air temperature of previous day as input variables can meet the accuracy requirement of neural network for daily city gas load forecast,and it is reasonable and feasible.
Key wordsneural network;city gas;load forecast;input variable;independent variable
1 概述
    神經網絡經過逾60年的發展,已經形成了多種模型、算法,廣泛應用于各個領域。在城市燃氣負荷預測中,不同的模型、算法表現出各自的優缺點。目前較為成熟的應用于城市燃氣負荷預測的方法主要為BP網絡及RBF網絡。這兩種方法在一定范圍內具有實用性[1~5]。譚羽非等[1]用BP神經網絡建立了既反映煤氣負荷連續性、周期性及變化趨勢,又包含天氣、氣溫、節假日等影響因素的短期負荷預測模型;李持佳等[2]考慮天氣。溫度、傳統節假日等因素,采用BP網絡和RBF網絡相結合的方法對春節期間燃氣負荷進行預測;肖文暉等[3]采用改進模糊神經網絡進行小時燃氣負荷預測;梁金鳳等[4]運用GCAQBP神經網絡對燃氣日負荷進行了預測;陳飛等[5]采用訓練速度快的RBF神經網絡對燃氣日負荷進行了預測,結果表明RBF神經網絡滿足預測需求。
2 RBF網絡
    RBF網絡是一種兩層前向型神經網絡,包含一個具有徑向神經元的隱層和一個具有線性神經元的輸出層。
    RBF網絡和普通的前向網絡有所不同,隱層神經元是徑向基神經元而不是tansig或者logsig神經元。普通前向網絡中sigmoid神經元能夠覆蓋較大的輸入區域,但是普通前向神經元數目在訓練前就已經固定下來。而徑向基神經元雖然只對相對較小的區域產生響應,但是在輸入區間較大時,可以適當地增加徑向基神經元來調整網絡,從而達到精度要求。且RBF網絡的設計比普通前向網絡訓練要省時得多[6]。RBF網絡模型預測流程見圖1。
 

3 輸入變量的選取
   一般認為,為了預測精確,希望輸入盡可能多的變量,特別是對負荷有顯著作用的因素不能遺漏;另一方面,為了使用方便,又希望變量盡量少,這是因為輸入變量的增加意味著使用模型時必須測定更多的量。此外,如果輸入變量之間有存在著一定的線性或非線性的相關性,會造成信息的冗余。在保證預測精度的前提下,如何合理可行地選取輸入變量成了神經網絡應用于城市燃氣負荷預測的關鍵問題。
   統計學在采用多元線性回歸建模過程中,常采用逐步回歸法對變量進行篩選。逐步回歸法是從一個自變量開始,按自變量對因變量影響的顯著程度,從大到小逐步引入回歸方程。當先引入的變量由于后面變量的引入變得不顯著時,則隨時將它們從回歸方程中剔除,以保證每次在引入新的顯著變量以前回歸方程中只包含顯著的變量,直至沒有顯著的變量可以引入回歸方程為止。它能實現在可能影響因變量的、為數眾多的初始因數中“挑選”自變量,以建立自變量少、精度高的模型[7]
   雖然線性回歸建模和神經網絡建模存在著差異,但是仍可以借鑒逐步回歸的方法選取輸入變量。正因為神經網絡可以模擬高度復雜的非線性系統,所以可以在逐步回歸法選出的變量基礎上新增輸入變量,通過實際結果檢驗其合理性。
4 算例分析
   一般認為非工業用氣占主體的城市,氣象因素是冬季城市燃氣日負荷的關鍵因素[8]。本文以北方某中型城市日用氣量和氣象數據作為研究對象,對所有的13個變量進行相關性分析,初步判斷影響冬半年(11月至次年3月)燃氣日用氣量的主要氣象因素。其中累計氣溫的計算公式為:
    tc=0.5t0+0.3t1+0.2t2    (1)
式中tc——累計氣溫,℃
    t0——當天平均氣溫,℃
    t1——前一天平均氣溫,℃
    t2——前第二天平均氣溫,℃
   相關性計算結果見表1。
表1 冬半年燃氣日用氣量與氣象因子相關性計算結果
氣象因子
累計氣溫
當天平均氣溫
當天最高氣溫
當天最低氣溫
相關系數
-0.915
-0.893
-0.870
-0.820
氣象因子
當天8時氣溫
當天平均氣壓
當天日照時數
當天相對濕度
相關系數
-0.819
0.650
-0.233
0.053
氣象因子
當天14時云量
當天降水量
當天最大風速
當天8時云量
相關系數
-0.050
-0.030
-0.025
0.016
    以當天用氣量為因變量,以前一天氣量、當天平均氣溫、當天最高氣溫、當天最低氣溫、當天平均氣壓、當天日照時數、當天日均濕度、當天平均云量、當天降水量、當天最大風速10項指標作為自變量,采用逐步回歸法進行因子舍選計算。
    結果表明,冬半年因子舍選的結果是:前一天氣量、當天平均氣溫、當天日照時數。其中當天日照時數雖然相關系數不高,但由于具有很好的獨立性,能夠起到信息補充的作用,因此被選為日用氣量的主要影響因素之一。但是作為神經網絡的輸入變量,還有待模型預測結果檢驗。
    由表1可見,累計氣溫與日負荷相關性最大,可考慮把前一天日平均溫度作為輸入參數。但鑒于已把與前一天氣溫相關性極高的前一天用氣量作為輸入變量,前一天氣溫作為輸入變量是否合理還有待模型計算檢驗。
    鑒于冬半年周末用氣量比平時工作日低的特點[8],也把日期類型納入影響因素。譚羽非等[1]也把日期類型作為神經網絡的輸入參數用于日負荷預測。
    本文以3組不同的參數組合為輸入變量,采用同一收斂精度、穩定性較好的RBF神經網絡對1月份某1個星期的日負荷進行預測。
   3組輸入參數分別為:
   A組輸入參數:前一天氣量、平均溫度、日期類型、日照時數、前一天氣溫。
   B組輸入參數:前一天氣量、平均溫度、日期類型、前一天氣溫。型、日照時數。
    輸入參數按照不同的數據類型分別采用Matlab中premnnx函數進行歸一化至[-1,1]。設定均方差精度為0.001,散布常數為1000。
    訓練樣本為11月、12月的數據??紤]到元旦假日的影響,預測對象為1月份第1個完整的星期。C組輸入參數:前一天氣量、平均溫度、日期類 模型預測結果見表2。
表2 模型預測結果
日期
真實值/(m3·d-1)
A
B
C
預測值/(m3·d-1)
相對誤差/%
預測值/(m3·d-1)
相對誤差/%
預測值/(m3·d-1)
相對誤差/%
1月9日
181130
181897
0.42
181638
0.28
181283
0.08
1月10日
180349
181106
0.42
180188
0.09
180203
0.08
1月11日
185068
181417
1.97
179245
3.15
182083
1.61
1月12日
182699
176593
3.34
174485
4.50
177027
3.10
1月13日
167929
168343
0.25
168028
0.06
170103
1.29
1月14日
171572
173081
0.88
171444
0.07
175312
2.18
1月15日
163977
168544
2.78
167983
2.44
166971
1.83
平均相對誤差/%
1.44
1.51
1.45
    從表2可以看出,除1月12日B組預測結果的相對誤差絕對值大于3.5%以外,其余所有點預測結果的相對誤差絕對值均小于3.5%。
    A組平均誤差最小,說明輸入變量的增加增大了信息量,提高了預測精度。雖然輸入變量之間存在一定的相關性,但是由于神經網絡的自學習功能,通過權值及閾值的調整消除信息冗余對預測造成的不利影響。
    B組平均誤差基本上大于C組,說明冬半年日照時數對用氣量的影響比前一天氣溫對用氣量的影響大。
5 結論
    ① 以逐步回歸法選取的自變量為基礎,增加日期類型、前一天氣溫兩項數據作為輸入變量,完全滿足神經網絡用于城市燃氣負荷預測精度的要求,且合理可行。
    ② 日照時數是影響冬半年日用氣量的重要因素。
    ③ RBF神經網絡訓練速度快,可復現,精度滿足工程應用要求。
參考文獻:
[1] 譚羽非,陳家新,焦文玲.基于人工神經網絡的城市煤氣短期負荷預測[J].煤氣與熱力,2001,21(3):199-202.
[2] 李持佳,焦文玲,朱建豪,等.基于人工神經網絡的春節期間燃氣負荷預測[J].煤氣與熱力,2004,24(9):477-482.
[3] 肖文暉,劉亞斌,王思存.燃氣小時負荷模糊神經網絡預測[J].煤氣與熱力,2002,22(1):16-19.
[4] 梁金鳳,陳飛,馬慶元,等.鞍山市燃氣日負荷預測的研究[J].煤氣與熱力,2006,26(10):16-19.
[5] 陳飛,梁金鳳,高鑄,等.基于徑向基神經網絡的燃氣日負荷預測[J].煤氣與熱力,2007,27(5):18-19.
[6] 董長虹.Matlab神經網絡與應用[M].北京:國防工業出版社,2007.
[7] 中國科學院數學研究所數理統計組.回歸分析方法[M].北京:科學出版社,1974.
[8] 張中秀,周偉國,梁金鳳.冬半年城市燃氣日負荷規律研究[J].煤氣與熱力,2008,28(8):B07-B09.
 
(本文作者:姚健 周偉國 張中秀 同濟大學 機械工程學院 上海 200092)