|
基于多智能体强化学习的电力现货市场定价机制 研究(一)不同定价机制下发电商报价双层优化模型 - a" q$ d& c3 k$ z' h0 o. o
3 [" T+ p# J6 i* T. v1 L4 ?' U
8 N- |, v+ @1 W5 _3 h
|, j0 N) e- \% y% F: Z: y2 D& Q. K9 m3 u. |# T
电力现货市场定价机制是市场设计的重点问题之一,+ a+ ^9 o$ k* ^+ b @% C% o
与发电商交易行为相互影响。定价机制设计需要考虑发电商9 o$ [+ y% g" ~! M+ j6 g
可能的交易行为,而不同定价机制下发电商报价策略不同, 4 }6 M: J% M: `: k& r" z' R1 S: P+ @
为系统性地解决这一嵌套难题,形成两篇不同侧重点的论 * A6 W( e0 I/ [3 Q3 h) o
文。作为首篇,探讨了强化学习在发电商报价决策中的适用
h8 M, }! N% Q6 S: Z3 r性,构建了节点边际电价、系统边际电价、分区边际电价三
. H5 v( ] I4 C H! V) k- R" v种定价机制下的发电商报价双层优化模型。上层为发电商报
, m5 m# w; y- [" A1 N价决策层,下层为市场出清层,决策层优化发电商报价作为
4 u, S! G) W' K0 d* r4 j4 }市场出清的基础,出清层综合所有市场主体的报价信息和系& s0 |% m% Y0 x+ w K9 ~$ s
统运行参数,出清决定各发电商的中标电量和收益,为决策$ J" t6 ]: W% h, E$ P/ n* C# M
层优化报价策略提供依据。报价决策模型采用可变学习速率% ]# E3 d9 Y n* Y, K
和策略爬山算法相结合的多智能体强化学习方法求解,以避. d2 U8 T5 A9 }" L
免考虑其他主体报价变化带来的“维数灾难”问题,且避免求
h2 D* o+ A( B9 X2 Y解过程陷入局部寻优,在实际应用中取得了较好的收敛效! L5 d6 R- ^: E/ V3 `* L' e
果。最后以 IEEE 39 系统为例,选择 4 个典型负荷场景,优4 z5 {& D+ W2 w
化三种定价机制下的发电商报价,结果表明:所提模型和算
: }0 [; b, ]$ V, O法可有效求解发电商最优报价策略,获取市场均衡结果。 # K2 N" O7 w0 [2 I) E
+ u& j4 ]) s/ W$ c0 k7 \
$ ]1 ^, w- h0 J: ?0 Z7 A- C |