网站大量收购独家精品文档,联系QQ:2885784924

单个销售商垄断电子销售市场的动态定价研讨.pdf

单个销售商垄断电子销售市场的动态定价研讨.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
单个销售商垄断电子销售市场的动态定价研究木 陆慧1,2王金田1 1合肥工业大学计算机与信息学院,合肥230009 2安徽财贸职业学院,合肥2300601 摘 要:研究了电子销售市场上的单销售商动态定价问题。将问题模型建模成半M破ov决策过程 (sMDP),为了解决这个问题,结合性能势理论,给出了平均和折扣准则下统一的Q学习算法和模拟退火Q 学习算法。最后,通过仿真实验表明模拟退火Q学习算法的不但学习效果更好而且学习速度更快。 关键词:动态定价性能势模拟退火Q学习算法 1引 言 在电子销售市场,需求和供应总是变化的,虽然销售商不能准确的预测市场环境的变化,但通过学习,可 以获得环境的更多知识,销售商利用学习到的这些知识,更好的预测市场前景,并且找出适应当前环境的最优 定价策略。 近来,对动态定价问题的研究很拶1卅。然而很多学者考虑的问题模型都很简单,文献[1】研究了需求已知情 况下的动态定价问题,文献[2]和【3】研究了所有的顾客对价格都极为敏感,且商品库存无限大得有限时段内的动 态定价问题。文献[4】考虑了一个更复杂的模 帆。。h州i。 型,他们假定需求是随机到达的、库存有限且 支持补货以及将顾客细分的无限时段内的动态 定价问题。本文针对文献【4]中提出的单个销售 ④ 商焦断巾.场模型,将其建模成SMDP,并结合 性能势理论,给H{了平均和折手|l准则下统一的 模拟退火O学习算法。最后通过仿真实验表明 PiW一,!,砸1 了提出的算法的有效性。 图l单个销售商垄断市场模型 2模型描述 假定市场上只有一个销售商垄断市场上的某种商晶,如图l所剥引。具体描述如下:根据顾客对价格的敏 光顾特定的销售商。销售商为了区分这两类顾客,给出了数量折扣的优惠条件,这里给出的是买二送一,当顾 客选择这种优惠,则认为是shopper,如果只购买单位商品,则认为是captive。 售商的库存有限,H最大库存为,m。,,在必要时需要补货,采用的补货策略是(g,,)策略,其补货前置时间 lead (replellishmenttime)服从参数为∥,的指数分布。 ’作者简介:陆慧(1982.),女,安徽蒙城人,合肥工业大学计算机与信息学院,在职硕十研究生,主要研究方向为离散事件动态系统、 强化学习以及多agent系统;王会山(1981.),男,合肥工业大学计算机与信息学院,硕士研究生,主要研究方向为离散事件动态系 统、强化学习以及多agem系统. 差全笾笪蜜垄堑皇£丝垡立堑丝蛰查窒绝丛塞 jQ2 顾客来购买商品时,首先查看商品价格,如果价格不能接受,则离开系统;否则,在库存允足时,购买商 证。等待队列中的shopper耐心有限,她们服从参数为从的指数分布的时间间隔再次光顾销售商,如果她此时 看到销售商仍然缺货,则离开系统,否则,还要查看此时销售商给出的报价,如果价格能接受,则购买离开, 否则继续留在队列中。 销售商在状态发生改变的时候进行决策,决策行动为销售商给出的单位商品价格,记彳为离散化后的价格集, 段时间魄之后,转移到下一状态s(Z+.),并记录即时报酬。即时报酬由以下三部分组成:立即收益 口(J(乙)),如果x(瓦+。)=工(瓦)+l 口(s(瓦)),如果,(o.)=,(瓦)一l 尺(s(L),口0(L)),s(瓦+。))= 2口(J(乃)),如果,(瓦+。)=,(乙)一3 O. 其他 c0(瓦),s(乙+,))=[,(瓦+。)一J(乙)]+·足

文档评论(0)

精品课件 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档