单个销售商垄断电子销售市场的动态定价研讨.pdf

下载文档 降价啦

0
0
约9.03千字
约 5页
2018-01-11 发布于广东
举报
版权申诉
保障服务

单个销售商垄断电子销售市场的动态定价研讨.pdf

1、本文档共5页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

单个销售商垄断电子销售市场的动态定价研究木陆慧1，2王金田1 1合肥工业大学计算机与信息学院，合肥230009 2安徽财贸职业学院，合肥2300601 摘要：研究了电子销售市场上的单销售商动态定价问题。将问题模型建模成半M破ov决策过程 (sMDP)，为了解决这个问题，结合性能势理论，给出了平均和折扣准则下统一的Q学习算法和模拟退火Q 学习算法。最后，通过仿真实验表明模拟退火Q学习算法的不但学习效果更好而且学习速度更快。关键词：动态定价性能势模拟退火Q学习算法 1引言在电子销售市场，需求和供应总是变化的，虽然销售商不能准确的预测市场环境的变化，但通过学习，可以获得环境的更多知识，销售商利用学习到的这些知识，更好的预测市场前景，并且找出适应当前环境的最优定价策略。近来，对动态定价问题的研究很拶1卅。然而很多学者考虑的问题模型都很简单，文献[1】研究了需求已知情况下的动态定价问题，文献[2]和【3】研究了所有的顾客对价格都极为敏感，且商品库存无限大得有限时段内的动态定价问题。文献[4】考虑了一个更复杂的模帆。。h州i。型，他们假定需求是随机到达的、库存有限且支持补货以及将顾客细分的无限时段内的动态定价问题。本文针对文献【4]中提出的单个销售 ④ 商焦断巾．场模型，将其建模成SMDP，并结合性能势理论，给H{了平均和折手|l准则下统一的模拟退火O学习算法。最后通过仿真实验表明 PiW一，!，砸1 了提出的算法的有效性。图l单个销售商垄断市场模型 2模型描述假定市场上只有一个销售商垄断市场上的某种商晶，如图l所剥引。具体描述如下：根据顾客对价格的敏光顾特定的销售商。销售商为了区分这两类顾客，给出了数量折扣的优惠条件，这里给出的是买二送一，当顾客选择这种优惠，则认为是shopper，如果只购买单位商品，则认为是captive。售商的库存有限，H最大库存为，m。，，在必要时需要补货，采用的补货策略是(g，，)策略，其补货前置时间 lead (replellishmenttime)服从参数为∥，的指数分布。 ’作者简介：陆慧(1982．)，女，安徽蒙城人，合肥工业大学计算机与信息学院，在职硕十研究生，主要研究方向为离散事件动态系统、强化学习以及多agent系统；王会山(1981．)，男，合肥工业大学计算机与信息学院，硕士研究生，主要研究方向为离散事件动态系统、强化学习以及多agem系统．差全笾笪蜜垄堑皇￡丝垡立堑丝蛰查窒绝丛塞 jQ2 顾客来购买商品时，首先查看商品价格，如果价格不能接受，则离开系统；否则，在库存允足时，购买商证。等待队列中的shopper耐心有限，她们服从参数为从的指数分布的时间间隔再次光顾销售商，如果她此时看到销售商仍然缺货，则离开系统，否则，还要查看此时销售商给出的报价，如果价格能接受，则购买离开，否则继续留在队列中。销售商在状态发生改变的时候进行决策，决策行动为销售商给出的单位商品价格，记彳为离散化后的价格集，段时间魄之后，转移到下一状态s(Z+．)，并记录即时报酬。即时报酬由以下三部分组成：立即收益口(J(乙))，如果x(瓦+。)=工(瓦)+l 口(s(瓦))，如果，(o．)=，(瓦)一l 尺(s(L)，口0(L))，s(瓦+。))= 2口(J(乃))，如果，(瓦+。)=，(乙)一3 O．其他 c0(瓦)，s(乙+，))=[，(瓦+。)一J(乙)]+·足