PaddleServing技术架构说明.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

Paddle

PaddleServing技术架构说明

1.整体设计目标

长期使命:PaddleServing是一个PaddlePaddle开源的在线效劳框架,

长期目标就是围围着人工智能落地的最终一公里供给越来越专业、牢靠、易用的效劳。

工业级:为了到达工业级深度学习模型在线部署的要求,PaddleServing供给很多大规模场景需要的部署功能:1〕分布式稀疏参数索引

功能;2〕高并发底层通信力量;3〕模型治理、在线A/B流量测试、模型热加载。

简洁易用:为了让使用Paddle的用户能够以极低的本钱部署模型,PaddleServing设计了一套与Paddle训练框架无缝打通的推测部署API,一般模型可以使用一行命令进展效劳部署。

功能扩展:当前,PaddleServing支持C++、Python、Golang的客户端,将来也会面对不同类型的客户增多种语言的客户端。在PaddleServing的框架设计方面,尽管当前PaddleServing以支持Paddle模型

的部署为核心功能,用户可以很简洁嵌入其他的机器学习库部署在线预

测。

2

2.模块设计与实现

2.1

2.1PythonAPI接口设计

2.1.1训练模型的保存

Paddle的模型推测需要重点关注的内容:1〕模型的输入变量;2〕模型的输出

变量;3〕模型构造和模型参数。PaddleServingPythonAPI供给用户可以在训

练过程中保存模型的接口,并将PaddleServing在部署阶段需要保存的配置打包保存,一个例如如下:

importpaddle_serving_client.ioasserving_ioserving_io.save_model(“serving_model“,“client_conf“,

“{words“:data},{“prediction“:prediction},fluidefault_main_program)

代码例如中,{“words“:data}和{“prediction“:prediction}分别指定了模型的

输入和输出,“words“和“prediction“是输出和输出变量的别名,设计别名的目的是为了使开发者能够记忆自己训练模型的输入输出对应的字段。data和

prediction则是Paddle训练过程中的“://paddlepaddle.org.cn/documentation/docs/zh/api_cn/flu“[Variable](s://paddlepaddle.org.cn/documentation/docs/zh/api_cn/fluid_cn/Variable_cn.html#variable),通常代表张量(Tensor)或变长张量(LodTensor)。调用保存命令后,会依据用户指定的“serving_model“和

“client_conf“生成两个名目,内容如下:

.

├──client_conf

│ ├──serving_client_conf.prototxt

│ └──serving_client_conf.stream.prototxt

└──serving_model

├──embedding_0.w_0

├──fc_0.b_0

├──fc_0.w_0

├──fc_1.b_0

├──fc_1.w_0

├──fc_2.b_0

├──fc_2.w_0

├──lstm_0.b_0

├──lstm_0.w_0

├── model

├──serving_server_conf.prototxt

└──serving_server_conf.stream.prototxt

其中,“serving_client_conf.prototxt“和“serving_server_conf.prototxt“是

PaddleServing的Client和Server端需要加载的配置,

“serving_client_conf.stream.prototxt“和

“serving_server_conf.stream.prototxt“是配置文件的二进制形式。“serving_model“下保存的其他内容和Paddle保存的模型文件是全都的。我们会

考虑将来在Paddle框架中直接保存可效劳的配置,实现配置保存对用户无感。

效劳端模型加载

效劳端的推测规律可以通过PaddleServingServer端的API进展人工定义,一个例子:

importpaddle_ser

文档评论(0)

写作定制、方案定制 + 关注
官方认证
服务提供商

专注地铁、铁路、市政领域安全管理资料的定制、修改及润色,本人已有7年专业领域工作经验,可承接安全方案、安全培训、安全交底、贯标外审、公路一级达标审核及安全生产许可证延期资料编制等工作,欢迎大家咨询~

认证主体天津济桓信息咨询有限公司
IP属地天津
统一社会信用代码/组织机构代码
91120102MADGE3QQ8D

1亿VIP精品文档

相关文档