- 1、本文档共29页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
#电商知识图谱建设及大模型应用探索
01电商知识图谱概览02电商知识图谱构建03电商知识图谱应用04知识图谱与大模型探索目录 CONTENT
#01电商知识图谱概览
电商平台为什么需要知识图谱Product商品Buyer买家Seller卖家EcommercePlatform电商平台卖家与买家的语言表达习惯不同,如何将意图与商品匹配起来?不同卖家之间的语言表达习惯不同,如何将平台上的商品统一管理?不同市场的语言不同,跨境电商平台如何对齐不同市场商品,高效管理?
电商平台为什么需要知识图谱深度学习或大模型优点:在很多任务上效果可观泛化能力强缺点:隐式模型,缺乏可解释性需要海量数据和强大算力存在模型幻觉问题知识图谱优点将异构数据源转换为结构化知识:实体,关系,属性可解释性好缺点:构建难度大泛化能力有限V.S.
电商平台为什么需要知识图谱知识图谱优点将异构数据源转换为结构化知识可解释性好缺点:构建难度大泛化能力有限卖家买家电商平台用户体验管理逻辑运营成本同款商品横向比较不同商品相同维度对比不同维度补足多种维度挖掘商品商品多元表达各异数据异构层级不同店铺内商品管理同市场内同款商品对比同市场内不同商品补足跨市场商品输出同类商品聚合管理跨市场商品对比和输出同类和跨类别商品效率分析品类上新、招商统一的商品知识图谱
电商平台知识图谱多维度:商品卖家买家多层级:类目标品跨信息源:市场场景商品+评论
#02电商知识图谱构建
电商知识图谱构建难点来源多:卖家商品信息买家有哪些信誉好的足球投注网站、评论表达方式多样:不同卖家表述习惯不同不同语言表达方式不同商品展现方式不同:文本、图片东南亚常用表达 错误拼写信息缺失信息错误信息冗余特定类别需领域知识鉴定信息准确性信息多元Shopee为例:数十亿商品8个市场6种语言质量参差不齐依赖领域知识数据量大保质信息领域知识
电商知识图谱构建基本框架
电商知识图谱构建方法-数据源TitleVariationSpecificationImageDescriptionComment
电商知识图谱构建方法-信息抽取电商知识图谱的基石:Ontology定义和结构构建方法:专家领域知识数据主动挖掘Ontology结构:基础定义层类别:L1-L5属性:关键属性,销售属性组合定义层:场景:多类目组合标签:类目+属性,或多属性,宽松定义标品:类目+属性,严格定义
电商知识图谱构建方法-信息抽取信息抽取-类目信息质量参差不齐:文本和图片信息质量检测信息模糊、不完整:文本+图片交叉验证多语言适配:不同语言实体拉齐E.g.1首图图片嘈杂,很难分辨商品主体,选择商品明确的图片作为模型输入E.g.1单从图片看可能属于乐器类目,但从标题中可以明确知道是儿童玩具Replace
电商知识图谱构建方法-信息抽取信息抽取-类目信息质量参差不齐:文本和图片信息质量检测信息模糊、不完整:文本+图片交叉验证多语言适配:不同语言实体拉齐ImageQualityScoreImageresolutionObjectNumberTextBackground…TextQualityScoreRule-engine:tokennumberintitleMulti-taskcrosscheck:classificationandkeywordsdetection…ItemTitleSentenceEmbeddingTrmTrmTrmTrmClassifierAttentionweightsInputcategoryInputKeyphrase(s)
电商知识图谱构建方法-信息抽取Li,Junnan,etal.Alignbeforefuse:Visionandlanguagerepresentationlearningwithmomentumdistillation.Advancesinneuralinformationprocessingsystems34(2021):9694-9705.Oquab,Maxime,etal.Dinov2:Learningrobustvisualfeatureswithoutsupervision.arXivpreprintarXiv:2304.07193(2023).信息抽取-类目信息质量参差不齐:文本和图片信息质量检测信息模糊、不完整:文本+图片交叉验证多语言适配:不同语言实体拉齐Labse-DinoV2-Vitimproves~5.9%accuracythanAlbefonhardcategories,e.g.Health,Gaming,Stationary,etc.
电商知识图谱
文档评论(0)