- 1、本文档共8页,其中可免费阅读3页,需付费100金币后方可阅读剩余内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
单词和短语的分布式表示和他们的组合性文摘最近推出的模型是一种有效的方法来学习高品质的分布式向量表示它捕捉了大量精确的语法和语义词的关系和方法在本文中我们提出几个扩展提高质量的向量和训练速度通过频繁的二次抽样使我们的学习得到显著加速同时也学更多的定期字表示我们还描述了一个简单的层次称为负采样词表示有着特定的局限性他们无法代表习惯用语例如加拿大和空气不能容易地组合以获得加拿大航空公司通过这个例子中我们提出了用于查找文本短语的简单方法这个便使得学习良好的向量表示和为数百万短语成为可能引言在向量空间中分
单词和短语的分布式表示和他们的组合性
文摘
最近推出的Skip-gram模型是一种有效的方法来学习高品质的分布式向量表 示,它捕捉了大量num-ber精确的语法和语义词的关系和方法。在本文中我们提 出几个扩展,提高质量的向量和训练速度。 通过频繁的二次抽样,使我们的学习
得到显著加速同时也学更多的定期字表示。我们还描述了一个简单的
alterna-tive 层次,softmax称为负采样。
词表示有着特定的局限性,他们无法代表习惯用语。例如,“加拿大”和“空 气”不能容易地组合以获得“加拿大航空公司, 通过这个例子中,我们提出了用
于查找文本短语的简单方法,这个便使得学习良好的向量表示和为数百
文档评论(0)