失效链接处理 |
商品搭配大数据推荐方法研I综q?nbsp; PDF 下蝲
本站整理下蝲Q?/strong>
链接Q?a target="_blank">https://pan.baidu.com/s/1m3mmRSvsbcnokuvrfi96WA
提取码:(x)xajv
相关截图Q?/strong>
![]()
主要内容Q?/strong>
Q?引言
互联|信息技术的快速发展,在给Z的生z?/div>
和工作带来极大便利的同时Q也带来?jin)信息超载EQ]
的问题。虽然以搜烦(ch)引擎Z表的信息(g)索系l?/div>
如谷歌、百度等可以帮助用户qo(h)和筛选信息,?/div>
只能满大众的简单需求,无法满个性化的用?/div>
需求。因此,个性化推荐pȝ应运而生Q成为当?/div>
解决“信息蝲”问题的有效方法EQ]。它Ҏ(gu)用户
需求、兴爱好等Q通过推荐法从v量数据中?/div>
掘用h兴趣的信息、商品等Q以个性化列表的Ş
式推荐给用户。目前,个性化推荐pȝq泛应用?/div>
很多领域Q其中在?sh)子商务领域的应用最为典型ƈ
h良好的发展前景。随着?sh)子商务的发展,用?/div>
需求的满发艰巨Q传l个性化推荐pȝQ3Q4Q的
多样性差、覆盖率低等问题日益显著。但是,大数
据时代的到来Q商品数据的表现变得丰富多P
使搭配推荐成为可能,为大数据环境下的个性化?/div>
荐提供了(jin)一条有效途径?/div>
商品搭配推荐是个性化推荐中的一个新Ҏ(gu)Q?/div>
它从用户消费行ؓ(f)中挖掘信息,比相似推荐更具实
际意义。例如,用户|购一件衬衫后Q通常?x)选购
一条裤子来搭配Q而不?x)再L览衬衫。生成这?/div>
搭配信息最直接的做法是人工标定Q让众多搭配?/div>
家来手工标定哪些商品是相搭配的。在传统商业
中商品数量少Q这一Ҏ(gu)h可行性;而在如今?/div>
?sh)商中,用户和商品的数量巨大Q虽然可以通过?/div>
包(Qrowdsourcing)(j)Q5Q等 ????????注,?/div>
成本?x)非帔R。例如阿里众包需要给每位参与?/div>
一定的酬劳。因此,关于如何自动化地生成商品?/div>
的搭配信息的研究Q对学术界和工业界分别具有较
高的学术研究价值和qK的应用前景?/div>
在学术界Q国内外许多大学和研I机构对商品
搭配大数据推荐方法开展了(jin)q泛的研IӞ涌现Z(jin)
各具特色的搭配推荐方法。例如将L(fng)经|络
引入搭配推荐Q自动提取数据特征;对用戯为和
商品信息q行qo(h)、徏模,挖掘商品间的搭配关系
{。但是,目前搭配推荐的研I还存在一些挑战与
问题Q例如,多源异构数据的融合;商品cȝ更细_?/div>
度的划分Q商品图像背景复杂,l图像内容识别带
来了(jin)巨大的挑战等Q6Q?/div>
在工业界Q由于互联网公司的竞争越来越Ȁ
烈,而且用户是最重要的资源,因此只有不断地提
升用户体验,才能防止用户失。随着用户个性化
需求的增强Q互联网公司对商品搭配推荐的研究?/div>
来越重视。例如,阉K云D办了(jin)面向全社?x)开攄
淘宝I搭配法竞赛Q报名和参赛无时间限制ƈ
提供怹排行榜,只ؓ(f)能给用户提供优质、专业的
个性化I搭配推荐。目前,商品搭配推荐Ҏ(gu)?/div>
在各大电(sh)商^台有?jin)不同程度的应用Q有效地提升
?jin)?sh)商系l推荐结果的准确度、覆盖率、新颖性和
多样性。根???|??道,Q0Q7q???|?l???/div>
总额高达Q7Q0Q亿元,同比增长Q0Q1Q。作Z
z最大的购物|站淘宝|更是在Q0Q8q双十一?/div>
Ƣ节创下?jin)单日交易2Q3Q亿元的记录Q表现出?/div>
我国?sh)子商务蓬勃发展的活力EQ]。对用户而言Q有
效的搭配推荐解决?jin)用户在量商品中发现自?/div>
所需商品耗时长的问题Q带来了(jin)更好的购物体验;
同时Q对商家而言Q搭配推荐可以促(j)q用戯买或
点击行ؓ(f)的发生,提高商品销量,增加l济收入Q具
有重要的商业意义?/div>
到目 ??止,关于传统推荐Ҏ(gu)的研 I?l?/div>
qEQ,Q,Q,Q]已有不少Q但q些Ҏ(gu)只是针对商品的相
似推荐,很少提及(qing)搭配推荐。本文是W1专门对
现有搭配推荐Ҏ(gu)q行研究的综qͼ针对已有的研
I成果进????较、综 q??l?q???????/div>
望,Z事研I搭配推荐方法的学者和业界人士?/div>
供借鉴与参考,以期商品搭配大数据推荐方法在?/div>
术界q一步推动推荐技术的发展Q在工业界创造出
更高的商业h(hun)倹{?Q?概述
Q.Q?商品的搭配推荐和度量
商品搭配推荐是从商品信息、用户信息及(qing)用户
与商品的交互行ؓ(f){大量数据中挖掘商品之间?/div>
搭配关系Q根据用户已l购买的商品向其推荐可搭
配商品,或直接向用户推荐搭配好的商品套装。商
品搭配推荐一直是个备受h们关注的问题Q与其相
关的工作最早可以追溯到频繁w挖掘Qurequen?/div>
QtemQsetQiningQEQ0Q。该Ҏ(gu)通过分析商品 ??/div>
史购买记录来生成搭配关系Q即l常被共同购买的
商品可能是相搭配的,最l典的案例便?ldquo;啤酒”?“布”?/div>
但是Q频J项集挖掘依赖于商品的历史购买记
?鑫等Q商品搭配大数据推荐Ҏ(gu)研究lD Q3
录,所以存?ldquo;冷启?rdquo;问题Q即无法为那些没有历
史购买记录的新商品生成搭配信息EQ1Q。ؓ(f)?jin)解?/div>
冷启动问题,需要引入除历史记录以外的其他信
息,比如????QEontentQbasedQ等。相 ???/div>
记录信息Q内容信息更为稠密,且不?x)出现老商?/div>
有信息而新商品没有信息的情况,因ؓ(f)所有商品都
有自qcȝ、标题及(qing)囑փ{信息,从根本上克服
?jin)冷启动问题?/div>
商品搭配度表C2个商品之间的搭配E度Q可
以用来生每个商品对应的搭配商品列表。关?/div>
商品搭配度的数学定义Q研I者们从不同角度给?/div>
?jin)不同??式,相关内容见文献EQ,Q2Q1Q]。本 ?/div>
分别选取西南交通大学孙q\Q6Q在其博士论文中
l出的商品搭配度定义和浙江大学钊EQ4Q在其硕
士论文中l出的搭配度计算公式详作介绍?Q1Q对于2件商品,如果大量用户一赯乎ͼ?/div>
明它们在某些斚w是搭配的Q搭配度的取gؓ(f)Q0Q?Q]Q如式(Q)(j)所C:(x) QP Q?Q,Q?≥Q?Q.Q,Q< Q?Qu Q,Q?Q?烅烄?Q?Q1Q?/div>
其中QN 是购 ?????量;Q???|???需
求自行设|。搭配度的粒度可以划分得更细Q这?/div>
划分?jin)3个等U,对于一般需求也是够的?Q2Q钊EQ4Q提 ?????????????/div>
搭配推荐Q设计了(jin)一个对拍卷U神l网l(QIames?/div>
QonvolutionalNeuralNetworkQ对 Q??????/div>
所l成的短文本对进行徏模:(x)首先Q通过L(fng)经
|络每个商品的标题表示为1个多l实数向量;
然后Q将实数向量映射到特定的搭配I间中;最后,
在搭配空间中计算Q个商品间的搭配度,计算公式
如式Q2Q所C:(x) p(y=Q|q,c)(j)Q?sigma;QxQ_(d)Qx?QbQ= Q?Q+e-QxQ_(d)Qxc+b)(j) Q2Q?/div>
其中Q如果2个商品q与c相搭配,则标定yQ1Q否
则标定yQ0。通过L(fng)经|络分别2个商?/div>
的标题映?????量x?∈QԌ 与x?isin;QԌ 。 ∈ QԌ×n是搭配 ?阵,把它所张成的空间称为搭配空
_(d)b是一个标量,矩阵 Q?与b 都是模型训练q程
中需?????数。对xa U???换x′?QxQ_(d)Q,Q?/div>
表示对矩阵{|,?prime;q表 C?与q 最 ????式,??/div>
与q最?????与x′q线性核距离最q的商品?/div>
通过在亚马逊和淘宝q2个数据集上的实验表明Q?/div>
该方法能够有效地提高搭配推荐的准度?/div>
Q.Q?研究内容
单而言Q商品搭配推荐就是依据一定的输入
数据遵@ ???????l???????l?果?/div>
输入数据有多U多L(fng)cdQ包括商品内容信息?/div>
用户属性信息、用户对商品的行Z息、领域知?/div>
{。推荐结果则是推荐给用户的商品列表,按照?/div>
配算法计的搭配E度的优先别展现给用户?/div>
目前Q商品搭配大数据推荐Ҏ(gu)的研I内容主
要包括以下几个方面:(x) Q1Q商品图像的特征提取。深度卷U神l网l?/div>
的层ơ结构可以对囑փ语义特征q行表示Q这也
得其在许 ????c???????????功?/div>
通过L(fng)经|络对商品图像进行特征提取,可以
计算商品囑փ特征的相似度来进行商品搭配推荐?Q2Q多 ???????合。由 ??????/div>
栗结 ??杂,?I?????????宏V领 ??/div>
识、用户交互的角度Q分别徏立商品搭配度度量?/div>
型,表示商品之间的搭配程度。通过各U数据融
合到搭配推荐技术中Q可以根据用L(fng)需求和?fn)?/div>
推荐不同的搭配方案?Q3Q挖掘商品间的搭配关pR在搭配推荐中,
商品间的关系是重要的基础信息。通过对商品内
容信息、用户属性信息和用户对商品的行ؓ(f)信息q?/div>
行过滤、徏模等处理Q可以挖掘商品间的搭配关p,
从而应用于搭配推荐Ҏ(gu)中?Q4Q多U搭配推荐算法的融合。目前,搭配?/div>
荐算法各L(fng)艌Ӏ例如,Z商品内容的搭配推?/div>
反映大部分h的搭配偏好,Z协同qo(h)的搭配推
荐更具个性化。如果将q2U算法融合再l合?/div>
荐,则可以满用户对于推荐结果同时兼备个性化
和流行性的推荐需求?/div>
Q.Q?应用实例
在电(sh)子商务的推动下,商品搭配推荐pȝ一?/div>
保持着较高的研I热度。表Q给Z(jin)商品搭配?/div>
荐系l在国内外商业领域的典型应用Q应用领域涉
?qing)?sh)商网站、服?QPQ和饮食 QPQ?/div>
Q_(d)ble1 Q_(d)picalapplicationsofbigdata
recommendationmethodsofcommoditycollocatio?/div>
表1 商品搭配大数据推荐方法的典型应用
应用领域 应用名称
?sh)商|站 淘宝|,京东商城QAmazon,唯品?/div>
服装 QPQ?I助手Q衣,品?x)潮百?/div>
饮食 QPQ?食物搭配大全Q薄荷健P妙健?/div>
以淘宝网ZQ它的搭配推荐应用在pȝ中的
Q3 QomputerQngineering& QIienc?计算机工E与U学 Q0Q0Q4Q(Q)(j)
很多地方Q具体包括:(x) Q1Q收藏夹面。根据用h藏的商品l出?/div>
配推荐。在该页面中Q左侧一列展CZ(jin)用户收藏?/div>
里面的商品,??????“???rdquo;?V点 ?/div>
该选项后便?x)展C搭配推荐结果?Q2Q商品的详情面。例如,览淘宝|时?/div>
入一件商品的详情面Q然后向下滑动页面,
在商品的参数、评L(fng)信息下方展示?jin)根据该商?/div>
推荐的可搭配商品。目前,淘宝|只有部分商品附
带这个搭配推荐模块?Q3Q加入购物R面。用户将感兴的商品?/div>
入购物R后,向用h荐与已经加购的商品相搭配
的商品?Q?商品搭配推荐Ҏ(gu)分类
目前Q学术界和工业界Ҏ(gu)荐系l类型ƈ没有
l一的划分标准,传统的推荐方法主要包括协同过
滤推荐、基于内容的推荐和合推荐。本文通过?/div>
分调研当前商品搭配推荐方法的研究情况Q根据推
荐方法中使用的文本、图像数据类型ƈl合传统?/div>
荐方法的分类Q将当前的研I主要分为如下3cR?/div>
Q.Q?Z商品内容的搭配推?/div>
Z商品内容的搭配推荐关注商品的内在?/div>
性信息,通过内容相关性进行搭配推荐,可以有效
地解军_启动问题Q1Q]。商品内容一般包括文本信
息与囑փ信息。文本信息有标题、h(hun)格和商品cȝ
{,囑փ信息可以通过深度学习(fn)技术进行处理,?/div>
而生成搭配信息。在具体的搭配场景中Q图像一?/div>
聚焦于服饰类商品的搭配推荐,而标题一般用于常
规商品的搭配推荐?Q1Q基于商品图像的搭配推荐?/div>
本文从图像处理技术上分别介绍研究者们?/div>
出的Z商品囑փ的搭配推荐?①基于分割理解图像的搭配推荐。Jagadeesh
{hQ1Q]通过 ???ԌQmageSegmentation)(j)??/div>
从街头照片中直接解析出相搭配的衣服,他们假设
街头照片中h们所I的服是相搭配的,因此通过
囑փ分割法把不同的服从图像中分割出来后,
q些衣服便Ş 成了(jin)h搭配关系的商品?/div>
Qamaguchi等人EQ8Q通过计算视觉上的怼来扩?/div>
由图像分割所生成的搭配信息。Di等人EQ9Q则做了(jin)
更进一步的探烦(ch)Q关注于样式相关的精l化属性信
息,比如是否有纽扣、帽子等。他们首先以人工?/div>
式精l化地标定了(jin)若干服QŞ成数据集 QPuQ,?/div>
后利用这一数据集徏立vZ属性搭配的服装?/div>
配模型。②ZL(fng)经|络处理囑փ的搭配推荐?/div>
目前深度学习(fn)已成Z联网大数据和人工?/div>
一个研I热 潮EQ0Q,?U??l?|?l????????/div>
一U重要的应用模型Q能较好地解军_像中出现?/div>
复杂多变、低分L率等问题Q在囑փ处理领域得到
?jin)????用EQ1Q?Qcaule?{?人EQ2Q与 QӞit {?人EQ3Q通过囑փ信息为所有类别中的商品生成搭?/div>
信息。他们先利用L(fng)经|络处理商品的图?/div>
信息Q再利用囑փ中所反映的相似性来衡量商品?/div>
的搭配程度。文献EQ4Q提Z(jin)Z深度学习(fn)的搭
配推荐系l,首先Ҏ(gu)用户的历史购买数据筛选出
召回集;其次通过计算商品标题文本信息的余弦相
似度Q获得待预测搭配商品的召回集Q然后通过?/div>
配类别过?q?????????????合EQ5Q;
最l,通过L(fng)经|络提取囑փ特征Qƈ使用?/div>
辑回归模型计召回集同测试集的搭配概率,利用
该概率对融合召回集进行修正重排序Q从而向用户
提供搭配推荐Q进行关联销售。实验表明,使用?/div>
U神l网l提取的特征在逻辑回归模型中会(x)产生
较好的分cL果,提高?jin)搭配推荐的准确度?br />
|