论文网
首页 理科毕业电子商务毕业正文

都柏林核心思想在电子商务信息组织中的应用

  • 投稿小瑞
  • 更新时间2015-09-28
  • 阅读量627次
  • 评分4
  • 83
  • 0

方 圣1,2

(1华中师范大学湖北省电子商务研究中心 2华中师范大学信息管理学院 湖北 武汉 430079)

摘 要:探索在电子商务信息组织中应用都柏林核心思想,通过规范网上商品的描述,消费者能够快捷地从电子商务平台中找到符合自己要求的商品。另一方面,通过对消费者进行部分特征标引,商家可以采取更精准有效的营销策略,提高交易的成功率。

教育期刊网 http://www.jyqkw.com
关键词 :都柏林核心;电子商务;特征描述

中图分类号:F7.36 文献标识码:A doi:10.3969/j.issn.1665-2272.2015.01.013

电子商务的发展如火如荼,它正深刻地改变着我们传统的消费习惯、支付方式以及物流体系等等,使我们的生活更加便捷。它对传统商务方式造成了极大的冲击,越来越多的企业和个人愿意尝试电子商务并深受影响。正是因为如此,电子商务平台上的商品发生爆炸性地增长,对于消费者所需商品的检索,查全率早已不成问题,而要找到自己心仪的却越来越困难,我们对电子商务平台的查准率提出了更高的要求。如果我们可以借助于都柏林核心的思想,加深电子商务中产品描述的层次,从其根本属性进行检索,并有针对地对客户进行部分特征描述,这将提高我们检索商品的效率和交易的成功率。

1 都柏林核心集及其优势

1.1 都柏林核心集概念

元数据是实现数字资源共建、认知、共享的核心内容之一,不仅用来规范描述数字资源,而且用于组织、管理和挖掘数字资源,是数字信息体系的重要基础。通俗来讲,元数据是关于数据的数据,是对信息资源的内容、外在形式等方面信息的集合。对日益增长的网络信息资源的组织和整理而言,元数据的重要意义在于:一方面,元数据可以提供信息资源有关本质和内容的信息;另一方面,元数据可提供网络信息资源的确定位置。都柏林核心集作为元数据的一种,诞生于1995年3月由联机计算机图书馆中心(OCLC)与国家超级计算应用中心(NCSA)联合发起召开的第一次都柏林核心集会议。会议目的是希望建立一套简单通用的描述网络资源的方法,以提高网络资源的利用率和降低检索的难度。后来经过多次不断的修正和增加,逐渐形成DC元数据标准,其基本方案是包括15个“核心元素”的集合,包括名称(Title);创作者(Creator)、主题及教育期刊网 http://www.jyqkw.com
关键词 (Subject and Keywords)、说明(Description)、出版者(Publisher)、发行者(Contributor)、时间(Date)、类型(Type)、格式(Format)、标识(Identifier)、来源(Source)、语言(Language)、相关资源(Relation)、范围(Coverage)、版权(Rights)。纵观上述15项元数据,可以看出:首先,它基本描述了网络资源的主要特征,涵盖了资源的重要检索点(名称,创作者,主题及教育期刊网 http://www.jyqkw.com
关键词 ),辅助检索点或关联检索点(出版者,发行者,标识,来源,相关资源),以及有价值的说明性信息(说明,时间,类型,格式,语言,范围,版权)。其次是它的可扩展性,它允许使用者为了特定的目的或在特定的学科领域可以增加一些必须的著录信息。

1.2 都柏林核心的优势

非结构化的描述如简单标引,优点是简便易行,收集信息时无需考虑其学科领域、信息的结构以及目的,具有相当高的查全率,但查准率一般比较差。高结构化的元数据如MARC(MAchine-Readable Cataloging),要生成和保持记录的费用极高,但是能带来较高的查准率以及一致性。都柏林核心的描述方式介于两个极端之间,目的是达到中等的查准率以及较高的相互可操作性,同时又不会大幅度提高生成和保存的成本。面对每天产生的海量网络信息资源,由专业人员进行著录已经是不可能的了,而都柏林核心的设计初衷追求简洁性和灵活性,避免太过于专业或者复杂,使得非图书馆专业人员不需要进行专业培训也能够对信息资源进行合理的著录,极大地推动了网络信息资源的组织和整理工作。而且,都柏林核心并不限定于某一专业领域,还具有可扩展性和可选择性的优势。所以,它已经成为Internet的正式标准RFC2413和美国国家信息标准Z39.85,并应用到更广泛的领域中。

2 运用都柏林核心思想描述商品

2.1 电子商务平台中商品描述现状

虽然有电子商务平台对发布的商品进行部分元数据进行描述,或者通过用户设置标签来对商品进行标引,并取得了一定的效果,但该描述内容多用于分类浏览。随着越来越多的商家参与到电子商务之中,电子商务平台上存在着海量的商品。若分类浏览,每类存在的商品过多,而且可能出现单个产品多次重复的现象,浏览起来没有效率,消费者无论是从习惯或查准率出发还是倾向于教育期刊网 http://www.jyqkw.com
关键词 搜索。但在如今的电子商务平台中,网上销售的商品基本上是由卖方单方面进行简单标引,也就是只进行短语甚至是词组一级的教育期刊网 http://www.jyqkw.com
关键词 标引,优点是简单方便,具备非常高的灵活性,但缺点更加明显:为了商品易于在海量的同类中被消费者搜索到,卖家苦于心思通过多个热门教育期刊网 http://www.jyqkw.com
关键词 组合来描述自己的产品,甚至包括与本商品无关的热门教育期刊网 http://www.jyqkw.com
关键词 。由于缺乏基本的规则来规范商品描述行为,为了竞争常常会发生“劣币驱逐良币”的现象,很难保持描述的真实性。针对我国最大的B2C电子商务平台——淘宝网出现了关键字优化软件,可见关键字的设定对整个销售有着非常大的影响。商家对网上商品标引的最主要目的是曝光率而非准确率,这种非规范化的标引使得检索得到的结果会非常多,但符合消费者要求的较少,因此消费者会在搜索商品时耗费大量的时间和精力。

2.2 都柏林核心思想在商品描述中的应用

都柏林核心起源于描述大量产生的网络资源,很好解决了网络资源的存储和检索的问题。通过对用户检索需求的分析,都柏林核心15项元数据的描述涉及到了网络资源最主要的属性,帮助用户能够从多个方面检索到所需的网络资源,并有着很好的效果。因此,如果我们将电子平台上的商品看作是现已存在的网络资源的话,都柏林核心的思想也可以应用在电子商务上面。我们试图建立一套描述网上商品的标准,通过对商品特性的规范描述,有助于提高消费者搜索所需商品的效率,解决当今电子商品平台上混乱的商品描述问题。

(1)类目:按照商品的属性对商品进行分类,如淘宝网主要类目如下:女装男装、鞋类箱包、内衣配饰、运动户外、珠宝手表、数码、家电办公、护肤彩妆、母婴用品、家具建材、美食特产、日用百货、汽车摩托、文化玩乐、本地生活15大类。

(2)品牌名称:品牌是产品或服务的象征,即企业赋予该类产品的品牌名称。其中,要杜绝“山寨”品牌的发生。

(3) 货号:货号即商品编号,是商品的生产厂商对不同款的商品所标记的唯一编号,每一款商品都应该拥有一个唯一的货号,对于没有货号的不正规产品,应该杜绝其在平台上交易。

(4)生产厂商:生产该商品厂家名称。由于现在存在着许多生产外包的情况,因此品牌商无法保证所有生产地出来的商品质量一致。

(5)颜色:即商品外观的颜色。

(6) 产地:生产商品场所存在的地方名称。

(7)生产日期:商品出厂日期。

(8)材料:用于生产商品的主要材料。

(9)说明(其他):对该产品的补充说明,如产品功效、使用须知等等。

(10)适用群体(定位):可按年龄、收入、职业、消费倾向等等划分。

其中,重要检索点为类目、品牌、货号,生产厂商,颜色、产地、生产日期、材料为辅助检索点或者关联检索点,说明和适用群体为有价值的说明性信息。

当第一批商品描述数据存入系统后,后续的在用户填入品牌和货号时,系统可以根据之前存储的数据判断或者直接通过照片的相似度对比,智能匹配并自动填充剩下的内容,并不断根据用户的反馈更正结果,以至于有一个相对准确的数据。这样可以降低工作的复杂度,避免大量的重复劳动,提高效率和精确度。

此外,电子商务平台根据实际需求,如果能建立好自己的词表,还可实现用户的自然语言搜索。用户在输入自然语言搜索时,通过自建词表进行分词,去除无意义的字或短语,并将教育期刊网 http://www.jyqkw.com
关键词 与商品描述项进行匹配,最后将匹配成功的结果导出,供用户进一步选择。

通过对商品基本属性的描述,在提升教育期刊网 http://www.jyqkw.com
关键词 搜索的准确率的同时,系统也可以通过这些描述在分类浏览时提供更多的选择项,不断缩小范围,从而提高检索的效率,正所谓一举两得。

3 运用都柏林核心思想描述消费者

在这个大数据时代,无论是在购物网站还是社交网站,用户往往会产生大量的数据。电子商务平台也可以通过搜集用户的注册资料、问卷填写记录、浏览以及购买的记录,或者用户在社交网站里面产生的数据,对得到的数据挖掘其中有效的部分,来对用户进行描述归类,对用户的消费偏好进行一个预测并不断更正。电子商务平台可以对用户的消费需求作一个预先的判断,推送与其购物偏好相似的商品,而不是简单地向用户投放与最近浏览商品相似商品的广告,这种方法往往对于消费者的需求滞后,推荐的商品缺乏针对性,效果并不理想,而且卖家并没有主是放接收群体的权利。为了解决以上问题,我们也试图建立一套描述消费者的标准:

(1)性别:女性更追求美和时尚,购物的频率大于男性;在家庭中,女性是主要的购买者。而且性别不同,购买的类目也不一样。

(2)职业:学生、程序员、医生、公务员等,不同的职业有着不同消费需求。

(3)年龄:年龄段不同,购物的类别也就有所差别。例如25~30岁的人群往往由于婚姻的要求,多购买家电、家具等用品。

(4) 收入:收入的多少大致上决定了消费能力和消费品档次的高低。

(5)所在地区:地区不同,经济水平、人文风俗都不同。

(6)爱好:影响购物倾向,如体育爱好者对体育用品的需求较高。

(7)月网购消费:可进行一个大致上的分类,对目标群体重点关注。

(8)购物偏好:消费者热衷的商品类别,后期可以多投放与之相关的新品和消息。

(9)购物概率:通过数据统计找出购物发生概率最大的时间段,如周末、晚上等等,在下次购买发生之前提前做好广告投放。

通过对海量数据的收集,完成以上对用户属性的描述后,商家可以选择符合需求的消费群体进行个性服务或者广告投放,针对性加强,效果自然会提升。另一方面,消费者如果能找到更多自己需要的商品时,电子商务平台交易率自然会大幅度提高,吸引更多的消费者来购物。

4 结语

都柏林核心思想在电子商务上的应用有助于解决目前电子商务平台上商品描述混乱、消费者面对海量商品检索效率低下的困境,并且可以通过数据挖掘对消费者进行分类,以便平台或者搭载平台的商家开展更有针对性的营销和个性化服务,提升交易的成功率。

教育期刊网 http://www.jyqkw.com
参考文献

1 周维.都柏林核心集及其在Web检索中的应用[J].情报杂志,2002(6)

2 庄育飞.都柏林核心集及其价值初探[J].图书情报工作,1999(7)

3 孙广芝.元数据:网络资源共享的基础[J].情报科学,2001(7)

(责任编辑 吴 汉)