基于大数据的可视化工具探索男士衬衫的色彩分析

2018-11-12 12:32何婷彭韧唐雅琴等
设计 2018年7期
关键词:大数据

何婷 彭韧 唐雅琴等

摘要:为了让设计师更快速的了解男士衬衫的颜色分布,也为了让消费者更直观地看清男士衬衫的流行趋势,文章利用大数据技術搭建了一个可视化工具。利用该工具,用户可以在1523张男士衬衫平铺图中了解到在近三年中男士衬衫的颜色分布,也可以感受到色调的分布与变化。文章介绍了该工具搭建的现实指导意义以及理论研究意义,并阐述了数据处理与搭建过程。旨在为服装行业开辟一个直观新颖的可视化工具。

关键词:大数据 可视化工具 男士衬衫 图像配准算法 色彩分析

中图分类号:TB47 文献标识码:A

文章编号:1003-0069(2018)04-0012-03

引言

2015年五中全会“十三五”规划将大数据作为国家战略;2016年,大数据“十三五”规划将出台,其涉及的内容包括:推动大数据在工业研发、制造、产业链各环节的应用;支持服装业利用大数据建立品牌、精准营销和定制服务等。可见,大数据如今从上而下渗透在方方面面。

服装行业历史悠久,积累的数据相当可观:每一个季度、每一个品牌、每一类素材、每一件类型的服装……服装行业累积的素材应该是难以想象的。其特点完全符合IBM提出大数据的5v特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

在服装行业,每隔几年,复古流都会席卷而来。为何它们会多次出现;人们的时尚灵感来源是什么;以及复古流会是哪一类……这些大数据将会为其提供更为全方位、多层次、深感官的数据分析。传统的可视化是点线的形式展示,本文结合服装行业特色——以图片作为基础元素,将男士衬衫的色彩进行可视化归类,从而不仅给设计师提供良好的色彩分析视图,也能让普通消费者一目了然近几年的流行色趋势。

(一)现实指导意义

中国是消费大国,同时也是劳动密集型的服装生产基地。进入21世纪,世界的经济形势每年都在发生巨大变化,中国随着经济的逐步强大,服装行业需要做出行业转变,树立行业危机。随着科技的发展以及交通的便利,国内消费者的审美也在不断向国外看齐,理念逐渐成熟,服装消费不仅为了自我满足,更是有着更高的心理需求。以及中国设计师在国际舞台的崭露头角,中国设计师需要提前预测服装流行趋势。这些转变都对服装行业的信息反馈提出了更高的要求。价格是否合理和尺寸是否合适已经不能满足消费者的需求,他们更加关注面料、款式、色彩、搭配以及服装细节。在设计服装时,设计师除了需要关心面料的舒适和利润销售,更重要的是预测流行款式和流行色。传统方式上,普通消费者信息搜索普遍来源于综合搜索网站,比如腾讯、百度、360以及搜狗等。专业人士会从专业的服装网站,如:POP流行趋势、蝶讯服装网等,以及一些专业的服装设计杂志。在自媒体的火爆引流下,用户还可以在一类时尚博主的公众号了解服装信息。但,由于服装行业信息量巨大,更新速度快,以及自媒体个人的“主观审美”引导下,不论是设计师还是消费者,若其对某一类服装感兴趣,想迅速获得该服装的有效信息,无论是综合搜索网站还是专业服装网站都无法快速清晰地实现用户需求。这时,若有一个工具能够快、准、好地完成该搜索目的,对消费者抑亦或设计师都是一件事半功倍的事。

本文的可视化工具即使为此而生。它在引用专业服装网站丰富资源的基础上,加上大数据优化处理方式,将浩若星辰的图片汇聚成可视化的“银河”,让用户一目了然所需的信息。

(二)理论研究意义

不同于以往的可视化方式,该工具以图片为基本元来展示。“通过可视化,我们把信息变成一道可用眼睛来探索的风景线,一种信息地图。当你迷失在信息中,信息地图非常使用。”之所以选择图片,是因为在服装行业,基本信息均以图片为基础。除了效果图和展示图,还有搭配图和街拍图等。这使得服装行业积累了大量图片资源。随着大数据技术的日趋成熟,这类可视化工具也运用得更加广泛。本文将以男士衬衫为基本元进行探究。

衬衫作为服装行业基本且不可缺少的一类单品,其色彩款式、图案、面料,每一个方面都会影响消费者的购买欲。从女士的角度,衬衫会有各式各样的选择,影响其是否购买的原因也多种多样。一些女士,会因为一件衬衫正在打折促销而购买;也会因为一件衬衫是其喜欢的演员代言而购买;甚至会因为当时的心情好坏而购买。但,男士作为理性消费者,其购买欲大多数会围绕品牌、面料、色彩以及性价比来评估。

色彩让我们的世界不再单调,充满了活力,它在我们的生活中影响着各个方面:食物的色彩影响着人们的食欲,衣服的颜色展现一个人的气质,一座建筑物的色彩体现着它的价值所在,一辆车的色彩则体现它的美与安全。服饰是人类生活中的必需品,从古至今人类服饰由遮体保暖到现在的更注重美的存在,色彩又是映入眼帘中的第一印象,影响着人们的审美,色彩设计更是美的再创造。服装色彩是服装设计最重要的一个环节,其鲜明、强烈的视觉冲击力,给人以“先色夺人”的感觉。

对于设计师,精准地预测流行色会对服装设计有重要意义;对于消费者,了解了流行色,对其购买方向亦有很大帮助。所以分析色彩是不可缺少的一个环节。

一、可视化工具的搭建

(一)数据收集

为了准确无误地分析特征,男士衬衫的图片来自专业服装资源网站——蝶讯服装网站。总共购买了5000张包括平铺图、模特儿展示图以及街拍图。根据实验特性,选择平铺图进行计算,共计1523张图片,符合大数据特点。

(二)数据预处理

1.HSV颜色空间

图像或图像区域所对应景物的表面性质这种全局特征,称之为图像的颜色特征。通常,颜色特征描述为基于像素点的特征,所有属于图像或者图像区域的像素各自贡献着。颜色特征一般有RGB、CMYK、HIS、HSV四种特征。其中RG B是加法原色模型、CMYK是减法原色模型、Hls是从人类的视觉系统出发描述色彩、HSV则从对色泽、明暗和色调的直观特性来定义颜色。

通常,广泛应用于颜色特征提取的是HSV颜色空间。A.R.Smith在1978年提出了这种六角锥形体模型,它由色度(Hue),色饱和度(Saturation),亮度(Value)組成。在HSV颜色空间中,H表示图像的色调,饱和度s表示颜色接近光谱色的程度,亮度V表示图像的明亮程度,HSV颜色空间符合人类的视觉感知。众所周知,颜色提供了图像很多的视觉特征,人眼无法在同一时2.2.2 RG B与HSV的空间转换

RGB模式:三维坐标(如图1)

灰度线是原点到白色顶点的中轴线,在灰度线上的点在r、g、b三个分量上的值相等,三个元素组成的向量可以表示强度。色彩、深浅、明暗变化由rgb理解。黄紫青ymc色定点与三个坐标轴rgb最大分量顶点的连线表达色彩变化;原点和白色顶点的中轴线到cmy顶点和rgb顶点的距离可以表示深浅变化;明暗变化可以用中轴线的点的位置表示,越靠近原点越暗,越靠近白色顶点越亮。

HSV模式:倒锥形模型(如图2)

HSV颜色空间可以用圆锥空间模型来描述,模型中的V轴对应于RGB颜色空间中的主对角线。在圆锥顶面的圆周上的颜色,V=I,S>0为彩色。这种模型对应于画家配色的方法。H表示色彩,S表示深浅,当S为零的时候,只有灰度;V指的是明暗,及色彩的明亮程度,不过,值得关注的是这种明暗程度与光强没有直接关系。HSV模型是将RGB三维坐标的中轴线扁化,因为它只选取了RGB的一个最大分量。而RGB可以反映光照强度,v=max(r,g,b)

由RGB到HSV的转换:

设某个颜色在RGB空间中的值(r,g,b),其中r,g,b的取值区间为[0,1],令max为r,g,b中的最大值,min为r,g,b中的最小值,设该颜色在对应的HSV空间的值为(h,s,v),其中h的取值区间为[0,360],s,v的取值区间为[0,1],则转换公式如下:

(三)HSV颜色空间量化

本文这个模型中颜色的参数分别是:色调(H),饱和度(S),明度(V)。

为了分辨出相似的一类颜色,本文参考文献将HSV颜色空间量化为了72级,经量化后的颜色空间能够减少计算复杂度。实验中将RGB颜色空间转换到HSV颜色空间,根据HSV颜色空间的属性特征:H∈[0,360],S∈[0,1],V∈[0,1],量化为72柄(bin)的过程如下:

按照人类的视觉分辨能力,将H分量非均匀量化为8级,S分量和V分量量化为3级,从而由公式可得一维特征矢量,再把3个颜色分量合成一个标量:

P=QsQv H+QvS+V(4)

公式(4)中,QS,QV表示分量S,V被量化的级数,显然QS=3,QV=3则公式(4)可以表示为:P=9H+3S+V(5)

从而使得H、S、V可以在由一个标量表示。计算P可得到一个一维直方图,其中P∈(0,71)。

(四)图像特征提取

选用的男士衬衫平铺图背景几乎都是纯色,因此可以根据相邻像素颜色变化来提取出该平铺图中衬衫的区域,接着计算出衬衫区域的H、S、V、P的平均值与标准差。

上图中左边为原始图像;中间为提取出的衬衫区域,可以直观地看出,衬衫颜色均被算入;右边为衬衫区域所有像素的平均颜色,在RGB空间提取边缘,然后转化为HSV,计算出该区域的HSV平均值后,再转化为RGB值显示出来。

(五)图像可视化

为了揭示衬衫颜色的分布,分别选择颜色直方图和环形图进行展示。其中,色调关系模型采用最简单的颜色直方图,用户可以一目了然颜色分布多少。

色彩关系模型受到加州大学地亚哥分校的软件研究创新实验室所研发的视觉化软件Imageplot启发,我们计算出每个衬衫图片的H,S,V,P平均值。首先我们将平均P值作为直方图的横轴,纵轴则不同于传统直方图使用数值,而是直接将原始数据衬衫图片堆积在其对应的P值处。

环形图则是根据衬衫图片的平均H值与平均v值,将衬衫图片定位于极坐标系中Pola(ρ,θ),极点位于可视化面板中心。首先将平均H值缩放到区间[0,2π],将平均V值缩放到缩放[0,1],然后根据每个图片缩放后的平均H,V值将其放置在极坐标系中。这样在同一个半径的圆弧上,衬衫颜色的色调随角度均匀变化,在同一个角度上衬衫明亮度随半径均匀变化。

为了弥补平均值P对衬衫细节的忽略,我们根据H的标准差画,标准差越大说明图片颜色越丰富,标准差越小颜色越单调。有左到右时色调方差逐渐增加,从下到上是饱和度逐渐增加。

二、实验分析

由颜色直方图(如图3)看可以看出,色调分布在48、49两个颜色区间的衬衫明显比其他区间的多。表明浅蓝色和浅灰色的男士衬衫最多;深色系的则以深灰色和驼色为主。这两条较为符合男士春夏和秋冬穿搭习惯。但无论季节如何,浅色系的男士衬衫都是最佳选择。

由环形图(如图4)可以看出:聚集在210-270度的蓝色系男士衬衫明显多于其他色调,而且不管是浅色系还是深色系都较多,其中浅蓝色亮度较高,分布较多。深色系中,墨绿色也拥有较多,属于秋冬款。

由方差图(如图5)可见:男士衬衫饱和度普遍偏低,色调也偏向于简单,不会过于丰富;

当然,男士衬衫还会受季节、年龄、地域甚至人文文化的影响。但,总体来看男士衬衫在颜色选择上绝大多数还是容易搭配和接受的浅色系为主。

三、实验的优缺点

本实验结合了服装行业的特点,在以大量图片为素材,用可视化的方式展现了男士衬衫的颜色分布;不同于传统可视化方式,以图片为基本元展示数据,在获取统计信息的同时,可以更加直观地看到原始数据的分布。缺点是提取衬衫的平均值,会忽视多种色彩搭配的特点,因此对于衬衫图片特征的提取还需要做进一步的创新与优化。以及现有的街拍图由于颜色复杂难以提取到衬衫颜色,故对于服装搭配上仍然需要更多的实验帮助。

总结

人们为了获取有目的的信息从而进行搜索,该搜索的产品属性通常具有不确定性、复杂性-s-。不同的搜索引擎有着不同的排列顺序,这类不同的排序都会影响用户获取信息的结果。因此建立可视化工具对于有效的信息筛选有着重要意义。不论是设计师还是消费者一目了然今年的色彩分布,可以为其提供有效的信息反馈,而不是凌乱的碎片化浏览信息十分必要。

在设计领域,色彩的运用具有“画龙点睛”的意义。法国人有一句经商谚语:即使是水果蔬菜,也要像一幅静物写生画那样艺术地排列,因为商品的美感能撩起顾客的购买欲望。视觉营销也被销售行业视为重中之重。而在视觉中,色彩往往是引起人们对事物的第一感知翻反应。“从色彩开始着眼于服装设计,这是一个从局部到整体的概念”。古语有言“远看颜色近看花”,即一个物体首先映入眼帘的是色彩要素。色彩是服装的设计不可忽略的一部分。首先,色彩可以传递着装者的心情和个性;其次,它会受季节影响,春夏以浅色为主,秋冬以深色为主等;最后,色彩对服装搭配也是至关重要。一套服装,色彩搭配好了也就成功了一半。因此掌握色彩的趋势研究既是设计师所要预测的,也是消费者想要了解的信息。

猜你喜欢
大数据
基于在线教育的大数据研究
“互联网+”农产品物流业的大数据策略研究
大数据时代新闻的新变化探究
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索