红枣黑变过程中主要成分连续变化模拟方法

2018-07-28 09:46周虎张承明张仁堂杨晓霞陈岩
科教导刊·电子版 2018年15期
关键词:插值法样条时序

周虎 张承明 张仁堂 杨晓霞 陈岩

摘 要 准确完整地模拟红枣黑变过程中主要成分的连续变化过程,对于明确黑变过程中的变化机理、提高成品质量具有重要的意义。论文首先分析了黑变过程中主要成分变化的时序状态特征,明确模拟过程中必须同时考虑状态变化信息和数值变化信息,选择能够模拟时序状态变化的长短时间记忆网络(Long Short Term Memory networks,LSTM)作为基础方法;然后根据实验数据采集困难,状态间相关性强的特点,构建卷积长短时间记忆网络模型(Convolutional Long Short Term Memory networks,LSTM ,CLSTM),设计了模型的训练方法,使新模型能够较好地模拟黑变过程主要成分连续变化;选择糠醛为实验对象进行了数值模拟实验,并使用最近插值法、为阶梯插值、线性插值法、2阶B样条曲线插值、3阶B样条曲线插值法作為对比方法,实验分析结果表明,本文提出的方法在平均方差、平均误差、最大误差、最小误差等各个指标上增多明显优于其它方法,能够更好地捕捉黑变过程中主要成分的变化特征,对于揭示黑变过程机理,具有重要的参考和借鉴价值。

关键词 红枣 黑变过程 时序变化 卷积长短时间记忆网络模型

中图分类号:TS255 文献标识码:A

0引言

红枣是我国所特有的果蔬资源,具有极高的营养价值,素有“木本粮食,滋补佳品”的美誉,具有药食两用价值,富含有糖、蛋白质、粗脂肪、粗纤维、磷、钙、铁、钾、胡萝卜素、硫胺素、核黄素、尼克酸等。红枣中还含有18种氨基酸,包括8种人体必须氨基酸和婴儿体内无法合成的精氨酸和组氨酸。另外,红枣中含有环磷酸腺苷、多糖、三萜类化合物、黄酮等生理活性物质,对人体健康起到有益作用。但是由于红枣本身的含糖量过高,造成了部分不耐糖及糖尿病患者不敢食用。研究者在对红枣加工过程中,通过控制温度和湿度,在不添加任何添加剂的情况下,使红枣经过一段时间的高温熟化,通过黑变过程形成黑枣。通过黑变这一深加工过程,能够较明显地降低了蔗糖含量,升高了还原糖、总酸、果糖、糠醛等有益成分,同时能够使得到的黑枣具有较强的生理活性,更适合于糖尿病及高血糖、糖耐偏高人群及现代消费者的健康要求,显著提高红枣的附加值。

但由于红枣黑变过程中各种物质变化复杂,其品质形成,特别是所含成分的变化机理尚不清楚,迫切需要研究影响黑枣品质形成的因素,成分变化规律及机理,以达到有效控制黑变过程,控制环磷酸腺苷的减少,促进其功能物质的生成,保证黑枣产品的品质、功能作用和安全性,提高人群适用范围的目标。([1]张仁堂, 乔旭光, 谷端银, 等. 固态发酵黑枣深加工技术研究进展及其产业发展趋势[A]. 第四届农产品产地初加工科技交流大会论文集[C], 2017年)

由于红枣黑变是在密封的环境中进行的,直接获取红枣变化过程的成分含量的边续变化极为困难,唯一有效的通途就是利用化学实验手段,定期获取黑变过程中主要成分的含量,在此基础上通过数学模拟的手段,推测变化过程,捕捉变化的特征。数学插值是将离散量模拟得到边续量的常用方法,主要有最近插值法、为阶梯插值、线性插值法、2阶B样条曲线插值、3阶B样条曲线插值法等方法,但这些方法不能考虑样本的状态间的强关联关系,得到的结果很难捕捉黑变过程中主要成分的变化特征,达不到揭示变化机理的目的。

随着人们在深度学习方面研究的不断深入,研究者提出并发展了能够有效表征状态间迁移关系的长短时间记忆网络(Long Short Term Memory networks,LSTM),该模型最初是为处理时序信息提出来的,LSTM网络模型最大的特点就是能够在数据处理过程中有效地表达前后一段时间内的状态间的迁移关系,使前一状态对后一状态的影响能够充分表达,因而非常适合时序信号的处理。在研究者的不断努力下,LSTM及其变形在时序信号处理上取得了明显的成功。

目前,LSTM模型主要应用在语音识别、语言建模、网络监测、文本识别等领域,已公开的文献中尚没发现将其应用于食品加工过程中成分变化模拟问题。从前面的分析可以看出,由于食品加工过程中成分变化的时序相关性强的特点,用LSTM模型作为工具是非常合适的。本文正是从这一思想出发,以LSTM模型为基础开展红枣黑变过程中主要成分连续变化模拟研究,以期能够更好地捕捉糠醛、总酸、还原糖、果糖等主要成分的变化特征,揭示变化机理。进一步改善加工工艺,获取质量更佳的黑枣产品。

1模拟方法

LSTM模型的基础原理在文献[1]中已经有非常详细的介绍,本文重点是在LSTM模型的基础上,根据黑变实验过程的特点,搭建适宜的模型并制定训练方法。

1.1 CLSTM模型构建

由于黑变需要在密封的环境中进行的,为了尽可能保持黑变过程的连续性,采样的间隔应尽可能长,但过长的时间间隔可能会导致失去变化过程中的观测点,本文实验中,采取每6小时取样一次,以尽可能多地获取变化的细节信息。尽管如此,由于黑变的过程一般只有96个小时,样本量仍然偏少,直接利用原始数据进行模拟的偏差仍然较大。

利用小波分析在信号处理方面的优势,将原始的时间序列数据分解成低频和高频两部分,其中低频部分是信号的近似部分,代表了数据的整体特征,高频部分是信号的细节部分,代表了数据的细节特征,例如信号的局部跳变等。对信息的低频部分不再进行处理,直接作为LSTM的输入;而高频部分则通过卷积综合样本点的细节特征,形成全局化的特征描述信息,再作为LSTM的输入;最后通过LSTM得到模拟结果。CLTSM模型整体结构如图1所示。

CLSTM模型结构最大的优势在于综合利用了人工先验知识和LSTM的自学习优势,有效克服样本点少的问题,保证能够捕捉到样本的全局分布特征和局部分分布特征。

1.2模型训练方法

在构造CLSTM模型过程中,本文通过最小化模型输出参数与检验点参数间误差平方和方法进行模型训练。对于结点数为M输入序列L,其误差函数定义为:

(1)

其中,和分别表示真实值与模型输出

2模拟实验

2.1实验设计

实验设计分为化学实验和数值实验两个部分,其中化学实验的目的是获取时序的糠醛观测值,每组实验分三个独立组进行,取平均值作为样点值。(5-羟甲基糠醛(5-HMF)检测方法:称取5g黑枣泥于50ml烧杯中,加入10ml甲醇溶解,捣碎搅匀,加入少量水磁力搅拌10min,转移至50ml棕色容量瓶中用水稀释至刻度,充分混匀,超声30min,过滤,弃去初滤液,后续滤液过0.45 m有机滤膜至进样瓶,进行液相分析。重复以上操作三次,进行三个平行样准备。)

数值实验从化学实验得到的实测数据中随机抽取了20组作为数据源进行模拟。为了更好地观测CLSTM模型的性能,对每一组数据同时选择了最近插值法、为阶梯插值、线性插值法、2阶B样条曲线插值、3阶B样条曲线插值法作为对比方法,选择平均方差、平均误差、最大误差、最小误差等4个指标作为考察指标。

2.2实验结果与讨论

图2和图3给出了其中一组对比实验的情况。

图3中, nearest表示最近插值法,zero表示阶梯插值法,slinear表示线性插值,quadratic表示2阶B样条曲线插值,cubic表示3阶B样条曲线插值,表1给出了各组实验的综合对比分析情况(百分比)

表1:各组实验的综合对比分析情况

3结论

本文针对准确完整地模拟红枣黑变过程中主要成分的连续变化过程的需要,从黑变过程的机理和样点数据特点出发,以能够模拟时序状态变化的LSTM为基础方法;构建了CLSTM。实验表明,CLSTM方法在平均方差、平均误差、最大误差、最小误差等各个指标上增多明显优于其它方法,能够更好地捕捉黑变过程中主要成分的全局变化特征和局部分變化特征,对于揭示黑变过程机理,具有重要的参考和借鉴价值,能够进一步促进红枣黑变过程的的质量。

基金项目:山东省重点研发计划项目“红枣微发酵工艺关键技术研究与产品开发”(项目编号:2016GNC113015);山东省2017年度农业重大应用技术创新项目“高附加值固态发酵黑枣深加工关键技术集成与产业化”。

参考文献

[1] Graves,A.Supervised Sequence Labelling with Recurrent Neural Networks[J].Textbook,Studies inComputational Intelligence,Springer,2012.

[2] 舒帆,屈丹,张文林,等.采用长短时记忆网络的低资源语音识别方法[J].西安交通大学学报,2017,51(10):120-127.

[3] 刘加,张卫强.低资源语音识别若干关键技术研究进展[J].数据采集与处理,2017,32(02):205-220.

[4] 张瑞茂,彭杰锋,吴恙.融合语义知识的深度表达学习及在视觉理解中的应用[J].计算机研究与发展,2017,54(6):1251-1266

[5] 阳珊,樊博,谢磊等.基于BLSTM-RNN的语音驱动逼真面部动画合成[J].清华大学学报(自然科学版),2017,57(03):250-256.

[6] 张亮,黄曙光,石昭祥.基于LSTM型RNN的CAPTCHA识别方法[J].模式识别与人工智,2011,24(01):40-48

[7] 黄步添,刘琦,何钦等.基于语义嵌入模型与交易信息的智能合约自动分类系统[J].自动化学报,2017,43(09):1531-1543.

猜你喜欢
插值法样条时序
一元五次B样条拟插值研究
基于Sentinel-2时序NDVI的麦冬识别研究
三次参数样条在机床高速高精加工中的应用
基于FPGA 的时序信号光纤传输系统
基于样条函数的高精度电子秤设计
一种毫米波放大器时序直流电源的设计
基于二次插值法的布谷鸟搜索算法研究
Newton插值法在光伏发电最大功率跟踪中的应用
DPBUS时序及其设定方法
无网格局部径向点插值法求解Helmholtz方程