相似度

  • 基于TF-IDF和word2Vec的中文文本自动摘要模型
    文本特征提取和相似度计算进行了深入研究。本文将优化的TF-IDF模型和Word2Vec模型结合起来,进而提出一种兼顾短文本统计特征和语义特征的合并加权Word2Vec和TF-IDF的文本特征提取算法,将文本进行向量化表示;随后,在文本的相似度算法中,基于短文本的特征,选取了余弦相似度算法,对短文本间相似度值进行了有效计算。实验结果表明,使用TF-IDF和Word2Vec结合模型与传统单个模型相比,生成出的文摘准确性更高,质量更好。关键词:  文本特征;相似

    中国新通信 2023年2期2023-06-24

  • 数据稀疏背景下基于协同过滤的推荐算法综述
    滤;数据稀疏;相似度1引言随着移动互联网的迅速发展,人们获取大量信息十分便捷。与此同时,如何从海量信息中高效筛选出所需内容变得十分困难。推荐系统能够在用户需求不明确或是信息量过大时,根据用户的行为判断其兴趣,提供个性化的信息以满足用户需求。另外,为提高转化率,推荐系统还能主动将有效信息推送至目标用户。因此,推荐系统既是引导用户获取需要信息的助手,又是公司驱动业务发展的重要动力。推荐系统最早被应用于电子商务网站,通常是根据用户的订单和评价来推测偏好和需求,从

    计算机应用文摘 2023年9期2023-05-30

  • 数据稀疏背景下基于协同过滤的推荐算法综述
    滤;数据稀疏;相似度1引言随着移动互联网的迅速发展,人们获取大量信息十分便捷。与此同时,如何从海量信息中高效筛选出所需内容变得十分困难。推荐系统能够在用户需求不明确或是信息量过大时,根据用户的行为判断其兴趣,提供个性化的信息以满足用户需求。另外,为提高转化率,推荐系统还能主动将有效信息推送至目标用户。因此,推荐系统既是引导用户获取需要信息的助手,又是公司驱动业务发展的重要动力。推荐系统最早被应用于电子商务网站,通常是根据用户的订单和评价来推测偏好和需求,从

    计算机应用文摘·触控 2023年9期2023-05-10

  • BERT的图模型文本摘要生成方法研究
    基于词频统计的相似度计算方法也忽略了句子的语义信息,文中选择了向量形式的相似度的计算方法用于文本摘要生成。最后在TTNews数据集上做实验,效果有了明显的提升。关键词:中文文本摘要;BERT;TextRank;相似度中图分类号:TP 391     文献标识码:A文章编号:2096-4706(2022)02-0091-06Abstract: The abstract formed by TextRank method based on graph mode

    现代信息科技 2022年2期2022-06-15

  • 基于遗传搜索的卷积神经网络结构化剪枝
    射的相似性,以相似度为适应度函数进行通道的搜索。在实验中,选择ResNet系列网络在ImageNet数据集上的剪枝性能进行评估,与现有的神经网络剪枝算法相比,该模型不仅具有更高的剪枝率,而且具有更好的精度。关键词:神经网络剪枝;遗传算法;特征映射;相似度;小波分解中图分类号:TP391      文献标识码:A文章编号:1009-3044(2022)11-0004-031 概述神经网络剪枝被广泛用于降低深度卷积神经网络在资源有限设备中的计算成本。人们提出了

    电脑知识与技术 2022年11期2022-05-31

  • 基于模糊聚类和Slope One填充的推荐算法
    ,并通过改进的相似度计算方法计算出用户间的相似度得出最近邻结果集。仿真对比实验表明,设计的算法对比传统的推荐算法在精度上有着很大提升,同时能缓解数据稀疏性,提升推荐质量。关键词:协同过滤;模糊聚类;Slope One;相似度中图分类号:TP391      文献标识码:A文章编号:1009-3044(2022)10-0068-031 引言由于信息网络的高速增长,世界各地的数据量也正疯狂增加,据有关组织报告称,估计到2025年,世界各地的数据量将会达到惊人的

    电脑知识与技术 2022年10期2022-05-30

  • 利用循环翻译提高维汉机器翻译性能实践探究
    BERT及多种相似度计算方法融合等进行深入对比分析,并提供详细的统计分析。通过实验发现循环翻译在很大程度上可以隐式地区分不同领域的数据。CCMT19维汉翻译任务上,通过将不同筛选方法的融合,翻译性能有1.95个bleu的提升。关键词:反向翻译;循环翻译;筛选;相似度中图分类号:TP183      文献标识码:A文章编号:1009-3044(2022)22-0001-041 引言在拥有大规模数据的语言对上,神经网络机器翻译(NMT) [1-2]获得了令人瞩

    电脑知识与技术 2022年22期2022-05-30

  • 基于KL散度的ALS推荐算法
    S算法计算物品相似度时只考虑了用户之间的共同评分项,得到的相似性与真实值会有一定的误差,而采用KL散度计算物品相似度时,对用户评论的数量不做任何限制,不依赖于用户共同评分项。KL-ALS算法首先将ALS算法计算物品相似度和KL散度计算的物品相似度按照一定权重混合,产生总体相似度,进而采用ALS算法训练模型,能够更加准确地度量物品间的相似度,改善推荐效果。实验选取亚马逊智能产品评论数据集,与传统的基于ALS的协同过滤推荐算法和基于物品的协同过滤推荐算法(It

    电脑知识与技术 2022年12期2022-05-29

  • 面向阅读推广评论数据的书目个性化推荐方法探究*
    用余弦定理进行相似度计算,然后根据计算结果、融合读者背景信息进行个性化的书目推荐。实验结果表明,论文构建的书目推荐方法能够依据读者参加的阅读推广活动的内容进行相关书目的推荐,拓展了图书馆阅读推广服务有关研究的应用范围,为图书馆书目的采购与推荐工作提供了有益的参考。关键词 LDA 困惑度 相似度 推荐方法分类号 G251.4DOI 10.16810/j.cnki.1672-514X.2021.10.006Research on Bibliographic P

    新世纪图书馆 2021年10期2021-11-18

  • 乌珠穆沁羊、杜泊羊和萨福克羊脂肪酸指纹图谱的建立
    药色谱指纹图谱相似度评价系统软件进行指纹图谱相似度分析和主成分分析。结果表明:杜泊羊和萨福克羊背最长肌脂肪酸指纹图谱相似度为0.991,杜泊羊和乌珠穆沁羊背最长肌脂肪酸指纹图谱相似度为0.987,萨福克羊和乌珠穆沁羊背最长肌脂肪酸指纹图谱相似度为0.994。3 种羊背最长肌脂肪酸指纹图谱中共存在12 个共有峰,以硬脂酸(C18:0)色谱峰为参比峰,对12 个共有峰的保留时间和相对峰面积进行主成分分析,可准确鉴别以上3 个品种羊。关键词:脂肪酸;指纹图谱;乌

    肉类研究 2021年8期2021-09-17

  • 模糊区间型综合决策方法在水质评价中的应用
    水质标准区间的相似度判定,基于优化主客观综合赋权法开展水质指标赋权,并采用模糊综合评价法计算待测水体模糊综合评价指数,确定水质类别。将模糊区间型多属性综合评价模型应用于大伙房水库暴雨后水质变化分析的实例表明:评价模型生成的模糊综合评价指数可以区分出同类水质的优劣,改进模型适用于特大暴雨等突发污染事故的水质评价研究。关键词:水质评价;模糊数学;区间数;多属性决策;相似度;组合赋权;模糊评价综合指数中图分类号:X824;TV697.1+9 文献标志码:Adoi

    人民黄河 2021年5期2021-07-08

  • 航空机载企业基于零件工艺编码的相似工艺智能推送研究
    层次分析模型、相似度计算模型和优劣解距离法计算模型,实现了零件工艺编码、零件工艺库以及相似工艺智能推理的管理,并高度集成至PLM/CAPP系统,实现了相似零件工艺的智能推送,大幅度提高了工艺设计的效率及质量。关键词:零件工艺编码;工艺设计;相似度;特征;筒体1 引言在当前“订单周期越来越紧,品质要求越来越高,需求变化越来越频”的形势下,工艺作为设计与制造的桥梁,工艺设计如何快速响应,满足要求,提高效益,是航空机载企业面临的普遍难题。航空机载产品大多具有多品

    智能制造 2021年2期2021-07-06

  • 基于DTW算法的窟野河流域水文情势相似度研究
    响期的水文情势相似度。结果表明:①水土保持措施和煤矿开采均大幅减小了窟野河的径流量,其中煤矿开采的采空区储存水量减水效应大于水土保持措施涵养水源的作用;②人类活动弱干扰时期(第一时期)、水土保持时期(第二时期)和煤矿开采时期(第三时期)两两之间的DTW距离分别为0.13(第一、二时期)、0.19(第一、三时期)和0.17(第二、三时期),说明水土保持措施和煤矿开采对流域水文情势的影响效果较为相似;③煤矿开采对非汛期流量、基流的影响历时、最大流量出现时间、大

    人民黄河 2021年4期2021-04-27

  • 重合波检测的匹配滤波法提取胎儿心电
    匹配滤波法以及相似度的计算,获得胎儿心电。实验结果显示,对MIT Physio Net/Cin C2013数据库中存在母亲心电与胎儿心电重合波的母体腹部心电信号,提取的胎儿心电准确率达到92%,与传统匹配滤波法提取的胎儿心电相比,准确率得到提高。关键词:胎儿心电信号;小波分析;匹配滤波;相似度DOI:10.15938/j.jhust.2021.05.012中图分类号:TN911.7 文献标志码:A 文章编号:1007-2683(2021)05-0091-0

    哈尔滨理工大学学报 2021年5期2021-01-16

  • 基于相似度的高校图书馆员工适岗能力评价研究
    评价体系,运用相似度方法确定高校图书馆员工能力的优劣排序,并通过实例进行了验证,具有较强的操作性和可行性。【关键词】图书馆员工;适岗能力;评价指标;相似度高素质的图书馆员工有助于高校图书馆开展学科建设。当前高校图书馆的主要职能是推进科研活动,为提供高校师生科研以及学习所需要的文献资料、发布知识信息以及学习共享空间等。高校图书馆员工作为“图书馆构成要素中最活泼、最积极、最起决定意义的要素”,对图书馆员工适岗能力考查。一方面,能够提升高校图书馆人才队伍的整体素

    办公室业务·上半月 2020年10期2020-11-17

  • 蚁群优化聚类算法在企业效率提升方面的应用研究
    法二维网格定义相似度参数,计算数据的捡拾概率和遗弃概率;根据算法的4个聚类阶段,实现对企业资源的合理分配,从而提升企业效率。实验结果表明:与3种常规方法相比,所提算法具有极强的全局性分析能力,因而在企业效率提升方面的应用效果更佳。由此可见,蚁群优化聚类算法的应用更能满足企业的发展现状。关键词: 蚁群优化聚类算法; 企业效率; 粗糙集; 相似度; 捡拾概率; 遗弃概率; 聚类与分配中图分类号: TN911.1?34; TP391.4             

    现代电子技术 2020年17期2020-09-21

  • 基于UPLC指纹图谱的厚朴药材去粗皮质量评价研究
    峰面积,并进行相似度分析。 结果 厚朴酚、和厚朴酚的总含量均为去粗皮厚朴>厚朴药材>厚朴粗皮;去粗皮厚朴6个共有峰的峰面积均比厚朴药材、厚朴粗皮的峰面积高。结论 厚朴去粗皮可提高厚朴饮片的质量,为厚朴去粗皮提供实验参考依据。[关键词] 厚朴药材;去粗皮厚朴;厚朴粗皮;指纹图谱;相似度[中图分类号] R282          [文献标识码] A          [文章编号] 1673-7210(2020)07(a)-0027-04[Abstract] O

    中国医药导报 2020年19期2020-08-27

  • 心脑疏通胶囊指纹图谱研究
    药色谱指纹图谱相似度评价系统(版本 2004 A)”进行相似度评价。结果:10批样品相似度均在0.95以上,确认共有峰20个,标示3个已知化合物(丹参酮IIA、隐丹参酮、丹参酮I),方法学考察结果符合指纹图谱技术要求。结论:该方法具有良好的精密度、重复性、稳定性和专属性,可为该制剂的质量控制提供一定参考。【关键词】 心脑疏通胶囊;丹参酮IIA;质量控制;指纹图谱;相似度【中图分类号】R284.1   【文献标志码】 A    【文章编号】1007-8517

    中国民族民间医药·上半月 2020年5期2020-08-10

  • 光学符号识别
    ,建立欧几里得相似度模型,ROC模型评判法对模型进行检验,同一坐标对应若干个字符,所以考虑坐标所对应的数字是坐标域,分析不同位置统一字母的数据存在可能性差异,同一字符在同一位置区域的数据具有较高的相似性,筛选同一区域的若干字符,再通过其余特征属性建立模型可以识别相关字符。接着观察待测字符的数字信息中的位置信息,找到与待测字符相同的位置区域,建立欧几里得相似度模型,将筛选出的属性与待测字符的相应属性的数据通过欧几里得相似度计算公式进行计算,得到多组欧几里得距

    科学与财富 2020年14期2020-07-04

  • 基于人机交互和特征提取的英汉翻译系统研究
    语义向量之间的相似度,选择余弦相似度函数计算翻译相似度。将翻译相似度引入英汉翻译系统模型,通过比较两个语义向量之间的翻译相似度实现英汉之间的翻译。与SOA、SCA和SLA对比可知,基于人机交互和特征提取的英汉翻译具有更高的准确率、精确率和召回率,为英语翻译提供新的方法和途径。关键词: 人机交互; 特征提取; 翻译系统; 相似度; 语义向量中图分类号: TM 933.4      文献标志码: AStudy on English-Chinese Transl

    微型电脑应用 2020年4期2020-06-30

  • 基于协同过滤算法的旅游推荐系统的设计与实现
    为景点属性进行相似度计算并根据计算结果对旅游景点进行相似分类,结合协同过滤算法计算用户相似性并产生专属景点推荐列表,为用户提供个性化旅游推荐。本系统对河北省11个城市的旅游景点进行推荐。关键词:旅游推荐;景点属性;协同过滤;相似度中图分类号:TP311      文献标识码:A文章编号:1009-3044(2020)35-0064-03开放科学(资源服务)标识码(OSID):Design and Implementation of Travel Recom

    电脑知识与技术 2020年35期2020-06-07

  • 藏文自动组卷系统中试题消重方法研究
    试题的互异性或相似度是由多个参数共同决定的。根据藏文试题的结构特点,提出了一种试题相似度的计算方法,力求提升自动组卷系统的组卷性能。关键词: 自动组卷; 藏文试题; 相似度; 组卷性能Abstract: In the automatic test paper system, the test paper's mutuality is an important index to evaluate the performance of the system,

    计算机时代 2020年5期2020-06-04

  • 基于混合式学习的同伴推荐算法设计与实现
    法。利用学习者相似度个性化推荐互补、相似型的学习同伴,以提高学习效率。实验基于真实、有效的学习者特征数据集,选取机器学习中常用的评价指标,验证了该推荐算法的有效性和准确性。关键词: 同伴推荐; 混合式学习; 相似度; 混淆矩阵中图分类号:TP319          文献标识码:A     文章编号:1006-8228(2020)04-38-03Design and realization of peer recommendation algorithm

    计算机时代 2020年4期2020-06-03

  • 用于求解TSP问题的遗传算法改进
    及变异率;引入相似度概念,避免出现近亲交配现象,影响种族进化;寻找并记忆优良基因簇,加快收敛过程。实验结果证明,改进遗传算法的优化性能提升了17.04%。关键词:TSP问题;遗传算法;动态适应度函数;优良个体多复制;相似度;优良基因簇DOI:10. 11907/rjdk. 192387中图分类号:TP301   文献标识码:A                 文章编号:1672-7800(2020)003-0116-04Improvement of Gen

    软件导刊 2020年3期2020-05-28

  • 基于模糊聚类的电力用电负荷用户识别分析
    :模糊聚类; 相似度; 负荷特性; 日负荷曲线中图分类号: TM714文献标志码: AAbstract:In order to improve the fine management of power load users, a method of identifying and analyzing power load users based on fuzzy clustering is proposed. This paper analyzes the

    微型电脑应用 2020年3期2020-04-22

  • 基于TextRank的多维度智库相互影响力评估
    文章之间内容的相似度,引入时间衰减因子描述时间对影响力的削弱;在评估外影响力方面,该模型计算主题流行度来衡量智库文章对外部环境的影响。实验表明:本文提出的模型,立足于文章内容本身,多维度评估文章的内外影响力,能够有效评估智库文章的影响力,具有一定的实用性和指导意义。关键词:智库;影响力;相似度;主题流行度;时间衰减0 引言智库(Think Tank)概念来源于美国,目前智库的概念不再局限于军事和国际关系的研究机构,而是延伸到从事政治、经济、社会等公共问题的

    荆楚理工学院学报 2020年6期2020-04-06

  • 四川洪坝乡红景天HPLC指纹图谱研究
    药材指纹图谱的相似度在0.863~0.984。 结论 所建立的红景天HPLC指纹图谱可为红景天质量标准的建立提供依据。[关键词] 红景天;高效液相色谱指纹图谱;红景天苷;相似度;质量标准[中图分类号] R927.2          [文献标识码] A          [文章编号] 1673-7210(2020)02(a)-0023-05[Abstract] Objective To establish high performance liquid c

    中国医药导报 2020年4期2020-04-03

  • 基于聚类的反恐情报异常数据分析方法研究
    设计一种专门的相似度综合度量参数用于计算与恐怖分子最相似的人员。[结果/结论]该方法为检测异常人员数据提供了一种可以参考的思路,用于从多种来源数据中快速找出涉恐敏感程度较高的人员,有望提高反恐情报分析的效率,实现精准打击重点涉恐人员和恐怖活动。关键词:数据挖掘;异常检测;聚类分析;相似度;反恐情报Abstract:[Purpose/Significance]Outlier detection from mass fundamental data could

    现代情报 2019年10期2019-11-07

  • 多特征相似度计算在考试评阅系统中的应用探索
    动评阅中,文本相似度计算是一个较为复杂的系统,包括词语、句子相似度计算等。其中,詞语是构成语言体系的基本单位,计算其相似度往往是计算句子相似度的基础,而句子相似度计算则是文本相似度计算的前提。只有通过词语、句子等多特征的相似度计算,才能得出文本的相似度。关键词:多特征;文本;相似度;计算中图分类号:TP391.6     文献标识码:A文章编号:1009-3044(2019)24-0080-02开放科学(资源服务)标识码(OSID):1 背景随着信息技术的

    电脑知识与技术 2019年24期2019-11-03

  • 基于人脸识别的考勤系统设计与实现
    的训练图像进行相似度对比,得出考勤结果。实验结果表明,利用该方法开发的实时人脸识别考勤系统具有识别率高、可靠性强等特点。关键词:人脸识别;考勤系统;训练模板;相似度人脸识别实时考勤系统,是将人脸识别技术与实时监控密切结合起来,打造全新的动态人脸智能考勤系统。系统利用人脸识别技术,将摄像头实时抓取到的人脸图像和员工模板照片进行实时比对,达到考勤验证的目的。一般来说,使用人脸识别的考勤系统的步骤可分为人脸数据信息的采集、人脸身份的识别以及人脸数据的记录3方面[

    无线互联科技 2019年13期2019-10-17

  • 中药龟甲HPLC指纹图谱研究
    “中药指纹图谱相似度评价系统”(《中华人民共和国药典》2012版)对正品龟甲上甲与下甲、正品与常见混伪品进行相似度分析。结果:所建立的指纹图谱具有较好的精密度、重现性和稳定性。正品龟甲的上下甲相似度为0.932~0.995。正品与混伪品的相似度在0.90以下者占90.91%。结论:正品上、下甲的HPLC图谱差异较小,正品与混伪品差异较明显。所建立的HPLC指纹图谱可用于龟甲的质量评价。关键词  龟甲;混伪品;HPLC指纹图谱;相似度;评价 HPLC Fin

    世界中医药 2019年2期2019-09-10

  • 合欢皮标准汤剂的HPLC指纹图谱研究
    指纹图谱测定及相似度评价。采用HPLC方法,色谱柱为WatersSymmetryshieldRPC18柱(4.6mm×250mm,5μm),以乙腈-0.04%磷酸溶液为流动相进行梯度洗脱,检测波长为210nm,流速为1mL/min,柱温为25℃,对照指纹图谱对合欢皮标准汤剂进行相似度评价及聚类分析。结果表明,15批合欢皮标准汤剂指纹图谱中呈现10个共有峰,相似度为0.967~0.998,表明合欢皮标准汤剂具有良好的一致性;此外,在10个共有峰中指认出(-)

    河北工业科技 2019年2期2019-09-10

  • 加热不燃烧烟草制品与传统卷烟化学指纹分析
    学指纹数据进行相似度计算、主成分分析、化学结构鉴定和化合物含量比较,结果发现,HNB与TC化学指纹的相似度较低(0.32~0.45),在所建立的两种主成分分析模型中,传统卷烟TC-A和TC-B的距离很接近,而HNB-C则都与其他测试样品距离较远。在所获取的化学指纹中共鉴定出101个化合物,其中HNB相对TC含量较高的化合物主要为挥发性较好的醇类物质和小分子有机酸,而TC含量较高的化合物主要为挥发性弱的糖类物质。HNB的化学组成特点主要是为了满足其在较低温度

    中国烟草科学 2019年4期2019-09-10

  • 瓜蒌配方颗粒指纹图谱研究
    指纹图谱测定及相似度评价。采用HPLC方法,色谱柱为GL Sciences公司InertSustain AQ-C18柱(4.6 nm×250 nm,5 μm),以甲醇-0.1%甲酸水溶液为流动相,梯度洗脱,检测波长为260 nm,流速为0.8 mL/min,柱温为25 ℃,对瓜蒌配方颗粒指纹图谱测定结果进行了相似度评价。结果表明,10批瓜蒌配方颗粒指纹图谱中呈现16个共有峰,相似度均大于0.960,表明瓜蒌配方颗粒具有良好的一致性;此外,在16个共有峰中指

    河北工业科技 2019年4期2019-09-10

  • 蒙药山川柳的HPLC指纹图谱建立、相似度评价和聚类分析
    纹图谱,并进行相似度评价和聚类分析。方法:采用HPLC法,色谱柱为Agilent ODS C18,流速为1.0 mL/min,流动相为甲醇-水(梯度洗脱),检测波长为335 nm,柱温为30 ℃,进样量为10 μL。以槲皮素峰为参照,生成10批药材样品的HPLC指纹图谱;采用《中药色谱指纹图谱相似度评价系统》(2004 A版)进行相似度评价,确定共有峰;采用SPSS 17.0 软件对10批药材样品进行聚类分析。结果:10批药材样品的HPLC指纹图谱有13

    中国药房 2019年8期2019-09-10

  • 高考数学文理试卷相似度分析
    理科数学试卷从相似度和综合难度两方面进行比较分析,发现2017年到2019年全国Ⅲ卷文理科数学试卷的相似度逐渐增加,综合难度逐渐下降。2019年高考数学还出现以下几方面的变动:稳中革新,调整文理卷同题比例;强调数学运用,注重数学思维;强调基础知识考查;加强对中华民族传统文化的考查;加强对数学核心素养的考查。【关键词】高考数学;相似度;综合难度【中图分类号】G633.6  【文献标识码】A  【文章编号】1671-8437(2019)34-0206-031 

    理科爱好者(教育教学版) 2019年6期2019-09-10

  • 基于TF-IDF算法的方剂构成相似度可视化研究
    性及方剂之间的相似度,为方剂研究及应用提供参考。方法  应用爬虫框架和手工录入方式获取一定数量的经典方剂,采用中文分词工具和手工整理方式对方剂信息进行名称、功能、来源、中药组成、剂量、剂量单位、炮制方法、忌宜、主治等属性拆分,构造语料词库,Python3.5环境下采用TF-IDF算法计算方剂间相似度并进行功能主治验证,采用d3.js进行可视化展示。结果  经过分词和手工整理得到不同类型方剂7710首,包含药物8957味,构建的中药方剂数据挖掘系统实现了相似

    中国中医药信息杂志 2019年7期2019-09-02

  • 基于加权相似度显隐式反馈的协同过滤算法
    到不同用户之间相似度的差异以及用户对项目的评分时间等因素的影响,提出了一种基于加权相似度显隐式反馈的协同过滤算法:先获取用户的显式和隐式反馈评分信息以及用户-项目的评分时间信息。再对评分信息进行基于时间的加权处理,并对传统的相似度计算方法进行修改,引入相关度因子。最终根据预测公式获得用户的推荐结果。实验仿真表明算法在平均绝对误差和精确率两个指标上有了一定的提高,并在一定程度上提高了推荐算法的准确性。Abstract: Aiming at the tradi

    价值工程 2019年13期2019-07-17

  • 基于用户行为的协同过滤算法研究
    用关键字权重和相似度算法分析用户行为,最后通过协同过滤算法综合推荐给用户。根据MovieLens数据集对该算法进行实验,得出此算法具有较高的准确度,能够实现对用户个性化推荐。关键词:广告推送;相似度;协同过滤;基于用户中图分类号:TP391        文献标识码:A文章编号:1009-3044(2019)13-0017-02目前,我国互联网广告规模已有千亿级,人们正面临着“信息过载”(information overload)的问题。为此我们需要建立一

    电脑知识与技术 2019年13期2019-07-08

  • 针对可收集能量传感器网络的能量预测方法
    出一种基于天气相似度的太阳能收集功率预测方法D-WSMA。根据参考天和参考时刻对预测值的影响程度不同,采取相似度刻画数据间关系,动态调整参考天和参考时刻的权重以及历史参考时刻的加权平均值,从而得到可变化的DGAP因子。同时,根据数据波动性特征,改进原有算法中的固定权重α,得到动态变化权重因子[dα]。实验结果表明,D-WSMA预测精度相对WCMA算法提高了14.04%、28.30%、4.76%、12.58%,平均提高了15%。因此,D-WSMA预测方案具有

    软件导刊 2019年5期2019-05-24

  • 基于细化度与相似度的课程知识图谱构建研究
    对目前基于概念相似度聚类的课程概念本体关系构建技术中层次关系划分精确度不足的问题,提出基于课程概念相似度与细化度的课程概念本体构建方法。在计算课程概念相似度的基础上,引入课程概念细化度指标,进一步提升了课程概念本体层次关系构建的准确性,提高了课程知识图谱的数据质量。最后通过课程知识导航服务平台,验证了该方法的有效性。关键词:课程知识图谱;细化度;相似度DOI:10. 11907/rjdk. 191633中图分类号:TP301 文献标识码:A 文章编号:16

    软件导刊 2019年5期2019-05-24

  • 基于BP神经网络的参数迁移学习算法研究
    与目标域之间的相似度学习,把源领域中有用的参数信息迁移到目标域中,提高目标域中测试集的分类准确率。通过对UCI数据集进行实验,证明了在小数据样本下该算法比传统的神经网络算法有更好的效果。关键词 :BP神经网络;参数迁移学习;相似度;小数据样本;大数据中图分类号:TP181 文献标识码:A 文章编号:1009-3044(2019)04-0189-03Abstract:In the era of big data, there are many data se

    电脑知识与技术 2019年4期2019-05-24

  • 一种基于用户动态社交网络的协同过滤推荐方法
    动态社交网络;相似度;兴趣模式中图分类号:TP39 文献标识码:A 文章编号:1009-3044(2019)04-0250-03Abstract: The development of e-commerce recommendation systems is closely related to the research on data sparsity, cold start, scalability and privacy protection. Al

    电脑知识与技术 2019年4期2019-05-24

  • 局部敏感哈希算法的内容相似度比较
    等需要比较内容相似度的场景上。该文着重研究LSH在文本比较上的实现(Simhash算法)。首先,对给定的文本做分词降噪和加权处理得到带权重的具有给定文本特征的词语,其次,使用哈希算法为每个词语生成对应的哈希值并根据各自的权重形成加权数字串,然后合并所有词语并降维,最后,通过使用海明距离(Hamming Distance)计算生成的两个Simhash的相似度。关键词:局部敏感;哈希;LSH;Simhash;相似度;查重中圖分类号:TP311 文献标识码:A文

    电脑知识与技术 2019年10期2019-05-22

  • 一种基于特征的文本零水印算法研究
    基于文本特征的相似度计算方法,用以确定阈值和检测水印。实验结果表明,该算法与同类算法相比具有更强的鲁棒性,并且处理文件不受文本格式及多媒体内容的限制,具有很好的实验效果。关键词:文本;零水印;相似度DOI:10.16640/j.cnki.37-1222/t.2019.05.1530 引言目前对文本数字水印的研究领域主要集中在文本图像和具有格式的文档水印算法的研究,采用方法大多是改变语义[1-2]或调整格式[3-4]来嵌入水印信息。这些方法有各自的特点,但在

    山东工业技术 2019年5期2019-03-13

  • 相似问句判别研究
    3%。关键词:相似度:问句;机器学习0引言搜索引擎正确理解用户输入的查询是十分必要的。在实际应用中对于同一个问题,不同用户的提问形式往往不同。比如用户想得到一个U盘格式化的方法,那么有些人会问:“如何对U盘格式化”,还有些人可能会问:“怎么对U盘格式化”,或者“U盘格式化的方法?”等等。如果一个搜索引擎能够将这些相似问题理解为同一个意思,就能够正确返回给用户结果。但是,有些问题虽然形式上比较接近,用户问的却是完全不同的意思。比如用户提问“姚明是谁的爸爸”和

    智能计算机与应用 2019年6期2019-03-11

  • 基于职业院校数据与指标匹配的编辑距离算法的应用研究
    与目标字符串的相似度,进行字符串之间的匹配,进而解决了数据与指标匹配的问题。关键词:数据分析  指标匹配  编辑距离  相似度中图分类号:G64                                    文献标识码:A                        文章编号:1674-098X(2019)10(c)-0255-02为给山西省职业教育大数据分析与决策平台提供大量且准确的数据,必须通过调研采集信息或梳理年报等方式提取学校信息,由于学

    科技创新导报 2019年30期2019-03-08

  • 基于协同过滤算法的服装个性化推荐研究
    了分析,计算出相似度最高的用户,并将该用户的收藏夹信息中目标用户还未关注到的信息推荐给目标用户,实现了一个简单电子商务网站的个性化推荐系统。关键词:协同过滤;个性化推荐;推荐算法;相似度;电子商务中图分类号:TP391 文献标识码:A文章编号:1009-3044(2019)35-0194-031 概述随着互联网的高速发展和物流产业的日益成熟,电子商务已经成为互联网的重要应用之一,我国电子商务行业的市场规模也发生了翻天覆地的变化。电子商务对二十一世纪人类的生

    电脑知识与技术 2019年35期2019-03-07

  • 浅析大数据搜索引擎之图片搜索技术
    片搜索;算法;相似度中图分类号:TP391文献标识码:A文章编号:1009- 3044(2019)34-0181-021 基于内容的图片搜索一张图片包含了亮度变化小的区域是低频成分和亮度变化剧烈的高频成分。低频成分仅提供一个框.架,图片的详细细节信息部分主要是由通过高频成分来体现的。换句话说高频成分能够描述图片的详细信息。而一张尺寸比较大的内容显示丰富的图片有较高的频率,小图片都是低频的,原因在于缺少图像细节部分。基于内容的图片搜索主要思想是基于图片本身拥

    电脑知识与技术 2019年34期2019-03-04

  • 基于CFSFDP算法的复杂网络聚类
    问题,提出一种相似度度量方法代替传统的欧氏距离,从而将密度聚类CFSFDP(clustering bvfast search andfind of density peaks)算法应用到复杂网络聚类中去。首先,利用Pade逼近方法计算复杂网络的拉普拉斯算子矩阵指数;接着,归一化核心矩阵得到相似度矩阵,并求倒数得出复杂网络各节点间距离;最后,借鉴CFSFDP算法思想,将节点自身邻域密度、与其他邻域密度较高节点的距离结合作为判断依据,得出聚类中心并剔除噪声点,

    电脑知识与技术 2019年33期2019-01-08

  • 基于本体技术的建筑安全事故控制措施研究
    的概念语义属性相似度确定方法和基于改进粗糙集的属性权重确定方法。通过计算案例综合相似度,制定安全事故控制措施参考方案,完善了安全事故控制方法,提高了建筑安全事故控制水平。关键词:事故控制;本体技术;相似度;案例推理中图分类号:TB 文獻标识码:A doi:10.19311/j.cnki.1672-3198.2018.23.0920 引言建筑工程施工过程中,现场环境复杂、人员流动大及作业强度高,稍有松懈便会导致安全事故的发生,造成严重危害。据统计,近年来,年

    现代商贸工业 2018年23期2018-09-20

  • 基于字形编码与拼音编码的近似商标辨识算法研究
    商标文字的字形相似度和拼音相似度,并根据相似匹配算法得出商标文字的相似程度。实验结果表明,该方法所得结果有更好的辨识率,符合常规人体视觉和逻辑判断。关键词:商标辨识算法;近似商标;形近字;近音字;相似度DOI:10.11907/rjdk.172985中图分类号:TP312文献标识码:A 文章编号:1672-7800(2018)006-0077-04Abstract:In order to realize efficient and rapid automa

    软件导刊 2018年6期2018-09-04

  • 改进的协同过滤算法在电影推荐系统中的应用
    时间权重函数对相似度计算方法和预测评分计算方法进行了改进,并通过在Movielens数据集上验证了改进的协同过滤算法较传统的协同过滤在推荐准确度上有了明显的提升。关键词:协同过滤;电影推荐;相似度;时间因子中图分类号:F49 文献标识码:Adoi:10.19311/j.cnki.1672-3198.2018.17.0281 引言隨着信息技术的快速发展,互联网上的资源呈现指数级的增长态势,“信息过载”问题愈发突出。“信息过载”是数据量剧增后的一种必然结果,针

    现代商贸工业 2018年17期2018-08-14

  • 基于大数据的网络教育方向选取方法研究
    络教育资源进行相似度匹配,实现学生用户对网络教育资源的个性化选择,将学生用户偏好相似度运用到网络教育方向选取过程中,有利于实现网络教育方向的个性化选取。实验结果说明,所提方法可为用户选取正确的网络教育方向,具有较高的准确率和召回率,用户满意度高。关键词: 大数据; 网络教育; 方向选取; 特征概念; 本体树; 相似度中图分类号: TN911?34; TP391 文献标识码: A 文章编号: 1004?373X(2018)15?0087?05Research

    现代电子技术 2018年15期2018-08-06

  • 基于相似度的党政领导干部选拔方法研究
    评价体系,运用相似度方法确定党政领导干部候选人的优劣排序,并通过实例进行了验证,具有较强的操作性和可行性。关键词:党政领导干部 选拔 评价指标 相似度0党政领导干部是党的重大方针政策的制定者与执行者,代表公众行使公共权利,是推动党和国家事业建设的重要力量。如何通过合理的方法为党组织选拔任用优秀的人才,成为学术界研究关注的热点问题。围绕党政领导干部选拔考察,学者围绕选拔的原则与标准、选拔问题分析和选拔效果提升对策等方面开展研究工作,[1-3]为我国党政领导干

    祖国 2018年13期2018-08-02

  • 浅谈击剑和拳击项目专项训练的相似度
    个项目专项训练相似度进行系统阐述,为提高专项训练提供借鉴与参考。关键词:击剑 拳击 专项训练 相似度击剑和拳击项目属于技能主导类格斗项群项目,二者具有一定的相似度,相同点包括一对一竞技,得分取胜或绝对胜利,交锋距离和比赛节奏不断变化,脚步的移动和身体前后左右的变向等方面。本文节选同一项群项目,专项训练的角度进行浅显的阐述,以求提高日常训练的多样性,进而提高训练效果。[1]一、运动特征相似度无论是击剑项目还是拳击项目,要想取得优异的成绩,都必须遵循运动项目的

    新教育时代·教师版 2018年16期2018-07-21

  • 一种用于多类别划分的中心点选择算法
    ;初始中心点;相似度中图分类号:TP181 文献标识码:A 文章编号:1009-3044(2018)12-0188-03Abstract: The traditional K-means algorithm is sensitive to the initial clustering center, and the clustering results fluctuate with different initial inputs. When the nu

    电脑知识与技术 2018年12期2018-07-12

  • 电子模拟仿真实验室的研究与开发
    模拟效果良好,相似度分析效果佳。关键词: 电子模拟; 仿真实验室; VB技术; PSPICE软件; 虚拟实验面板; 相似度中图分类号: TN710?34 文献标识码: A 文章编号: 1004?373X(2018)11?0105?05Research and development of electronic simulation laboratoryYANG Wei, GENG Jian(Nanchang Institute of Technology,

    现代电子技术 2018年11期2018-06-12

  • 大兴安岭塔源林场不同生境蝶类多样性与相似度分析
    蝶类的多样性與相似度进行分析。[方法]首次对大兴安岭塔源林场蝶类资源进行调查,掌握塔源林场不同生境中蝶类的资源分布情况。[结果]经研究发现塔源林场有蝶类82种活动,隶属于7科53属,包括优势种11种。通过分析样地中野生蝶类资源的分布情况发现,灌丛环境蝶类多样性与优势度指数最高,草甸的均匀度指数最高,湿地的各项指数均最低。相似度情况以灌丛和湿地最高,林缘和草甸的相似度最低。[结论]该研究对于分析大兴安岭塔源林场蝶类情况具有重要的意义。关键词 蝶类资源;多样性

    安徽农业科学 2018年18期2018-05-14

  • 基于电影系统的协同过滤算法的改进
    场景下的多种的相似度的计算,页面停留时间进行了深层次的研究,并且对冷启动问题也進行了初步的改进,从而提高推荐系统的准确性。【关键词】协同过滤 用户偏好 相似度 页面停留 冷启动 电影推荐随着网络的不断发展,科技也变得越来越智能化。网上浏览的信息都将成为刻画人物形象特征的一部分。通过协同过滤算法 的研究,可以将每个用户和物品向量化和标签化,将潜在的用户或者物品推荐给具有相似偏好的用户。1 协同过滤推荐算法简介协同过滤算法是通过分析某一用户的偏好特征,在海量用

    电子技术与软件工程 2018年1期2018-03-22