随机森林

  • 基于哨兵影像与多特征优选的溧阳市上兴镇水稻识别
    征组合,采用随机森林算法对江苏省常州市溧阳市上兴镇的水稻进行识别。结果表明,在光谱特征中,红边波段对于水稻识别精度有着较高的提升作用。光谱特征结合植被/水体指数特征、雷达特征后,水稻识别精度有所提高。基于优选特征进行分类的精度最高,总体分类精度、Kappa系数分别为93.26%、0.904 8。综上,结合遥感影像的光谱特征、植被/水体指数特征和雷达特征等并进行特征优选可以提高水稻识别精度。关键词:水稻识别;特征优选;随机森林;遥感影像中图分类号:S127;

    江苏农业学报 2023年8期2024-01-30

  • 基于随机森林和随机游走的交互式图像分割
    提出一种基于随机森林进行对称检测的方法。通过基于相似边的特征,将对称检测转化为结构化标签问题。在得到对称轴的基础上,通过期望最大算法,建立对称轴与相邻像素之间的关系,以提高交互式分割的精确度。实验表明,该方法不仅能有效地提取图像中的对称轴,而且能得到较高精度的交互式分割结果。关键词:交互式图像分割;随机森林;随机游走;对称检测;期望最大算法中图分类号:TP391.41        文献标识码:A文章编号:1009-3044(2023)31-0014-04

    电脑知识与技术 2023年31期2023-12-25

  • 基于多时相合成孔径雷达数据的水稻种植面积监测
    相似性分析与随机森林分类的水稻种植分布和面积监测方法。首先提取VV和VH极化方式下不同地物的后向散射系数时间序列特征曲线,并利用HANTS滤波来消除噪声影响。然后根据野外调查数据获取小站稻参考生长曲线,构建小站稻相似性指数,筛选出小站稻可能种植区域。最后采用随机森林分类模型提取小站稻种植面积。结果表明,基于多时相Sentinel-1A SAR影像相似性分析及随机森林分类能够获得较高精度的水稻种植面积,VV和VH两种极化方式下提取的水稻种植面积与统计年鉴结果

    江苏农业学报 2023年5期2023-09-19

  • 基于ARIMA-RF组合模型的CPI预测
    ARIMA;随机森林;ARIMA-RF中图分类号:TP391;TP18  文献标识码:A  文章编号:2096-4706(2023)13-0013-05CPI Prediction Based on ARIMA-RF Combined ModelZENG Lingqi(School of Mathematical Sciences, South China Normal University, Guangzhou  510631, China)Abstra

    现代信息科技 2023年13期2023-09-14

  • 随机森林算法对流域面积监测的适用性研究
    流域面积监测随机森林回归模型。与多元线性回归模型、支持向量回归模型的对比结果表明,随机森林回归模型拟合优度更高,平均绝对误差更低,这说明随机森林算法在流域面积监测研究中具有较高的适用性。关键词:随机森林;流域监测;多元线性回归;支持向量机中图分类号:TP181 文献标识码:A  文章编号:2096-4706(2023)12-0074-04Research on the Applicability of Random Forest Algorithm to

    现代信息科技 2023年12期2023-08-21

  • BP神经网络和随机森林预测土壤有机质模型研究
    ,提出了1种随机森林回归(RFR)和BP神经网络结果加权融合模型(BP-RFR),对土壤有机质含量进行预测。选取陕西安康盆地研究区40个样点数据,对比分析RFR、BP神经网络和BP-RFR模型预测效果,使用决定系数([R2])、平均绝对百分比误差(MAPE)和均方誤差(MSE)来评估模型性能。结果表明,BP-RFR、BP和RFR 模型三者预测值与实测值的决定系数([R2])分别为0.954 5、0.951 4、0.933 5,MAPE分别为0.037 7、

    安徽农学通报 2023年10期2023-07-29

  • 基于改进PCA的高新企业核心技术创新与专业技能提升数据分析研究
    的问题。通过随机森林模型获得最佳特征组合,采用信息熵对传统主成分分析进行改进。对比主成分分析和改进主成分分析结果,改进主成分分析的前3个主成分包含了超过95%的信息量,而传统主成分分析的前7个主成分所包含的信息量仅为91.01%。结合主成分分析结果指出有效提升化工企业创新创业技能必须强化员工技能培训,注重企校合作,打造创新创业平台,这对化工企业转型升级提供了数据支撑。关键词:随机森林;主成分分析;信息熵;企业中图分类号:TP391;TQ050.8 文献标志

    粘接 2023年6期2023-07-12

  • 数字化时代老年人数字融入及其影响因素分析
    度数据,利用随机森林模型對老年人数字融入的影响因素进行研究。研究发现,社会资本对老年人数字融入的影响不可忽视;处于中高收入家庭和拥有社会保障、东部地区以及城市地区的老年人具有较高的数字融入程度。希望本文能够为全面认识老年人数字融入及其影响因素认识提供有益参考。[关键词]老年人;数字融入;随机森林[中图分类号]F49文献标志码:A随着互联网、大数据、人工智能等各类数字化应用进程大大加快,推动数字化建设、发展数字经济、实施数字乡村战略成为重要议题。我国面临巨大

    南北桥 2023年11期2023-07-06

  • 基于RS的新疆自治区高温人口暴露研究
    高程数据通过随机森林算法进行回归预测,得出2022年夏季新疆近地表气温。将格网尺度的近地表气温栅格数据和人口数量栅格数据相结合,分析新疆2022年高温人口暴露的空间分布特征。结果表明:(1)利用随机森林算法预测近地表气温,预测的结果精度较高,RMSE和R2分别达到了2.16℃和0.86;(2)高温人口暴露空间分布与人口密度空间分布呈现高度的一致性,即人口密度高的区域,高温人口暴露程度也相对较高;(3)新疆高温人口暴露的中高暴露区大都集中在城市群,如乌鲁木齐

    科技风 2023年18期2023-07-05

  • 不平衡数据集下齿轮装配的故障诊断方法
    E采样方法和随机森林(RF)分类方法的故障诊断模型——SMOTE-RF。首先,在实际齿轮装配过程中,故障数据是不平衡的,可以使用SMOTE算法生成平衡的故障数据;其次,将平衡后的数据作为随机森林算法的输入实现故障分类;最后,对模型进行性能评估。实验结果表明,SMOTE-RF模型的分类效果优于SVM和XGBoost。关键词:故障诊断;不平衡数据;SMOTE算法;随机森林中图分类号:TP391.4;TP181 文献标识码:A 文章编号:2096-4706(20

    现代信息科技 2023年6期2023-06-25

  • 基于中药拉曼谱图的寒热药性判别研究
    于其他模型,随机森林(RF)模型展现出最佳的效果,对测试集判别的正确率高于90%,曲线下面积(AUC)和精确度大于0.90。本研究基于大样本量中药的分析,中药的拉曼数据与其寒热药性之间具有显著的相关性,可作为药性表征指标,结合RF算法进行寒热药性的判别分析。关键词 中药;拉曼光谱;药性;寒热;随机森林;判别分析;特征筛选Discrimination of Cold and Heat Medicinal Properties Based on Raman S

    世界中医药 2023年1期2023-06-23

  • 基于特征提取和随机森林的接口服务异常值检测
    为属性,通过随机森林进行训练的有监督学习的异常检测方法。作为属性的特征有标准分异常值、格拉布斯异常值、中位数方差异常值和平均偏离值等。现阶段一般采用无监督模型和集成学习的方法来检测异常值。文章提出的方法就是基于现阶段方法做的一个升级版本,能检测出大部分跨区换卡、套餐变更和个人开机的中国移动业务接口服务异常值。关键词:随机森林;一维特征提取;有监督学习;业务接口服务异常值中图分类号:TP311    文献标识码:A  文章编号:2096-4706(2023)

    现代信息科技 2023年5期2023-06-22

  • 基于随机森林方法的甲醇期货价格预测与交易策略研究
    则。论文采用随机森林算法构造甲醇期货价格预测模型,使用甲醇产业链上下游产品的基本面特征作为输入变量,并对输入变量进行归一化处理构造对照模型,结合使用基于Aberration策略思想构建的交易策略集合,使用夏普比率对交易策略进行筛选,构造有效的甲醇期货量化交易模型。研究结果显示,论文模型在保证交易策略良好泛化能力的情况下可以实现高出同期10年期国债收益率1.2倍以上的年化收益率,也表明利用甲醇产业链上下游产品的基本面特征能够很好地解释甲醇期货价格,并结合使用

    上海管理科学 2023年1期2023-06-21

  • 基于体域网的矿工生命体征监测与运动状态识别
    基于小波包与随机森林的矿工运动状态识别算法MSR-WPT-RF,用于监测矿工生命体征,识别运动状态.实验测试结果表明,构建的矿工体域网生命体征采集节点具有低功耗性能、丢包率低、时延低等优点,运动状态识别算法能够取得最高91%的识别准确率.关键词:矿工;生命体征;体域网;随机森林;低功耗;[   中图分类号    ]TN915.85 [    文献标志码   ]  AMiners' Life Signs Monitoring and Motion State

    牡丹江师范学院学报(自然科学版) 2023年1期2023-06-13

  • 基于随机森林分类模型的古代玻璃制品成分分析
    的成分,基于随机森林建立模型,构建不同分类标准。【结果】研究发现,玻璃制品纹饰等与表面风化的相关性较弱,与二氧化硅等玻璃制品的相关性大,且氧化铅成分在玻璃中的重要性最大。【结论】要防止玻璃发生风化,就要减少杂质成分。关键词:独立样本检验;机器学习分类-随机森林;聚类分析;相关性分析中图分类号:TP181     文献标志码:A     文章编号:1003-5168(2023)09-0019-04Abstract:[Purposes] The chemica

    河南科技 2023年9期2023-06-07

  • 基于特征加权的电影票房预测研究
    :票房预测;随机森林;特征权重;BP神经网络电影票房在电影产业中占有举足轻重的地位,因此,在电影发行当天对电影票房做出准确的预估,可以帮助制片人控制风险,帮助影院制定排片计划,并引导影院和制片人制定市场战略。在前期对电影票房的影响因子及票房预估的探讨中,研究者着重于电影上映之前所确立的静态影响因子,如主演、导演、编剧、题材、制式、获奖及提名、上映档期、发行公司、电影地区等。目前,对于上述的一些静态影响因子,大部分学者都建立了比较完整的评价体系和比较科学的定

    计算机应用文摘 2023年8期2023-05-30

  • 基于随机森林-Logistic回归的扫地机器人消费意愿及其影响因素分析
    量数据,运用随机森林-Logistic回归模型深入分析影响扫地机器人消费意愿的因素。回归结果显示,年龄、学历、月收入、居住面积对扫地机器人的消费意愿具有显著影响。建议企业:稳固现有用户基础,大力开拓新用户群体;积极开展与高学历群体需求相适应的精准营销;明确“注重产品品质+完善附加服务=获得消费市场”;对扫地机器人进行科技赋能,使其完全代替人力。【关键词】扫地机器人;消费意愿;随机森林-Logistic回归【中图分类号】F273.2;TP242      

    中小企业管理与科技·上旬刊 2023年2期2023-05-30

  • 基于随机森林和梯度提升决策树的高血压分析预测
    提出一种基于随机森林和梯度提升决策树的模型。首先基于体检报告数据进行缺失值处理、one-hot编码、归一化、数据初步聚类等预处理;然后针对数据样本不均衡的特性,利用SOMTE算法进行重采样,基于随机森林得到特征重要性评分并进行特征选择;最后基于排名前20的特征值,利用梯度提升决策树算法产生预测模型。模型分析结果显示了高血压的危险性因素。经数据集交叉验证,模型准确率可以达到84.51%,具有较高的应用价值。关键词: 慢性病; 高血压; 随机森林; 梯度提升决

    计算机时代 2023年5期2023-05-14

  • 基于PSO的RF模型在人体活动识别中的应用
    (PSO)的随机森林(RF)识别方法。利用PSO算法搜寻最优的RF超参数n_estimators和max_depth,构建了PSO-RF人体活动识别模型。基于华盛顿州立大学CASAS项目数据集的实验共识别30种日常活动。仿真结果表明,PSO-RF模型的识别准确率达到95%,Accuracy、Precision、Recall和F1-score评价指标均优于其他经典的分类模型,具有较好的预测精度和泛化能力,可为智能家居系统个性化服务提供辅助决策。關键词: 随机

    计算机时代 2023年5期2023-05-14

  • 基于特征加权的电影票房预测研究
    :票房预测;随机森林;特征权重;BP神经网络电影票房在电影产业中占有举足轻重的地位,因此,在电影发行当天对电影票房做出准确的预估,可以帮助制片人控制风险,帮助影院制定排片计划,并引导影院和制片人制定市场战略。在前期对电影票房的影响因子及票房预估的探讨中,研究者着重于电影上映之前所确立的静态影响因子,如主演、导演、编剧、题材、制式、获奖及提名、上映档期、发行公司、电影地区等。目前,对于上述的一些静态影响因子,大部分学者都建立了比较完整的评价体系和比较科学的定

    计算机应用文摘·触控 2023年8期2023-04-25

  • PPP模式社会资本参与度影响因素研究
    目信息,利用随机森林模型预测PPP项目中社会资本的参与度,并进行特征重要性排名,分析促进社会资本参与PPP项目的重要因素。结果表明,社会资本参与PPP项目具有行业性,政府PPP项目经验是吸引社会资本参与的主要因素,而审批所耗时长,赤字率则对社会资本的积极参与产生负面影响。针对上述结论,文章对政府如何促进PPP项目吸引社会资本的参与提出了相关建议。 关键词:PPP模式;社会资本参与;随机森林;影响因素 一、引言 2014年,发改委在发改基础[2014]

    中国集体经济 2023年10期2023-04-11

  • 基于随机森林和支持向量机的森林健康情况分析
    病树木检测;随机森林;支持向量机1引言如今,林木健康问题已得到社会各界前所未有的关注,而中国传统的样地检测和受控实验等方法需要耗费大量人力物力,且得出具体结论所需时间往往较长,使林业健康检测丧失时效性。故传统手段具有一定局限性。而遥感是避免接触,目标距离较远的一种探测技术,其能够为研究人员提供更高纬度的视野,可以有效收集并且处理复杂时空维度下的海量信息。本项目基于高分辨率遥感数据,结合统计学相关理论知识以及新兴的数据挖掘技术,对健康树木和患病树木的遥感图像

    计算机应用文摘·触控 2023年1期2023-01-14

  • 基于机器学习的乳腺癌预测研究
    据处理,使用随机森林、XGBoost、相关性分析进行模型建立分析。通过机器学习,得到相关结果以及准确率、精准率、召回率和F1,并通过比较不同算法之间准确率、精确率的差异,得出最优的预测研究方案机制。通过模型对比评价,XGBoost算法的准确率、精确率等均在93.5%以上,随机森林算法的准确率、精确率等均为92.4%。相比之下,XGBoost模型预测效果较佳。利用机器学习研究乳腺癌的预防预测,并应用于实践,对乳腺癌早期诊断有着十分重要的意义。关键词:机器学习

    计算机应用文摘·触控 2022年19期2022-11-20

  • 基于随机森林的集成学习入侵检测方法
    提出一种基于随机森林的集成学习入侵检测方法。通过K-means和SMOTE处理数据集获得相关度高的平衡数据子集,随机森林选择出最优的特征子集,基于树的集成学习方法分类结果。本文采用CICIDS2017数据集进行本文方法可行性的研究,结果表明本文提出的方法相比传统的单一机器学习方法具备更高的检测精度和更低的时间开销。关键词:随机森林;集成学习;入侵检测;机器学习中图分类号:TP18      文献标识码:A文章编号:1009-3044(2022)19-008

    电脑知识与技术 2022年19期2022-08-31

  • 基于随机森林方法的遥感影像耕地提取与变化分析
    号影像,采用随机森林分类方法,提取耕地信息并分析其时空变化。结果表明:随机森林分类方法能有效识别耕地,分类精度均在80%以上。2017—2019年间,江宁区耕地面积变化不大;2021年与2019年相比,耕地面积略有减少,部分耕地转化为其他用地类型。在空间上,西部、东南部地区的耕地与其他用地类型间转化面积较大;总体上,耕地重心不断向东南方向迁移。耕地的时空变化受多种因素的影响,经济发展与城市扩张是其中的主要因素,及时准确地获取耕地变化信息可为相关管理部门提供

    安徽农学通报 2022年10期2022-06-30

  • 多模型融合风化基岩富水性预测
    ng方式叠加随机森林和SoftMax,构建多模型融合的风化基岩富水性预测模型。以红柳林矿区实测水文地质数据进行分析,经过5折交叉验证,结果表明模型预测准确率提升了27.8%和13.2%,micro-auc和macro-auc分别达到了0.94和0.93。可知基于机器学习算法的特征选择代替手工筛选特征可减少人为主观性对预测模型的影响,采用XGBoost构造的高级特征可更充分挖掘原始水文地质数据中存在的富水性规律,融合模型可发挥不同基模型的优势,缓解基模型存在

    西安科技大学学报(社会科学版) 2022年3期2022-06-19

  • 温州市三垟湿地遥感动态检测与景观分析
    支持向量机、随机森林、极限学习三种不同分类器的比较明确适用于研究区的解译方法,得到研究区内三垟湿地土地分类图,并计算了土地利用動态度,分析了三垟湿地自生态修复开始的土地利用变化,根据解译结果计算研究区土地利用变化率与景观变化。结果表明,遥感影像能够较好的应用于城市湿地动态监测,三垟湿地修复建设已逐步完善,因长期开垦导致的土地流失也逐步恢复。关键词:三垟湿地;遥感解译;随机森林;支持向量机中图分类号:TP181        文献标识码:A文章编号:2096

    现代信息科技 2022年2期2022-06-15

  • 高管特征与真实盈余管理
    司为样本,用随机森林以更加全面的视角研究高管特征对真实盈余管理的预测作用,并进一步分析对真实盈余管理预测能力影响较强的高管特征及其预测模式。研究发现:高管特征对真实盈余管理有预测作用,但其作用弱于公司自身特征;分企业性质看,民营企业高管特征比国有企业高管特征预测真实盈余管理的能力更强;在众多高管特征中,高管薪酬对真实盈余管理预测能力的影响最强,且与真实盈余管理呈现负相关关系。文章研究结论对监管真实盈余管理行为具有一定的实践意义。【关键词】 高管特征; 真实

    会计之友 2022年12期2022-06-07

  • 基于随机森林的系统性能指标贡献率评估
    要基础。基于随机森林算法中的变量重要性测量(Variable Importance Measure,VIM),面向指标体系与评估结果值构建随机森林模型,设计实现一种系统性能指标贡献率评估方法,完成系统性能评价中指标重要程度排序。仿真结果表明,该方法可以精准快速地选取对系统评估结果影响较大的指标,从而为系统性能的提升提供理论支撑。【关键词】    性能评估    随机森林    变量重要性测量    指标贡献率    机器学习引言:近年来,面向系统性能评估的

    中国新通信 2022年6期2022-06-02

  • 随机森林数据挖掘技术在电话诈骗行为的方法体系设计
    于数据挖掘的随机森林算法以及聚类算法技术展开了相应的综合分析,并在底层架构中的算法中置入了防范电话诈骗模型,并设计了相关的结构和系统,对通话特性进行表征分析,提升了模型的预测效率和准确度,为防范电话诈骗提供更加清晰和准确的架构体系。关键词:随机森林;电话诈骗;方法体系;系统设计目前,电信诈骗的形式较为严峻。大数据背景下,个人的网络信息严重威胁着人们的财产安全,对此工信部以及公安部和运营商相继发布重要整治措施,整改和预防电信诈骗事件的发生。从应用层面上来看,

    中国新通信 2022年13期2022-05-30

  • 基于集成学习的大学生心理健康服务系统的设计与实现
    成学习算法的随机森林模型进行数据分析,为高校心理辅导老师提供辅助,进行智能预警。系统采用SSM框架、MySQL数据库等主流的开发工具与技术,界面简洁友好,性能良好。关键词:集成学习;心理健康;随机森林;学习策略中图分类号:TP311      文献标识码:A文章编号:1009-3044(2022)12-0046-02开放科学(资源服务)标识码(OSID):近年来,当代大学生的心理障碍问题日益突出,采用人工智能算法提前预判学生心理健康并及时疏导,已成为高校心

    电脑知识与技术 2022年12期2022-05-29

  • 基于光谱指数的博斯腾湖西岸湖滨绿洲土壤有机碳含量估算模型
    ,并建立基于随机森林法(RF)的SOC含量估算模型。结果表明:(1)研究区SOC含量主要集中在5.25~78.76 g/kg,平均值为21.82 g/kg,变异系数为69.11%,呈中等变异性;(2)在光谱数据lgR下,SOC含量与DIS指数相关系数最高,相关系数为0.80,最佳组合波段为(1 758 nm,1 752 nm);(3)基于不同光谱指数与弓曲差(C)建立的模型验证集精度R2和RMSE分别介于0.67~0.84和5.85~8.45 g/kg,模

    江苏农业学报 2022年2期2022-05-16

  • 基于机器学习的软件缺陷倾向性预测研究
    辑回归算法和随机森林算法分别对数据集进行训练和预测,使用了查准率(Precision)、查全率(Recall)、ROC曲线下面积(AUC)作为模型的评价指标,并给出了对比实验的结果。关键词:机器学习;软件缺陷预测;倾向性预测;逻辑回归;随机森林中图分类号:TP311.5      文献标识码:A文章编号:1009-3044(2022)07-0067-041 引言随着软件行业的快速发展,软件数量剧增,软件的形式趋于多样化,而且软件的复杂程度不断提高、规模不断

    电脑知识与技术 2022年7期2022-05-09

  • 基于信息化的酒店评论情感分析
    分别决策树和随机森林算法并使用处理好的数据进行训练,通过测试集计算出两种算法的ROC性能曲线,发现随机森林算法相比决策树有着更好的性能,满足酒店评论情感分析的需求。【关键词】    随机森林    机器学习    评论分析    机器学习引言隨着互联网的迅速发展,人们越来越习惯于网购,很多人外出住宿都会网上订购酒店,产生了大量的在线评论[6]。评论信息作为只有入住过的顾客亲身体验后的信息,很快就变成了人们看重的酒店服务质量指标。现在去哪儿网是中国最大的旅游

    中国新通信 2022年4期2022-04-23

  • 基于车载自组网的交通事故风险预防方法
    网技术,基于随机森林算法构建解耦式交通—通信仿真框架,评价低比例网联车的二次事故预防效果,结果显示只需较低比例(5%~20%)的网联车可改善事故对交通环境的影响。关键词 车载自组网;事故风险预防;解耦式交通—通信仿真;随机森林中图分类号 V279 文献标识码 A 文章编号 2096-8949(2022)06-0020-03引言车载自组网(Vehicular Ad-hoc Network, VANET)是当前交通运输领域最前沿的技术之一,通过车车(Vehic

    交通科技与管理 2022年6期2022-04-18

  • 多特征融合下视频网站弹幕信息有用性检测研究
    :特征融合;随机森林;机器学习;有用性检测;弹幕信息DOI:10.3969/j.issn.1008-0821.2022.04.009〔中图分类号〕G203 〔文献标识码〕A 〔文章编号〕1008-0821(2022)04-0099-11Abstract:[Purpose/Significance]As the function of the video platform danmaku is well-known to the public,the inf

    现代情报 2022年4期2022-03-30

  • 烤烟柔韧性与内在品质的相关分析
    用相关分析和随机森林回归分析,研究了烟叶柔韧性与主要化学成分和感官品质指标的关系。结果表明,烟叶柔韧性区域差异明显,渝东南烟叶柔韧性好,豫西、湘南烟叶次之,而滇东和豫中地区烟叶总体一般。烟叶柔韧性分值与还原糖、总糖含量,糖碱比值和两糖比值呈显著或极显著正相关。烟叶柔韧性分值与香气质、香气量、杂气、刺激性、干燥感、回甜感等感官指标呈极显著正相关。随机森林回归分析发现,部分地区柔韧性对还原糖含量、香气质和感官综合品质分值变异的贡献率大于其他外观指标。烟叶柔韧性

    中国烟草科学 2022年1期2022-03-21

  • 小微企业信用风险因素识别研究
    究对象,通过随机森林方法对影响小微企业信用风险的关键因素进行识别,并确定关键指标的影响程度和影响方向。结果表明:水电费发生异常的次数、借新还旧次数、还款计划变更次数和民事诉讼次数等企业行为信息是影响小微企业信用风险的关键因素,且均对企业信用风险具有正向影响。关键词:小微企业;随机森林;信用风险中图分类号:C29文献标识码:A文章编号:1005-6432(2022)06-0100-02DOI:10.13939/j.cnki.zgsc.2022.06.1001

    中国市场 2022年6期2022-03-19

  • 长时间序列的凤阳县景观格局分析
    于机器学习的随机森林算法进行地物分类,并与RS、GIS、目视解译等方法结合,对凤阳县1989、1995、2000、2005、2009、2013和2018年7期遥感影像进行土地利用分类和景观格局分析。结果表明:经随机森林分类方法分析得出,总体精度达92.14%,Kappa系数为0.8956。研究结果有助于了解经济快速发展背景下凤阳县土地利用空间格局变化及规律,对于指导凤阳县城乡规划、土地资源管理以及生态环境保护等方面有着重要的参考作用。关键词:景观格局;土地

    安徽农学通报 2022年4期2022-03-13

  • 基于影像组学和机器学习的脑部胶质瘤分级模型研究
    特征集,利用随机森林分类算法构建脑部胶质瘤的分级预测模型。基于机器学习建立的模型在训练组患者中预测胶质瘤级别的准确率达到95.6%,ROC曲线下面积(AUC)达到0.99;在验证组患者中预测胶质瘤级别的准确率达到89.3%,AUC达到0.96。可见,基于机器学习算法,利用影像组学的方法可以对脑部肿瘤的高低级别进行准确的预测和分类。关键词:肿瘤分级;影像组学;机器学习;随机森林中图分类号:TP39     文献标识码:AResearch on Grading

    软件工程 2022年2期2022-03-09

  • 基于集成学习的肺癌存活性预测分析
    性,本研究以随机森林(Random Forest)、LightGBM(Light Gradient Boosting Machine)和CatBoost(Categorical Boosting)三种算法为基模型,通过线性回归集成融合构建RF-LGC肺癌存活性预测模型,运用分层十折交叉验证方法进行仿真实验。实验结果显示,RF-LGC组合模型的预测精度达到了98.0242%,比单一的基模型提高了0.2%;敏感性达到了89.3957%,比单一的基模型提高了3%

    软件工程 2022年1期2022-01-04

  • 基于Wi-Fi指纹和随机森林的定位算法
    -Fi指纹和随机森林的室内定位算法。该算法采用Wi-Fi作为信号源,以接收信号强度指示和基本服务集标识符来构建Wi-Fi指纹库,从而建立随机森林模型用于室内位置感知。仿真实验表明,该算法的定位误差约为2.26 m, 与同类算法相比,在执行时间和定位精度上具有较好的优越性,算法精度提高约3.2%。关键词: 室内定位; Wi-Fi指纹; 指纹数据库; 随机森林; 位置感知文章编号: 2095-2163(2021)07-0102-05中图分类号:TP393文献标

    智能计算机与应用 2021年7期2021-12-07

  • 优化的代价敏感随机森林算法设计研究
    要:代价敏感随机森林算法是解决不平衡数据分析的一种典型方法,在许多领域应用广泛,但其存在着两个不足一是构造代价函数时未考虑样本分布情况,二是对于数据集内的所有特征其距离计算过程相同,未突出重要特征。为解决上述问题,本文提出了一种优化方法根据样本分布情况构造代价因子,并引入权重距离,以提升算法性能。关键词:随机森林;代价敏感;不平衡数据1代价敏感学习在处理不平衡数据时,由于多数类样本与少数类样本数量相差巨大,会导致学习结果出现偏差,生成的分类器会完全偏向于多

    科学与生活 2021年24期2021-12-06

  • 随机森林回归算法预测电影评分
    ,提出了基于随机森林算法的电影评分预测模型。关键词:随机森林;电影评分;数据挖掘;机器学习随着数据挖掘技术的成熟,目前可以运用数据挖掘技术从大量的数据中挖掘到事物间的联系并预测其发展方向。电影评分预测模型可以在电影上映前预测其评分,观众就可以根据预测评分有选择地观影,电影院也可以选择性制定排片计划,电影周边产业也有了参考。一、随机森林算法随机森林回归模型就是综合几个创建好的决策树模型,其预测结果由所有决策树模型的预测结果平均得到。算法基本步骤如下:(一)抽

    科学与生活 2021年18期2021-11-24

  • 基于随机森林的杉木标准树高曲线
    据为例,运用随机森林方法,以胸径、优势树高、优势胸径为自变量,建立树高预测模型。首先根据随机森林的置换精度重要性筛选出建模的自变量,并确定决策树的数量和竞争节点变量数,得到决定系数R2为0.945 0,均方误差MSE为2.696 6的随机森林树高预测模型。利用检验数据对随机森林树高预测模型和传统树高预测模型分别进行精度检验。结果表明:随机森林模型的拟合效果与预测效果都优于该传统树高模型,随机森林模型可以作为有效的树高预测技术。关键词: 杉木;标准树高曲线;

    湖北林业科技 2021年5期2021-11-11

  • 谁是失信人:大数据识别潜在对象
    P;大数据;随机森林;因子分析一、引言近年来,互联网技术在全球范围内蓬勃发展,互联网金融也随之逐渐强大。在此背景之下,一种全新的民间借贷方式——P2P网络借贷应运而生。P2P(Peer to Peer)网络借贷是指借贷者和投资者通过互联网平台在线上完成的小额借贷模式,不需要传统金融机构作为中介参与进来。P2P网络借贷自2007年进入我国,发展至今已经有13年,给投资者和借贷者带来极大助力的同时,也带来了极大的风险。由于P2P网络借贷平台拥有大量借贷者身份信

    科技信息·学术版 2021年22期2021-11-07

  • 基于KMUS-RF算法的复杂产品关键质量特性识别研究
    欠采样的改进随机森林算法(Random forest algorithm base on K-Means clustering under sampling,KMUS-RF),利用K-Means算法对多数样本进行聚类,并根据聚类结果进行多次欠采样形成多个平衡数据集,以随机森林为基分类器进行识别,最终根据分类过程中的特征重要性输出关键质量特性集。算例表明,KMUS-RF算法相比现有的多种分类器有良好的整体分类性能,并能显著降低复杂产品分类的第二类错误率,满足

    中小企业管理与科技·下旬刊 2021年10期2021-11-05

  • 基于随机森林的航材不平衡样本集数据分析方法研究
    于代价敏感的随机森林方法,并在飞机航材保障数据分析中应用,结果表明該方法能够对不平衡数据进行较为准确的分析。关键词:随机森林;不平衡数据;分类器;航材1 引言航材保障是为飞机检修维修提供所需航材的重要工作,其直接关系到飞机能否正常执行任务。缺材停飞指飞机因缺乏航材导致无法飞行,为掌握航材保障工作规律,对保障数据进行分析,预判缺材停飞事件发生具有重要的意义。但是航材保障工作中缺材停飞属于小概率事件,导致缺材停飞的航材占比一般不足百分之五,导致样本集内正样本与

    科技信息·学术版 2021年15期2021-10-21

  • 基于随机森林的光谱分类模型研究
    ;第三节介绍随机森林算法;第四节介绍实验内容以及程序模块,利用Python实现光谱数据的分类并评估结果,然后实行调参,得到最优的参数搭配;第五节对优化模型进行测试,与原模型比较准确率、查准率、召回率、F-score值等指标,发现优化后的结果优良;第六节总结随机森林算法的优缺点。关键词:集成学习;Bagging;随机森林中图分类号:TP273.4 文献标识码:A  文章编号:2096-4706(2021)07-0081-04Study on Spectral

    现代信息科技 2021年7期2021-10-16

  • 基于随机森林的船舶避台失败原因分析
    成功率,采用随机森林对船舶避台失败的原因进行分析,并与决策树进行对比。结果表明:随机森林和决策树对船舶避台失败事故的平均诊断率分别为84.23%和75.56%;随机森林对一般事故和重大事故具有更高的诊断率,分别达到90.0%和96.1%。事故原因分析表明:造成船舶避台失败的首要原因是船员责任感不强;船员责任感不强、决策出现差池和船舶日常管理混乱极易导致船舶避台失败事故。本文研究可为船舶实施合理避台措施提供一定的参考。关键词:  船舶避台失败事故; 决策树;

    上海海事大学学报 2021年3期2021-10-08

  • 基于机器学习的主要汽车生产国外汇交易数据研究
    支持向量机、随机森林、以及XGBoost模型对外汇交易数据评估的预测能力。研究结果表明XGBoost要优于传统的支持向量机和随机森林。关键词:外汇交易 支持向量机 随机森林 XGBoostResearch on Foreign Exchange Data of Main Automobile Production based on Machine LearningBai Yupei Zhang Zhiyang Tang Tingzong Zhang Aij

    时代汽车 2021年18期2021-09-17

  • 一种基于随机森林的扶贫识别办法
    个指标,通过随机森林算法来精确识别贫困人口。通过研究发现,随机森林算法在甄别贫困人口中效果好,同时拥有较大的灵活性,能较好适应精准扶贫识别工作。[关键词]精准扶贫;机器学习;随机森林;评价指标[DOI]10.13939/j.cnki.zgsc.2021.25.0221 引言2018年2月12日,习近平总书记在打好精准脱贫攻坚战座谈会上强调,脱贫攻坚,精准是要义。必须坚持“六个精准”,扶贫扶到点上扶到根上。但是,随着扶贫工作难度的提高,一些缺陷日益突出。一些

    中国市场 2021年25期2021-09-14

  • 基于评分卡模型下中小微企业的信贷决策
    双目标规划;随机森林;熵权法[DOI]10.13939/j.cnki.zgsc.2021.27.0531 引言中小企业为我国经济发展做出了巨大贡献,但在资金筹集方面,商业银行对其存在“惜贷”“拒贷”的现象。主要原因是无法对中小微企业做出精准的风险评估。因此,银行通常是依据信贷政策、企业的交易票据信息和上下游企业的影响力,根据中小微企业的实力、信誉对其信贷风险做出评估,向实力强、供求关系稳定的企业提供贷款,其中信誉度高、信贷风险小的企业提供利率优惠。依据信贷

    中国市场 2021年27期2021-09-14

  • 基于机器学习算法的中小企业信用评估研究
    章建立了基于随机森林和支持向量机两种机器学习算法的信用预测模型,并引入ACC、AUC以及FNR评价指标来衡量模型预测的效果。对比实验表明,基于随机森林的信用预测模型较支持向量机模型具有更好的预测效果,证实了模型的优越性。关键词:随机森林;支持向量机(SVM);信用评估模型;中小企业0 引言中小微企业在吸收社会就业和促进经济发展方面逐渐发挥着越来越重要的作用[1],而中小企业本身内外部的局限性也使其始终面临着严重的融资缺口。在此背景下,各金融企业放宽了对其贷

    无线互联科技 2021年12期2021-09-13

  • 基于LSTM模型的国民经济GDP增长预测建模研究
    ;特征选择;随机森林中图分类号:F12        文献标志码:A      文章编号:1673-291X(2021)19-0005-05引言近几年,全球经济和贸易增长逐渐放缓。国际环境复杂多变,贸易壁垒不断增加,世界经济面临增长乏力的局面。中国经济正在由高速增长阶段转向高质量发展。受全球经济放缓和中美贸易摩擦不确定的影响,经济运行总体平稳,GDP增速放缓。GDP增速反映经济发展趋势,与人民的生活水平息息相关。中国国家统计局数据显示,中国经济经过多年的高

    经济研究导刊 2021年19期2021-09-12

  • 基于AdaBoost-随机森林算法的农户信贷风险评估研究
    Boost-随机森林方法对农户小额信贷风险进行评估。根据模型结果,构建农村信贷风险管理体系,在降低信贷风险的同时最大限度致力于金融扶贫工作。关键词:农户信贷风险;AdaBoost;随机森林二十一世纪以来,“三农”问题一直对国家农村经济发展和金融稳定有着很大的影响,要想发展农村经济,必不可少的一步就是加大对农村金融的投入,基于此农户小额信贷开始在我国农村普遍实行开来。金融政策不断加大对农户的服务力度,力求建立完整、完善的信贷风险评估机制对有贷款需求的农户进行

    商业2.0-市场与监管 2021年3期2021-09-10

  • 基于物元分析法的石材可锯性分级
    标体系。采用随机森林算法(Random Forest,RF)对石材可锯性评价指标进行赋权,基于物元分析法评定石材的可锯性等级。研究结果表明,通过RF确定指标权重可以减少主观赋权的影响;利用物元分析法综合评价石材可锯性,确定企业加工石材的可锯性为0.042,容易等级,可为企业进行石材加工提供参考依据。关键词:石材;可锯性;随机森林;物元分析法中图分类号:TH12;TH16文献标志码:A收稿日期:2020-09-18基金项目:国家自然科学基金(批准号:7170

    青岛大学学报(自然科学版) 2021年2期2021-09-10

  • 基于随机森林模型的台区相序识别方法
    ,提出了基于随机森林算法的低压台区相序关系自动识别方法。首先基于随机算法原理搭建了用于台区相序识别的随机森林算法模型,并提出采用 F1_score统计值作为识别模型的评价指标;然后将搭建好的模型应用到实际台区进行训练,训练方式设置了两类测试集:口袋内台区测试集与口袋外台区测试集;最后将训练好的算法模型对测试样本进行相序分许。实证结果证明,所提方法对台区的相序拓扑分析有較高准确性,为低压台区拓扑分析提供了一种技术思路和可行方法。关键词:低压台区;相序识别;随

    机电工程技术 2021年12期2021-08-21

  • 基于BPSO-RF的航运企业信用风险评价研究
    用风险评价;随机森林中图分类号:U692             文献标识码:A            文章编号:1006—7973(2021)06-0057-041 引言党的十八大以来,习近平总书记先后12次视察航运企业,对新时代航运业发展寄予厚望,指出“经济要发展,国家要强大,交通特别是海运首先要强起来”。我国始终贯彻“一带一路”、“海运强国”的国家战略,“强国”的基础是经济,经济的增长离不开贸易,而贸易的最重要载体就是航运。航运业始终处于国际市场的前

    中国水运 2021年6期2021-08-10

  • 基于电商评论的网购商品特征提取及价格预测
    价格预测  随机森林中图分类号:F713.36                           文献标识码:A                    文章编号:1674-098X(2021)02(a)-0124-06Feature Extraction and Price Forecasting of Online Commodities Based on E-commerce CommentsPU Chengyu(School of Mathemat

    科技创新导报 2021年4期2021-07-27