基于数据挖掘的大学生创业能力模型研究*

2022-12-04 02:31
中文信息 2022年9期
关键词:热词大赛大学生

沙 岩

(徐州医科大学医学信息与工程学院,江苏 徐州 221000)

随着移动互联网、云计算、物联网的快速发展,特别是移动客户端、社交网络、位置服务(LBS)等信息发布方式的不断涌现,数据正以前所未有的速度在不断地增长和累积[1],全球数据在2010年进入ZB时代。IDC监测数据表明,人类自有史以来所有数据量大约每18个月翻一番,全球产生和存储的数据总量从2009年的0.8ZB(万亿GB)增加到2018年的33ZB,并预计在2025年达到175ZB。

大学生创业能力和水平不断提升,成就感不断增强,参与社会主义市场经济发展、享有社会主义改革成果达到新高度[2]。大学生受教育水平不断提升。大学生创业之路更加多元化,创业水平和质量进一步提高。同时,数据存储、互联网、可穿戴设备、网络爬虫等新技术的发展,数据收集变得原来越容易,大学生创业数据出现大爆发的趋势。

我国全面产业转型升级为大学生创业赋予了全新的机会。近年来科学技术革命性变化带来组织模式的重大变革,大数据、云计算和移动互联网快速发展,使生产组织方式呈现出了明显的个人化、小规模化、分布化等特征[3]。互联网和物联网的高速发展,促生了大量商业运营平台和产品模式创新。“互联网+”和大数据在带来传统产业结构重构的同时,更催生了无数的商业机会和价值创造空间,它把人重新组织进新的财富创造体系之中[4-6]。大学生创业项目更是如遇春风,尽享组织变革、消费升级带来的绝好机会。设计、生产、包装、销售等活动不再受场所和物理空间限制,极大缩减了管理运营成本和生产要素成本,这些提供了大学生创业的充分条件[7-9]。大学生创业与我国产业升级的多维融合,使大学生创业能力进一步提升[10]。大学生创新创业的微生产、微体验、微设计等各种小型组织形态,实现了强大的市场网络效应,为原本生存很难的小微个体生产组织提供了全新的交易和体验环境,激活了大量大学生创业所需的信息、知识等生产要素[11-12]。带动了成千上万大学生创业,涌现出海量的大学生创业案例,其报道出现在形式各样的社交网络中。然而我们关注的往往是其蕴含信息的实时性,其创业过程的累计数据价值没有得到较好利用。如何高效、充分地利用这些海量创业数据,并对大学生创业产生正面引导价值,促进大学生更好更快创业,是我们值得思考的问题。

一、研究设计

1.数据选取

2015年5月21日教育部下发通知举办第一届中国“互联网+”大学生创新创业大赛,大赛由教育部与政府、各高校共同主办的一项技能大赛。从表1可以看出,中国“互联网+”大学生创新创业大赛从第一届举办开始,参赛高校数量逐年增加,举办高校多为双一流建设高校,此项赛事已成为众多青年实现创新创业成才梦想的摇篮和青年创新创业“奥斯卡”盛会。

表1 2015—2020年中国“互联网+”大学生创新创业大赛详细情况

第八届中国国际“互联网+”大学生创新创业大赛2022年4月8日启动以来,已有281万个项目、1210万名学生报名参赛,无论参赛项目数还是报名人数均均成为全国影响力最大的大学生创业大赛,数据如表2所示。

表2 2020—2022年中国“互联网+”大学生创新创业大赛规模情况

文章选取2020—2022年中国“互联网+”大学生创新创业大赛项目信息作为数据分析的主要来源,通过网络爬虫、数据挖掘等技术实现大学生创业资源数据的撷取、存储、提炼、处理、集成和分析。从而对大学生创业产生正面引导价值,促进大学生更好更快创业,提高对大学生创业的辅助决策能力。使其更好地参与经济社会发展、享有改革发展成果,同时为大学生创业提供全面准确的科学依据和决策支持。

2.网络爬虫

网络爬虫是一个按照一定逻辑扫描或者“爬行”网页的程序或者脚本,网络爬虫是一种计算机程序,可以根据科学计算、数据处理及网页开发等方面的需求,在互联网上进行数据、信息的爬取,高效、精准地进行数据采集[13-14]。基于此,本文结合络爬虫的技术原理对大学生创业热点进行分析。在此基础上,进行大学生创业数据采集。本文主要抓取2020—2021年中国“互联网+”大学生创新创业大赛中获得各类奖项的文本信息,对出现频率较高的关键词进行描述和可视化表示。

3.数据挖掘

本文利用K均值、EM等聚类算法,针对中国“互联网+”大学生创新创业大赛积累的大量创业数据建立分群模型,通过分群模型对创业者进行细分,找出有相同特征的金银牌创业团队,然后有针对性地进行展示。而且,聚类算法也可以实现离群点检测,即在对创业数据进行聚类的过程中,发现一些创业团队的异常数据,据此判断这些创业团队是否存在有特点的创业思路。使用C4.5、SVM和贝叶斯等分类算法,针对创业团队的行为数据,对创业团队进行等级评定。使用预测相关的算法,对创业能力模型进行建模,建立预测模型,预测创业风险,采取措施保护大学生创业者。使用相关分析找出金银牌创业团队的潜在规律,哪些创业模式容易获得中国“互联网+”大学生创新创业大赛金银牌。如图1所示。

二、数据结果分析

我们现在处在数字经济时代,数字经济的影响力和增长点持续增强,以新工科、新医科、新农科、新文科助力“新农业、新农村、新农民、新生态”建设,引导广大高校创业者扎根基层创新创业。在全球新一轮信息化浪潮下,云计算、大数据、物联网、移动通信、人工智能、机器人、虚拟现实……持续发力,信息科技在今后相当长的一个时期内依然是世界经济社会发展,尤其是中国经济转型升级的主要驱动力。利用网络爬虫技术,抓取2020—2021年中国“互联网+”大学生创新创业大赛中获得银奖以上的项目文本信息,包括项目名称、所属区域、所属学校及项目负责人信息。利用关联规则数据挖掘技术,数据分析如下。

1.大学生创业把握热点、项目开发能力较强

从2021—2022年中国“互联网+”大学生创新创业大赛参赛项目名称中,共提取了60个热词,出现频率较高的热词包含人工智能、信息技术、信息科技、云计算、大数据等。主要的技术方向分为硬件设备研制和软件及其信息化系统研制,与工程项目紧密结合,更偏重于技术设计实现和未来工程实用。

2.大学生创业能力存在区域优势

从2021—2022年中国“互联网+”大学生创新创业大赛参赛项目中,共提取了10个项目区域热词,出现频率较高的热词包含北京、上海、成都、南京等。从这些热词上来看,这些区域属于较发达地区,创意思维、资本成熟度等各类资源都较为齐全。

3.大学生创业能力培养高校之间创存在差距

从2021—2022年中国“互联网+”大学生创新创业大赛参赛项目中,共提取了10个项目来源高校热词,出现频率较高的热词包含电子科技大学、西安电子科技大学、浙江大学等。电子科技大学学子在第七届中国国际“互联网+”大学生创新创业大赛取得2金5银佳绩。这些大学有以下特点:强调文理结合和理工融入,本科生教育更强调塑造兴趣丰富、人格完整、科学思辨的通识人才,而不是把本科生直接培养成专家;上研究生、争取出国深造、争取短期交流交换,出国交换等概率较高。

三、研究启示

通过关联规则数据挖掘分析,在万物互联的大数据时代,我国大学生创业把我热点、项目开发能力较强,能够紧贴时代需求和社会需要。但大学生创业能力存在区域上的差距和高校之间的差距。可从以下方面提高大学生创业能力,使其更好地参与经济社会发展、享有改革发展成果,为有关部门提供全面准确的科学依据和决策支持。

健全创业教育体系,提升高校创业氛围,推进产教融合,搭建大学生创业与企业之间的桥梁。面向“学校+生态”特色人才培养战略。以学校为中心,企业为生态,校企协同,形成协同育人资源圈,与企业共同打造“校—企”无边界协同育人新模式,与企业签订合作协议,合作开展教育培训及项目开发,打造实习实训实践平台。在与企业协同构建实训基地过程中,挖掘社会新需求,深化技术融合、产教融合。

优化高校创业培育体系,培养大学生创业思维。建立“产教融合、双创育人”培养模式,提升学生创新实践能力。深化OBE“成果产出为导向”的教育理念,培养产教融合的复合型人才;将综合课程设计、学科竞赛、企业培训、创新团队建设纳入实践课程群;鼓励学生参与各级创新创业活动,切实将学生双创能力提升放到首位。发挥校企联盟优势,促进创新创业成果转化。

立足大学生创业者成长成才需求,积极引导广大大学生创业者投入科研创新实践,搭建创客空间,为大学生创业育人助力,形成学生参与科技创新活动的常态化机制。推进协同育人、促进大学生创新精神、创业意识和创新创优能力的增强。

猜你喜欢
热词大赛大学生
“鸟人”大赛
插秧大赛
热词
热词
热词
带父求学的大学生
大学生之歌
让大学生梦想成真
“7匹狼”征联大赛启事
他把孤儿院办成大学生摇篮