首页 期刊简介 最新目录 过往期刊 在线投稿 欢迎订阅 访客留言 联系我们
新版网站改版了,欢迎提出建议。
访客留言
邮箱:
留言:
  
联系我们

合作经济与科技杂志社

地址:石家庄市建设南大街21号

邮编:050011

电话:0311-86049879
友情链接
·中国知网 ·万方数据
·北京超星 ·重庆维普
劳动/就业
河南省科研人才需求预测模型及其检验
第718期 作者:□文/丁靖哲 时间:2023/12/1 15:11:27 浏览:292次

[提要] BP神经网络可以通过学习功能利用样本数据模拟复杂的函数,适用于解决科研人才需求预测问题。本文搜集河南省有关数据,利用BP神经网络构建科研人才需求预测模型,并对模型的预测精度进行评估,在科研人才需求预测结果基础上,提出预测模型的改进措施。

关键词:河南;BP神经网络;科研人才;人才需求预测模型

中图分类号:F24 文献标识码:A

收录日期:2023222

一、文献综述

BP神经网络是人工神经网络的传统模型之一,Lapedees等首先采用非线性神经网络对时间序列数据进行了训练并进行预测,结果表明神经网络预测模型具有更高的预测精度。

神经网络方法经过多年发展已经被学者们广泛采纳和使用。如何永贵、韩月娥等学者运用神经网络方法预测企业人力资源需求,发现在企业人力资源需求领域,神经网络有其独特优势。陈振斌、张万红和彭勃运用神经网络模型对江苏省技术人才进行动态预测,发现神经网络在预测动态人才系统时的优点。雷明佳、孙钰涵等运用BP人工神经网络模型预测林业系统从业人员数量变化。文岚和张娜结合广西区域经济发展特点应用BP神经网络模型预测广西科技人才需求量,发现BP神经网络可以对广西科技人才需求量实现较好的非线性拟合,并进行自学习自适应。何文章、咸桂彩、陈珂运用BP神经网络预测了高技能人才数量随时间变化的规律。

既有研究表明,利用BP神经网络构建的人才需求预测模型与其他研究方法相比具有一定优势,但仍需不断完善。鉴于此,本文根据BP神经网络相关理论,选择相关指标,并采用河南省20102020年相关数据,构建了科研人才预测模型,并采用相关指标对模型进行评价,为科学开展科研人才需求预测工作提供方法依据。

二、河南省科研人才需求预测BP神经网络模型构建

BP神经网络的基本理论是:学习过程通过正向传播信号和反向传播两个过程组成。正向传播时,把样本的特征从输入层进行输入,信号经过各个隐藏层的处理后,最后从输出层传出。对于网络的实际输出与期望输出之间的误差,把误差信号从最后一层逐层反传,从而获得各个层的误差学习信号,然后再根据误差学习信号来修正各层神经元的权值。BP神经网络预测法的优势是对变量间的非线性现象的完美解释和随意调整模型结构。此外,模型结构之间的差异,致使预测性能也有所不同,在研究多元变量间的预测领域发挥独特作用。因此,基于BP神经网络理论,利用Python软件对科研人才需求进行预测,有助于科学合理地发现科研人才需求规律。

(一)指标筛选。指标体系的建立是对问题进行研究的前提和基础,科研人才需求预测的难点在于如何选择高质量指标,这就要求所选取的指标能够解释影响人才需求的因素。

科研人才的数量取决于科技的发展环境,而科技的发展环境包含的要素较多,目前普遍的观点是影响科技人才的主要因素包括经济发展水平、科技教育和居民素质状况、人才工作环境状况等。由于科研人才需求预测容易受到区域经济以及政策的影响,与其密切相关的指标具有时序性、复杂性的特点,所以很难建立包罗万象的指标体系,因此必须在此基础上优化选择,从实际出发选出具有代表性和可操作性的指标,构建影响科研人才需求的指标体系。

(二)具体指标。影响科研人才需求预测的因素是复杂多样的,在选择科研人才需求预测的指标时,应该综合衡量经济、社会、科技和教育等其他因素对科技人才需求可能产生的影响。

1、经济发展水平指标。该类指标应体现区域经济发展状况,应包括区域生产总值、人均可支配收入、财政收支、固定资产投资、经济增长率等指标。经济越发达的地区,对科研人才的需求量也越大。

2、社会发展水平指标。该类指标应考虑就业人员行业和就业者文化水平,应包括就业人数、高校学生数、第三产业从业比例等因素。社会生活环境同样影响科研人才需求。当社会生活环境优化时,地区对科研人才吸引力提高。因此,在进行科研人才需求预测时,需要充分考虑社会生活环境对科研人才的需求影响状况。

3、科技和教育指标。科技创新资源尤其是高新技术产业具有强大的拉动力量,有利于城市科技创新步伐,对于提高区域科研人才需求数量也有一定的促进作用。教育文化环境体现了地区教育水平、人才受教育程度和教育投入产出状况。高等学校规模与硬件设施、研究机构数量等因素同样对科研人才的需求存在影响。

基于上述分析,结合现有文献所构建的指标体系,本文构建了科研人才需求预测指标体系,如表1所示。为保证指标的合理性并确保模型预测精度,在科研人才需求预测指标的筛选中,本文运用多元统计分析法对上述指标进行分析。使用河南省面板数据,运用SPSS软件对上述指标进行分析,再选取与科研人才需求最相关的指标。分析显示,相关系数最高的指标为人均区域生产总值、劳动生产率、区域生产总值、固定资产投资、人均可支配收入、财政收入、财政支出、科研经费支出、专利申请数、专利授权数、高等学校平均在校生、高等学校平均毕业生、高等学校专任教师数、教育支出、科学技术支出、科研机构数量,其相关系数分别为:0.940.940.950.930.950.950.950.940.920.90.930.920.950.960.920.83。上述指标的相关系数均在0.9上下浮动,表明这些指标对科研人才需求数量的影响比较大。因此,本文认为影响科研人才需求预测的主要指标为财政收支、区域生产总值、人均地区生产总值、劳动生产率、固定资产投资等16项指标。(表1

(三)模型构建。BP神经网络是最传统的神经网络,当面对大量数据时,BP神经网络可以通过学习数据集中的模式和关系,自动发现其中的规律并进行分类、回归等任务。BP神经网络具有可以处理高维数据、自适应性强、学习能力强、并行计算能力强等优点,从而可以刻画出高精度模型。基于BP神经网络的科研人才预测模型构建的主要任务是处理样本数据、设计网络结构,并对网络进行训练与检验。

1、数据样本的选择处理。首先,需要选择具有代表性的数据,从而使BP神经网络在学习的过程中可以处理表现内部关系的数据,进而通过算法发现数据之间的模式关系。其次,大样本数据可以使模型预测结果精度更高。最后,将样本数据归一化,将数据映射在[-11]的区间内,便于不同单位或量级的指标能够进行比较和加权。使用的公式为:X=x-xmin/xmax-xmin)。其中,X代表归一化处理后的网络数据,x代表归一化处理前的原始数据,xmaxxmin分别代表原始数据中的最大值与最小值。经过归一化后,将有量纲的数据变成无量纲数据,还可以达到简化计算的作用。

2、网络结构的设计。网络结构的设计分为确定网络层数和设置神经元数量两项任务。网络层数和设置神经元数量的确定需要重复多次试验,根据实验的结果来确定最佳数量。

1)确定网络层数。BP神经网络模型的隐藏层可以选择一层或者多层,二者的差异主要体现在隐藏层层数的数量不同。对于简单的小数据集,通常使用一层或两层隐藏层。但对于与时间序列相关的庞大数据集,则需要更多的层数。层数越多,拟合数据的能力更强,可以有效降低模型的输出误差,效果按理说会更好,但是实际上更多的层数可能会引起模型过拟合,同时也会导致训练次数增加,训练成本过高,模型难以收敛,从而造成BP神经网络模型难以适应新数据。因此,在设计BP神经网络时,本文选择只有一层隐藏层的三层BP神经网络模型,此种神经网络模型在处理小规模时间序列数据时性能优异,且训练成本较低,速度较快。

2)设置神经元数量。输入层的神经元数量等于待处理数据中输入变量的数量,输出层的神经元的数量等于与每个输入关联的输出的数量。隐藏层神经元数量会影响模型学习能力。神经元数量过少将导致模型难以从数据中提取有效信息,引起欠拟合。当神经元数量过多时,需要更大的训练集来确定连接权值,并且会增加训练成本,减弱容错性能,导致预测结果偏差过大。因此,需要确定合适的隐藏层神经元数量。隐藏层神经元个数的确定需要自己不断试验。借鉴经验公式i=+a,计算出神经元数量的大致数量。从一个较小神经元数量开始不断进行网络训练,最后选择可以使网络训练误差达到最小的神经元数量。

3、网络训练与检验。在网络构建完成后,接下来输入样本数据进行网络训练与检验。神经网络的学习,也就是训练过程,指的是输入层神经元接收输入数据,将信数据传递给中间层神经元,最后传递到输出层神经元,由输出层输出数据处理结果的过程。在这个过程中,神经网络不断修正网络的权值和阈值,实现模型的学习和训练,当网络输出的误差减少到合理范围内,或者完成学习次数后,就可以终止学习。在网络模型训练中,使用学习率来调整网络的权值和阈值。学习率直接影响我们的模型能够以多快的速度达到最好的精度。一般来说,学习率越小,损失梯度下降的速度越慢,可以避免错过任何局部最优解,但也意味着我们要花更多时间来收敛。但是,如果太大,就会导致收敛不稳定,始终难以达到最优。通常先以较低的学习率开始训练模型,在后续训练过程中逐渐提高学习率,从而估计出最佳学习速率。

网络检验的目的是保证通过训练集数据训练出的网络模型对测试集数据具有良好的泛化能力。通常将数据划分为两部分,将70%的数据作为训练集,剩余30%数据作为测试集。如果网络模型在训练集正确度比较低,在测试集上测试正确度较低,说明网络训练欠拟合,泛化能力良好;反之,则说明泛化能力较差。在网络精度不断提高的前提下,将测试集数据输入到网络模型,计算预测误差,误差越低则模型的拟合效果越好,预测精度越高。

4、程序实现。这一步主要通过Python软件实现,运用Python内部自带的神经网络工具箱对数据进行仿真训练。主要使用Train函数和Sim函数。Train函数是一种用来建立模型的机器学习函数,用于从原始数据中训练某种模型,从而得出一个最优模型,使模型实现最小误差的预测效果。Train函数用于训练创建好的网络,指导网络连接权重的更新以及阈值的调整。Sim函数用于用训练好的BP神经网络预测函数输出并修正完善BP神经网络。

三、实证分析

本文基于BP神经网络基本思想构建科研人才需求预测模型,选择河南省数据作为样本数据,并检验该模型在实际运用时的有效性。

(一)样本选择和样本数据来源

1、样本选择。本文选择河南省区域数据作为样本。河南省作为人口大省,面临着经济转型和经济结构性调整的重要任务。在优化经济结构、选择新的经济增长点的情况下,现有的科研人才效用难以得到充分发挥。基于上述分析,科研人才需求预测模型的输入变量为财政收支、人均地区生产总值、劳动生产率、固定资产投资等16个变量;输出变量为科研人才需求量。由此得出,输入向量为Xk=xk1xk2xk3,…,xkn),k=123,…,n,输入单元个数n=5;期望输出向量为Yk=yk1yk2yk3,…,ykm),输出单元个数m=1,包含一个隐含层。隐含层神经元个数通过多次训练确定为12。该模型的相关权值设置为:学习率Lr=1e-3,最大训练次数Epoch=2000

2、样本数据来源。为了使科研人才需求预测具有代表性和稳健性,本文搜集了河南省20102020年科研人才需求预测相关变量指标的时间序列数据。(表2

(二)网络训练与测试

1、网络训练。BP神经网络训练将20102016年数据作为训练集。为了提供更快的收敛和更稳定的训练,在训练前对训练集数据进行归一化处理。训练集数据处理完成后,使用多层感知机(MLP)对数据进行拟合训练进行回归预测,运用train函数对测试集数据进行网络训练,网络训练结果见图1。(图1

2、网络测试。模型训练结束后,对模型进行测试以验证其在真实预测过程中的准确性。使用20172020年数据为测试集,在对测试集数据进行归一化处理后将数据输入已训练好的神经网络模型中,进行网络仿真。比较输出值与真实值的误差,从而检验网络性能。测试结果见表3。(表3

由表3可知,20172020年河南省科研人才需求数量预测值分别为106339人、110451人、117431人、123913人。通过BP神经网络预测得到预测值与真实值之间的相对误差均值约为0.037041021,平均绝对百分比误差约为0.037041021,说明了预测值与真实值之间偏差较小,BP神经网络在科研人才需求预测上不仅是有效的,而且精确度较高。

四、结论及启示

精确有效的科研人才需求预测是制定科研人才培养和吸引规划的前提。基于BP神经网络的科研人才需求预测模型借鉴了先前学者的研究成果,运用多元统计分析法选取影响科研人才需求的各项指标,构建了科研人才预测模型,有助于发现河南省科研人才需求数量的内在规律。

基于BP神经网络构建的科研人才需求预测模型有以下优点:可以在软件内部直接调用工具箱,易于操作,结果直观明确。但也存在局限性,比如隐藏层神经元个数没有固定标准,需要通过重复多次训练来得到最佳参数,从而提高模型预测精度。因此,本文认为在利用BP神经网络进行科研人才预测时,可以在以下方面进行完善:首先,需要关注科研人才需求预测高度相关的指标。根据经济发展状况和政策变化完善相关指标体系,重视对预测指标体系研究,关注预测指标体系的动态变化,为实现合理的科研人才需求预测工作提供基础。此外在选取预测指标数据时,要避免出现极端数据和数据缺失情况,从而使模型预测结果具有稳定性。并且需要确保该指标统计口径一致,防止指标数据出现不明变化。其次,采用合理的模型变量选择方法。运用多元统计分析法选择模型的输入变量虽然可以提高模型预测能力,但是变量之间具有多重共线性,而且模型难以解释各个变量对输出变量的影响程度。因此,在应用BP神经网络构建科研人才需求预测模型时,需要进一步研究并改进变量选择和模型算法。

(作者单位:河南大学经济学院)

 

主要参考文献:

1]何永贵,韩月娥,杨实俊,等.人力资源需求预测模型的优选[J.华北电力大学学报,200506.

2]陈振斌,张万红,彭勃.基于Elman神经网络的江苏技术人才需求预测[J.商场现代化,200712.

3]雷明佳,孙钰涵,何欣远,曹颖.基于BP神经网络的我国“卓越农林”人才需求预测与分析[J.现代商业,202020.

4]文岚,张娜.基于BP神经网络的广西人才需求预测实证分析[J.中小企业管理与科技(下旬刊),201802.

5]何文章,咸桂彩,陈珂.高技能人才需求预测及对策建议[J.职教论坛,201527.

6]王静.基于人工神经网络的旅游市场趋势预测方法研究[M.北京:经济科学出版社,2012.

7]苗海艳.山西省高技能人才需求预测研究[D.太原:太原理工大学,2015.

8]焦淑华,夏冰,徐海静,等.BP神经网络预测的MATLAB实现[J.哈尔滨金融高等专科学校学报,200901.

9]沈钰,韩永强.技术技能人才需求预测模型及其检验——基于BP神经网络视角[J.当代职业教育,202002.

 
版权所有:合作经济与科技杂志社 备案号:冀ICP备12020543号
您是本站第 32387757 位访客