基于支持向量回归机的复杂产品费用估算技术发展研究论文(精选3篇)由网友“白大官人”投稿提供,下面是小编为大家整理后的基于支持向量回归机的复杂产品费用估算技术发展研究论文,仅供大家参考借鉴,希望大家喜欢!
篇1:基于支持向量回归机的复杂产品费用估算技术发展研究论文
基于支持向量回归机的复杂产品费用估算技术发展研究论文
摘 要:传统的费用估算算法需要大量的样本数据来保证其估算的准确性,但在实际应用中,由于样本数据的有限性,其准确性无法得到保证,针对这种情况提出使用基于统计学习理论的支持向量回归机(SVR)进行费用估算,并通过具体实例详细阐述基于SVR的费用估算具体步骤,包括数据预处理、基于SVR的训练、估算和后处理过程,通过与神经网络方法相比,实验结果验证了SVR在小样本情况下具有更好的估算精度。最后实现了基于SVR的复杂产品费用估算方法,并集成于复杂产品费用估算系统。
关键词:复杂产品; 支持向量回归机; 小样本; 费用估算
中图分类号: TN711?34; TP319 文献标识码: A 文章编号: 1004?373X09?0038?05
Abstract: Since plenty of sample data is required to ensure the accuracy of traditional cost estimation algorithm, and it is hard to ensure the accuracy of estimation due to the limitation of sample data in practical application, the support vector regression (SVR) based on statistical learning theory is proposed to make cost estimation. The specific steps of cost estimation is described in detail based on SVR, including data preprocessing, training based on SVR, estimation and post?processing. The experiment result verifies that the estimation accuracy based on SVR in small sample data is better than the method of neural network. Finally, the method of complex product cost estimation based on SVR is implemented, and is integrated in the system of complex product cost estimation.
Keywords: complex product; support vector regression; small sample; cost estimation
0 引 言
随着高新技术及现代生产的发展,复杂产品(如导弹、舰船、飞机等)的性能和复杂性越来越高,其在使用以及维修保障过程中的各种费用也不断增加,若不提前对复杂产品的费用进行有效地预估和判断,将会影响到对复杂产品做出合理性和经济性的生产决策,由此而导致的费用的增长不但会成为沉重的经济负担,而且还会影响到对新型产品的预研和投资。因此,有必要采用科学的费用估算方法,及时准确地对产品未来的费用进行估算,做出合理的费用计划,节约有限的成本费用。
传统的费用估算方法主要有工程法、参数法、类比法和专家判断法,这些方法都存在着一些不足之处。一些比较新的理论包括偏最小二乘回归法、灰色理论、神经网络、遗传算法也已应用于费用估算,取得了不错的效果,如文献。然而,这些统计理论只有在费用样本数量趋于无穷大时才能有理论上的保证,但在实际应用中,受到各种条件的限制,很多用于费用估算问题的产品费用样本容量很小,信息不足,不能反映整个产品费用样本空间的分布,故而这些理论在实际应用中往往难以取得理想的效果。因此建立适合于小样本情况下的复杂产品估算模型显得尤为重要。在此背景下,Vapnik等人基于统计学习理论提出一种借助于最优化方法解决机器学习问题的新工具,即支持向量机(Support Vector Machine,SVM),它根据有限的'样本信息,采用结构风险最小化原理,对独立的测试样本能够得到较小的误差,包括支持向量分类机(Support Vector Classification,SVC)和支持向量回归机(Support Vector Regression,SVR),被认为是目前针对小样本的分类和回归问题的最佳方法。本文推广应用了支持向量机中的回归部分,将支持向量机算法应用于复杂产品的费用估算,利用支持向量机对历史费用数据进行训练,逼近费用数据所隐含的函数关系,完成费用与影响参数之间的映射关系,进而完成对复杂产品未来费用的估算。
1 SVR原理
SVM最初是用来解决模式识别的问题,在模式识别中,为了发现具有好的推广能力的决策规则,将所选择的训练数据的一些子集,称做支持向量机。支持向量机的方法也可以应用到回归问题中,标准的SVR算法,分为线性和非线性两种,其基本思想是:通过非线性变换将输入空间向量映射到高维特征空间中,运用结构风险最小化原则在这个特征空间构造回归估计函数,这种非线性变换是通过定义适当的核函数来实现的。其中是指由输入空间到特征空间的非线性映射。
步骤1:收集样本数据,将样本数据分为训练样本数据集和待估算测试样本数据集,选择输入参数、输出变量:其中输入参数主要是指影响到产品最终费用的参数,包括对时间敏感参数(如年份、月份等)和对时间不敏感参数(如质量、体积等),输出变量主要是指所关注的产品费用(如产品整体的费用或者由输入参数影响的产品某一部分的费用等);
步骤2:将训练样本数据集中随时间变化的费用参数数值用居民消费价格指数(Consumer Price Index,CPI)统一转换到基准时间段的费用数值;
步骤3:对统一转换后的数据进行归一化预处理,将参数数值及费用数值限制在之间,形成归一化后的训练样本数据集;
步骤4:选择核函数,设置训练参数,利用SVR对费用样本数据进行训练:训练过程经常采用基于凸优化的对偶理论,来求解式(5),得到解
步骤5:根据训练结果构造回归估计函数:通过训练计算得出的以及选择的核函数,回归估计函数可表示为
步骤6:用回归估计函数对预处理后的待估算费用样本进行估算,计算出估算费用值;
步骤7:将估算出的费用值通过预处理过程的逆处理过程得到估算费用的精确值。
2.2 费用数据预处理
为了提高数据计算效率和保证训练和估算准确度,需要将费用样本数据进行预处理。费用样本数据的预处理包含两部分:费用数据的统一转换与归一化处理。
2.2.1 费用数据的统一转换
随着时间的变化,由于通货膨胀或收缩、物价上涨或下降等原因,相同的费用值在另一个时间段的实际经济价值会有所不同,因此需要把对时间变化敏感的费用数据统一转换到统一的币制和相同基准时间段(在此时间段里 ,物价相对比较平稳,费用的实际经济价值浮动变化很小),费用的时间价值采用年或月为基准,并考虑使用CPI指数进行转换,在以往的研究中,对于复杂产品如导弹等的费用估算,相关的时间因素只是作为训练参数进行计算,对受时间影响的费用并没有做转换,因此而训练出的回归估计函数并不能真正反映费用变化规律,如文献中对所需要进行费用估算的产品没有考虑到时间因素的影响,文献中数据所呈现的不同产品的研制年份不同,其费用的真实经济价值是不同的,因此需要将不同时间段(年份或月份)的费用值转换到基准时间段的数值,对费用真实变化规律进行函数拟合,费用数据统一转换的具体转换规则如下:
2.4 训练结果及误差
SVR对费用数据的训练停止后,其训练费用值与实际值对应如表5所示,其中神经网络训练费用值采自文献,费用价格以1985财年为基准。
2.5 费用估算及后处理
对待估算样本数据进行预处理后使用上述SVR进行费用估算,待估算样本数据的预处理以训练样本各特征参数的最大值和最小值为参照进行类似归一化处理,其值可不必在区间之内,估算费用结果如表6所示,其中神经网络费用估算值采自文献进行对比,费用价值以1985财年为基准。估算出产品在基准财年的经济价格之后,可根据需要按CPI指数将其转换到所需要的财年的价格,便于比较和决策。由实验统计数据可见,相比于神经网络算法,SVR在小样本条件下进行费用数据估算时,其训练误差可能不比神经网络小,但其估算的费用误差要远远小于神经网络的估算费用值,这说明在小样本条件情况下,SVR的推广能力要强于神经网络。
3 系统说明及展示
基于本文描述的算法所依赖的项目背景,使用C#.NET基于B/S架构实现一个复杂产品费用估算系统,系统提供了对复杂产品全生命周期中费用不同维度上的分析和管理,以及对复杂产品未来型号的费用估算等功能,将本文实现算法与实际应用项目进行了良好的集成,该系统主要由5个模块组成,分别是基础维度管理模块、参数管理模块、费用分解结构模块、费用估算模块以及费用计算分析模块。图2展示了复杂产品费用模块估算参数数据输入、训练及估算界面。
4 结 语
本文充分利用支持向量机的优点,通过建立支持向量机回归模型对实际复杂产品的统计资料进行实验验证并与神经网络算法比较,实验结果表明,在较少的费用样本情况下,SVR能较好地反映产品费用与各主要影响参数的复杂非线性映射关系,具有较高的估算精度,并在此基础上实现了一个通用的复杂产品费用估算系统,通过对指定复杂产品进行结构分析及参数设定,即可对其进行费用估算,便于对复杂产品进行费用分析和采办决策。
用支持向量机对非线性组合估算函数进行拟合,可以在小费用样本条件下达到较好的估算精度和较强的推广能力,适用复杂产品费用的估算问题。由于目前还没有一定的理论指导,支持向量机核函数的选取仍是一个比较困难的问题。同时,费用影响参数的选取对估算结果也有一定影响,如何在具体条件下对特定的系统确定合适的参数还有待进一步研究。
参考文献
李海军,刘霄,孙伟玮,等.反舰导弹维修费用偏最小二乘估算方法.海军航空工程学院学报,,27(1):27?31.
曹广生,乐光,陶金亮,等.基于RBF神经网络的大型客机制造成本分析.电子设计工程,,21(1):41?46.
VAPNIK V N. The nature of statistical learning theory . New York: Springer?Verlag, 1995.
刘芳,赵建印,宋贵宝,等.基于CAIV的导弹低成本保障性指标论证技术.海军航空工程学院学报,2012,27(2):171?175.
徐子彬,汪民乐,翟龙刚.基于神经网络的武器系统寿命费用分析方法研究.科教前沿,(29):476?477.
冀海燕,张笑,王瑞臣.潜射导弹武器系统维修保障费用灰色预测.青岛大学学报:工程技术版,2013,28(1):72?75.
杨志刚,王海涛,彭绍雄,等.舰空导弹武器装备寿命周期费用分析.兵工自动化,2013,32(10):4?7.
篇2:论文:基于粒子群算法的双子支持向量机研究
论文:基于粒子群算法的双子支持向量机研究
摘要:针对标准支持向量机训练时间过长与参数选择无指导性问题,给出一种通过粒子群优化双支持向量机模型参数的方法。与标准支持向量机不同,该方法的时间复杂度更小,特别适合不均衡的数据样本分类问题,对求解大规模的数据分类问题有很大优势。将该算法与标准的支持向量机分类器在不同的文本数据集上进行仿真实验对比,以验证算法的有效性。结果表明基于粒子群优化的双子支持向量机分类器的分类结果高于标准支持向量机分类结果。
关键词:双子支持向量机(TWSVM);分类算法;粒子群优化算法(PSO)
DOIDOI:10.11907/rjdk.151455
中图分类号:TP312
基金项目:玉林师范学院校级科研项目(YJYB04)
作者简介作者简介:刘建明(1986-),男,广西博白人,硕士,玉林师范学院数学与信息科学学院助教,研究方向为数据挖掘与机器学习。
0 引言
粒子群优化算法[1](Particle Swarm Optimization,PSO)是由美国研究学者Kennedy等人在1995年提出的,PSO算法每一代的种群中的解具有向“他人”学习和“自我”学习的优点,该算法能在较少的迭代次数中找到全局最优解,这一特性被广泛应用于神经网络方法、函数优化问题、数据挖掘、模式识别,工程计算等研究领域。
双子支持向量机(Twin Support Vector Machines, TWSVM)是Jayadeva[23] 基于传统支持向量机在提出来的。TWSVM是从SVM演化而来的,是一种新型的基于统计学习理论的机器学习算法。TWSVM具有SVM优点,同时适合处理像文本自动分类、基因表达、空间信息遥感数据、语音识别等这样的大规模数据分类问题。
针对TWSVM对惩罚参数和核函数参数缺乏指导性问题,本文结合PSO算法的优点,给出一种基于PSO的
算法优化改进策略,对TWSVM分类器进行优化。PSO是一种基于群体智能的全局寻优算法,该算法能在较少的迭代次数中找到全局最优解,通过利用粒子群优化算法对双子支持向量机进行优化后,分类器较之标准支持向量机有更好的分类效果。
1 PSO算法
PSO算法步骤:①初始化粒子群,利用随机函数法给每一个粒子的初始位置和速度赋值;②根据第①步的赋值及初始位置与速度更新每一个粒子新的位置;③利用选定的适应度函数计算每一个粒子的适应度值;④对每一个粒子,对比其个体和群体的适应度值,并找出粒子经过的最好位置的适应度值,如果发现更好的位置及适应度值,那么就更新其位置;⑤根据公式更新每个粒子的速度与位置,如果找到最优的位置或者是到了最大的迭代次数,算法终止,否则转入第3步继续迭代求解。
2 双子支持向量机(TWSVM)
与SVM不同,TWSVM求解的`是一对分类超平面,SVM求解一个QP问题而TWSVM解决的是两个QP问题,而这两个QP问题的求解规模比SVM小很多。传统SVM构造两个平行的超平面,并且使两个超平面之间的距离最大即最大间隔化,TWSVM虽然也是构造超平面,但超平面之间不需要平行。TWSVM对每一个样本都构造一个超平面,每个样本的超平面要最大限度地靠近该类的样本数据点,而同时尽可能地远离另一类样本数据点。新数据样本将会分配给离两个超平面中最近的一个平面。事实上,该算法还可以沿着非平行面聚集,而且样本聚集方式是根据完全不同的公式聚合而成的。实际上,在TWSVM中的两个QP问题与标准SVM的QP问题除了求解约束问题不同外,求解公式是相同的。TWSVM的二分类算法通过求解下面的一对QPP(Quadratic Program Problem)问题进行二次规划优化[5]。
3 基于PSO的TWSVM分类算法
在TWSVM中,与SVM相同,都需要对参数进行确定,TWSVM对每个类均有一个惩罚参数和核函数参数。不同的惩罚参数和核函数参数影响分类的准确率,而PSO算法拥有全局的优化能力,因此,本文将PSO算法引入TWSVM中,解决TWSVM参数的选择问题,PSOTWSVM算法不仅能提高TWSVM的准确率同时又能降低SVM的训练时间,提高训练效率。图2展示了应用PSO算法对TWSVM参数选择的优化流程。
传统SVM是基于二分类提出的,其复杂度为O(n3),其中n为样本数目[2]。然而在TWSVM二分类算法中,设每类样本数据为n/2,因此,求解两个优化问题时间复杂度为:O(2*(n/2)3),所以在二分类问题中的TWSVM时间复杂度为传统SVM的1/4。推广到多分类问题时,可以发现在时间复杂度方面,TWSVM求解优化问题的时间更少。例如样本类别数为k类,那么该样本的时间复杂度为O(k*(n/k)3)。由于TWSVM分类算法对每类都构造一个超平面,因此该算法在处理不平衡数据时,即一类的样本数目比另一类的样本大得多情况时,TWSVM分别实施不同的惩罚因子,TWSVM克服了传统的SVM处理不均衡样本的局限性,这一点非常适用于大规模的不均衡分类问题。 4 算法仿真实验
为验证基于PSO的TWSVM分类算法的有效性,本文利用该算法构建一个文本分类器,运用不同数据集在该分类器上进行实验并与标准支持向量机构建的分类器进行对比仿真实验。
4.1 分类器性能评价
常用的分类器评价方法包括:准确率和召回率。这两个指标广泛应用于文本分类系统的评价标准。准确率(Precision)是指全部分类文本中划分的类别与实际类别相同的文本数量占全部文本的比率。召回率(Recall)是指分类正确的文本数占应有文档数的比率。文本分类输出结果见表1。
4.2 实验结果分析
由表2可知,PSOTWSVM的分类性能比TWSVM要好。因此,基于PSO的TWSVM是一个有效算法。该算法不但比标准的SVM算法训练时间更短,而且比TWSVM有更好的准确率,PSOTWSVM解决了TWSVM的参数选择问题,提高了TWSVM的泛化性。
5 结语
通过基于PSO的TWSVM分类算法与TWSVM算法的分类对比实验可知,应用PSO算法的全局寻优能力提高了TWSVM分类的能力。PSO优化后TWSVM分类器的性能更为优越。基于PSO的TWSVM分类算法比标准的SVM时间复杂度更小,比TWSVM的准确率更高,基于PSO的TWSVM算法在分类问题上较之传统的SVM算法有更大的优越性。
参考文献:
[2]JAYADEVA,R KHEMCHANDAN, S CHANDRA.Twin support vector machines for pattern Classification[J]. IEEE Trans. Pattern and Machine Intelligence,,29(5):905910.
[4]谷文成,柴宝仁,腾艳平. 基于粒子群优化算法的支持向量机研究[J].北京理工大学学报,2014, 34(7):705 709.
[6]王振.基于非平行超平面支持向量机的分类问题研究[D].长春:吉林大学,2014.
[7]M ARUN KUMAR,M GOPAL. Least squares twin support vector machines for pattern classification[J]. Expert Systems with Applications, ,4( 36): 75357543.
篇3:支持向量机回归方法用于黄酮类化合物醛糖还原酶抑制活性的QSAR研究
支持向量机回归方法用于黄酮类化合物醛糖还原酶抑制活性的QSAR研究
用支持向量机回归(SVR)方法研究了48个黄酮类化合物醛糖还原酶抑制活性的定量构效关系.建模过程中利用留一法交叉验证(LOOCV)优化了核函数的`类型、惩罚系数C和不敏感函数ε.所建模型最终采用了227个变量中的7个:dChivps9,ESHaaCH,EsssCH2,n2Pag[1,2], degree2,I'3和I'4.所得SVR模型的预测相对误差为0.0622,小于多元线性回归(MLR)和偏最小二乘法(PLS),以及文献报道模型的预测相对误差.
作 者:袁福星 陆文聪 李国正 刘太昂 Yuan Fuxing Lu Wencong Li Guozheng Liu Taiang 作者单位:袁福星,陆文聪,Yuan Fuxing,Lu Wencong(上海大学理学院化学系,上海,200444)李国正,Li Guozheng(上海大学计算机科学与工程学院,上海,200072)
刘太昂,Liu Taiang(北京石油化工设计院,北京,100101)
刊 名:计算机与应用化学 ISTIC PKU英文刊名:COMPUTERS AND APPLIED CHEMISTRY 年,卷(期):2007 24(6) 分类号:O641 关键词:支持向量机回归 QSAR 黄酮类化合物 醛糖还原酶抑制活性 support vector regression QSAR Flavones aldose reductase inhibitory activity★ 机器学习个人总结
★ 非分光红外(NDIR)技术测定反刍动物甲烷和二氧化碳研究
【基于支持向量回归机的复杂产品费用估算技术发展研究论文(精选3篇)】相关文章:
大数据高等学校教学的论文2023-08-10
高考数学试卷2022-11-19
高考复习的重点难点2022-12-23
节约水资源项目商业计划书2022-05-06
项目商业计划书2022-05-07
led照明项目商业计划书2022-05-08
试论对固定资产转资滞后的思考论文2022-09-30
探讨饲料厂建设工程造价论文2022-06-17
低阻低渗油藏薄油层测井识别技术及其应用2022-08-11
高三二轮数学具体的复习方法2022-07-02