第一篇:数据分析与建模,实验报告,实验四,最优化模型建模分析
学生学号
实验课成绩
学 学 生 实 验 报 告 书
实验课程名称 数据分析与建模 开 开 课 学 院 管理学院 指导教师姓名 鄢 丹 学 学 生 姓 名
学生专业班级
202_ —202_ 学年
第1
学期实验报告填写说明
1. 综合性、设计性实验必须填写实验报告,验证、演示性实验可不写实验报告。
2. 实验报告书 必须按统一格式制作(实验中心网站有下载)。
3. 老师在指导学生实验时,必须按实验大纲的要求,逐项完成各项实验;实验报告书中的实验课程名称和实验项目 必须与实验指导书一致。
4. 每项实验依据其实验内容的多少,可安排在一个或多个时间段内完成,但每项实验只须填写一份实验报告。
5. 每份实验报告教师都应该有签名、评分表及实验报告成绩。
6. 教师应及时评阅学生的实验报告并给出各实验项目成绩,完整保存实验报告。在完成所有实验项目后,教师应按学生姓名将批改好的各实验项目实验报告装订成册,构成该实验课程总报告,按班级交到实验中心,每个班级实验报告袋中附带一份实验指导书及班级实验课程成绩表。
7. 实验报告封面信息需填写完整,并给出实验环节的成绩,实验环节成绩按其类型采取百分制或优、良、中、及格和不及格五级评定(与课程总成绩一致),并记入课程总成绩中。
实验课程名称:_ 数据分析与建模__
实验项目名称 实验四 最优化模型的建模分析 实验 成绩
实 实 验 者
专业班级
组 组
别 无 无 同 同 组 者 无 无 实验日期 202_ 年 年 10 月 月 18 日 第一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,主要仪器设备及耗材,实验方案与技术路线等)
一、实验目的、意义 本实验旨在通过资料查阅和上机实验,使学生熟悉和掌握最优化模型的分析方法和理论,掌握数据分析工具 Mathematica,培养和提高数据分析的能力。
二、实验基本原理与方法 最优化模型的分析方法,数据分析工具 Mathematica 的使用方法,以及帮助指南文档等。
三、实验内容及要求 最优化模型的建模分析,写出求解过程及分析结论。、彩电生产问题的最优化分析 一家彩电制造商计划推出两种新产品:一种 19 英寸液晶平板电视机,制造商建议零售价为339 美元;另一种 21 英寸液晶平板电视机,零售价为 399 美元。公司付出的成本为 19 英寸彩电每台 195 美元,21 英寸彩电每台 225 美元;还要加上 400000 美元的固定成本。在竞争的销售市场中,每年售出的彩电数量会影响彩电的平均售价。据估计,对每种类型的彩电,每多售出一台,平均销售价格会下降 1 美分。而且 19 英寸彩电的销售会影响 21 英寸彩电的销售,反之亦然。据估计,每售出一台 21 英寸彩电,19 英寸彩电的平均售价会下降 0.3 美分,而每售出一台 19 英寸彩电,21 英寸彩电的平均售价会下降 0.4 美分。
(1)每种彩电应该各生产多少台,每种彩电的平均售价是多少?(2)最大的盈利利润是多少,利润率是多少?
2、彩电生产的关税 问题分析 仍然是上述的无约束的彩电问题。由于公司的装配厂在海外,所以美国政府要对每台电视机征收 25 美元的关税。
(1)将关税考虑进去,求最优生产量。这笔关税会使公司有多少花费?在这笔花费中,有多少是直接付给政府,又有多少是销售额的损失?(2)为了避免关税,公司是否应该将生产企业重新定址在美国本土上?假设海外的工厂可以按每年 200000 美元的价格出租给另一家制造公司,在美国国内建设一个新工厂并使其运转起来每年需要花费 550000 美元。这里建筑费用按新厂的预期使用年限分期偿还。
(3)征收关税的目的是为了促使制造公司美国国内建厂。能够使公司愿意在国内重新建厂的最低关税额是多少?(4)将关税定得足够高,使公司要重建工厂。讨论生产量和利润关于关税的灵敏性。说明实际关税额的重要性。
提示:Mathematica 中的命令,Solve,D,ReplaceAll(/.),等合。可结合 Excel。
进行列表分析。
3、、写出简短程序,绘制特殊图形 在 Mathematica 中分别绘制以下五类基本初等函数,依次为:
(1)幂函数:y=x μ
(μ∈R 是常数);(2)指数函数:y=a x
(a>0,且 a≠1);(3)对数函数:y=log a x
(a>0 且 a≠1,特别当 a=e 时,记为 y=lnx);(4)三角函数:如 y=sin x,y=cos x,y=tan x 等;(5)反三角函数:如 y=arcsin x,y=arccos x,y=arctan x 等。
四、实验方案或技术路线(只针对综合型和设计型实验)
按照实验任务要求,理论结合实际的实验方案,巩固课程内容,温故知新,查遗补漏,夯实理论基础,提升实验动手能力。
技术路线是,从整体规划,分步骤实施,实验全面总结。
第二部分:实验过程记录(可加页)(包括实验原始数据记录,实验现象记录,实验过程发现的问题等)、彩电生产问题的最优化分析(1)求解过程:本题采用五步法求解。
【第一步:提出问题】
首先,列出变量表,写出这些变量间的关系和所做的其他假设。比如,有的要求取值非负。然后,采用引入的符号,将问题用数学公式表达。
第一步的结果归纳如下:
变量:
s = 19 英寸彩电的售出数量(每年)
t = 21 英寸彩电的售出数量(每年)
p = 19 英寸彩电的销售价格(美元)
q = 21 英寸彩电的销售价格(美元)
C = 生产彩电的成本(美元/年)
R = 彩电销售的收入(美元/年)
P = 彩电销售的利润(美元/年)
假设:
p = 339 – 0.01s – 0.003t q = 399 – 0.004s – 0.01t R = p*s + q*t C= 400 000 + 195s +225t P = R – C s≥0, t≥0
目标:求 P 的最大值 【第二步:选择建模方法】
本题的彩电问题属于无约束的多变量最优化问题,这类问题通常用多元微积分来解决。
【第三步:推导模型的表达式】
P = R – C = p*s + q*t –(400 000 + 195s +225t)
=(339 – 0.01s – 0.003t)*s +(399 – 0.004s – 0.01t)*t –(400 000 + 195s +225t)
此处我令 y = P 作为求最大值的目标变量,x1 = s, x2 = t 作为决策变量。
故原问题可化为:
在区域 S = {(x1, x2): x1≥0, x2≥0 }上对:
y = f(x1, x2)=(339 – 0.01*x1 – 0.003*x2)*x1 +(399 – 0.004*x1 – 0.01*x2)*x2 –(400 000 + 195*x1 +225*x2)求最大值。
【第四步:求解模型】
利用第二步选择的微积分的方法来求解。
a.首先,用 Mathematica 绘出函数 f 的三维图像。
绘制二元函数 3D 图形的命令:Plot3D[函数, 第一变量的范围, 第二变量的范围, 可选项]
图 1 函数 f 的三维图像 由上图可知,f 是一个抛物面,且 f 在 S 内部达到最大值。
b.然后,再用 Mathematica 绘出函数 f 的等高线图。
绘制二元函数等高线图的命令:
ContourPlot[函数, 第一变量的范围, 第二变量的范围, 可选项]
图 2 函数 f 的等高线图
由上图可以估计,f 的最大值出现在 x1 = 5000,x2 = 7000 附近。
c.利用 Mathematica 分别求出函数 f 关于 x1,x2 的偏导数。
d.函数 f 是一个抛物面,欲求得其最高点,只需令 x1 和 x2 的偏导数同时为 0,建立方程组求解即可。该方程组可利用 Mathematica 的 Solve 函数求解,解得:
x1 = 4735.04≈4735 , x2 = 7042.74≈7043 e.将求得的 x1, x2 的值代入函数 f 的表达式:
f(x1, x2)=(339 – 0.01*x1 – 0.003*x2)*x1 +(399 – 0.004*x1 – 0.01*x2)*x2 –(400 000 + 195*x1 +225*x2)即可求得 f 的最大值。求得 f 的最大值 = 553641
其中,c、d、e 应用 Mathematica 求解的运行结果如下图所示:
图 3 应用 Mathematica 求解 f.求解其他变量:英寸彩电的平均售价:p = 339 – 0.01*x1 – 0.003*x2 = 270.52(美元)英寸彩电的平均售价:q = 399 – 0.004*x1 – 0.01*x2 = 309.63(美元)
生产彩电的总成本:C= 400 000 + 195*x1 +225*x2 = 2908000(美元/年)
利润率 = 利润/总成本 = 553641/2908000 = 19%
【第五步:回答问题】
这家公司可以通过生产 4735 台 19 英寸彩电和 7043 台 21 英寸彩电来获得最大利润,每年获得的净利润为 553641 美元。每台 19 英寸彩电的平均售价为 270.52 美元,每台 21 英寸彩电的平均售价为 309.63 美元。生产总支出为 2908000 美元,相应的利润率为 19%。
(2)分析结论:
这些结果显示出这是有利可图的,因此建议这家公司应该实行推行新产品的计划。
注意:以上得到的结论是以彩电问题的第一步中所做的假设为基础的。实际中,在向公司报告结论之前,应该对彩电市场和生产过程所做的假设进行灵敏性分析,以保证结果具有稳健性。
2、彩电生产的关税问题分析(1)将关税考虑进去,求最优生产量。这笔关税会使公司有多少花费?在这笔花费中,有多少是直接付给政府,又有多少是销售额的损失? 本题依旧采用五步法求解。
【第一步:提出问题】
首先,列出变量表,写出这些变量间的关系和所做的其他假设。然后,采用引入的符号,将问题用数学公式表达。
在前面所述无约束彩电问题的基础上,增加以下变量和假设:
变量:
k = 支付的关税总额(美元/年)
W = 关税后的总利润(美元/年)
假设:
k = 25*(s + t)W = P – k
目标:求 W 的最大值 【第二步:选择建模方法】
本题的彩电问题属于无约束的多变量最优化问题,这类问题通常用多元微积分来解决。
【第三步:推导模型的表达式】
W = P – k
=(339 – 0.01s – 0.003t)*s +(399 – 0.004s – 0.01t)*t –(400 000 + 195s +225t)– 25*(s + t)此处我令 y = W 作为求最大值的目标变量,x1 = s, x2 = t 作为决策变量。
故原问题可化为:
在区域 S = {(x1, x2): x1≥0, x2≥0 }上对:
y = w(x1, x2)=(339 – 0.01*x1 – 0.003*x2)*x1 +(399 – 0.004*x1 – 0.01*x2)*x2 –(400 000 + 195*x1 +225*x2)– 25*(x1 + x2)求最大值。
【第四步:求解模型】
利用第二步选择的微积分的方法来求解。
a.首先,用 Mathematica 绘出函数 w 的三维图像。
绘制二元函数 3D 图形的命令:
Plot3D[函数, 第一变量的范围, 第二变量的范围, 可选项]
图 4 函数 w 的三维图像 由上图可知,w 是一个抛物面,且 w 在 S 内部达到最大值。
b.然后,再用 Mathematica 绘出函数 w 的等高线图。
绘制二元函数等高线图的命令:
ContourPlot [函数, 第一变量的范围, 第二变量的范围, 可选项]
图 5 函数 w 的等高线图 由上图可以估计,w 的最大值出现在 x1 = 4000,x2 = 6000 附近。
c.利用 Mathematica 分别求出函数 w 关于 x1,x2 的偏导数。
d.函数 w 是一个抛物面,欲求得其最高点,只需令 x1 和 x2 的偏导数同时为 0,建立方程组求解即可。该方程组可利用 Mathematica 的 Solve 函数求解,解得:
x1 = 3809.12≈3809 , x2 = 6116.81≈6117
e.将求得的 x1, x2 的值代入函数 w 的表达式:
w(x1, x2)=(339 – 0.01*x1 – 0.003*x2)*x1 +(399 – 0.004*x1 – 0.01*x2)*x2 –(400 000 + 195*x1 +225*x2)– 25*(x1 + x2)即可求得 w 的最大值。求得 w 的最大值 = 282345
其中,c、d、e 应用 Mathematica 求解的运行结果如下图所示:
图 6 应用 Mathematica 求解 f.求解其他变量:
关税总花费:k = 25*(x1 + x2)= 248148(美元/年)
总利润减少额 = 553641 – 282345 = 271296(美元/年)
考虑关税后销售额的损失额 = 271296 – 248148 = 23148(美元/年)
【第五步:回答问题】
考虑关税后,这家公司可以通过生产 3809 台 19 英寸彩电和 6117 台 21 英寸彩电来获得最大利润,每年获得的最大净利润为 282345 美元。
这笔关税会使公司每年多花费 271296 美元。在这笔花费中,有 248148 美元是直接付给政府的,其余 23148 美元是销售额上的损失。
(2)为了避免关税,公司是否应该将生产企业重新定址在美国本土上?假设海外的工厂可以按每年 200000 美元的价格出租给另一家制造公司,在美国国内建设一个新工厂并使其运转起来每10
年需要花费 550000 美元。这里建筑费用按新厂的预期使用年限分期偿还。
【分析问题】
当公司将生产企业重新定址在美国本土后:
生产成本增加额 = 550000 – 200000 = 350000(美元/年)
考虑关税后:
总利润减少额 = 553641 – 282345 = 271296(美元/年)
【回答问题】
由计算可知:在考虑关税的情况下,当公司将生产企业重新定址在美国本土后,每年的生产成本增加额 350000 美元 大于 总利润减少额 271296 美元。所以公司不应该将生产企业重新定址在美国本土上。
(3)征收关税的目的是为了促使制造公司美国国内建厂。能够使公司愿意在国内重新建厂的最低关税额是多少? 保留前面所设的变量和所做的假设。
假设政府对每台电视机征收 x 美元的关税。
则关税后的总利润 W =(339 – 0.01s – 0.003t)*s +(399 – 0.004s – 0.01t)*t –(400 000 + 195s +225t)– x*(s + t)分析:当且仅当国内建厂成本小于等于关税前后总利润的减少额,才能够使公司愿意在国内重新建厂。即 350000 ≤ 553641 – W(max),化简可得:W(max)≤203641
即 x ≥ [(339 – 0.01s – 0.003t)*s +(399 – 0.004s – 0.01t)*t –(400 000 + 195s +225t)– 203641]/(s + t)此处我令 y = [(339 – 0.01s – 0.003t)*s +(399 – 0.004s – 0.01t)*t –(400 000 + 195s +225t)– 203641]/(s + t)作为求最大值的目标变量,x1 = s, x2 = t 作为决策变量。
故原问题可化为:
在区域 S = {(x1, x2): x1≥0, x2≥0 }上对:
y = m(x1, x2)= [(339 – 0.01*x1 – 0.003*x2)*x1 +(399 – 0.004*x1 – 0.01*x2)*x2 –(400 000 + 195*x1 +225*x2)– 203641]/(x1 + x2)求最大值。
再令 x ≥ m(x1, x2)的最大值 即为所求。
【求解模型】
利用微积分的方法来求解。
a.首先,用 Mathematica 绘出函数 m 的三维图像。
绘制二元函数 3D 图形的命令:
Plot3D[函数, 第一变量的范围, 第二变量的范围, 可选项]
图 7 函数 w 的三维图像 由上图可知,m 是一个抛物面,且 m 在 S 内部达到最大值。
b.然后,再用 Mathematica 绘出函数 m 的等高线图。
绘制二元函数等高线图的命令:
ContourPlot [函数, 第一变量的范围, 第二变量的范围, 可选项]
图 8 函数 m 的等高线图 由上图可以估计,m 的最大值出现在 x1 = 3500,x2 = 6000 附近。
c.利用 Mathematica 分别求出函数 m 关于 x1,x2 的偏导数。
d.函数 m 是一个抛物面,欲求得其最高点,只需令 x1 和 x2 的偏导数同时为 0,建立方
程组求解即可。该方程组可利用 Mathematica 的 Solve 函数求解,解得:
x1 = 3506.2≈3506 , x2 = 5813.89≈5814
e.将求得的 x1, x2 的值代入函数 m 的表达式:
m(x1, x2)= [(339 – 0.01*x1 – 0.003*x2)*x1 +(399 – 0.004*x1 – 0.01*x2)*x2 –(400 000 + 195*x1 +225*x2)– 203641]/(x1 + x2)即可求得 m 的最大值。求得 m 的最大值≈33 其中,c、d、e 应用 Mathematica 求解的运行结果如下图所示:
图 9 应用 Mathematica 求解 f.求解其他变量:
故 x≥33 【回答问题】
为了促使公司愿意在国内重新建厂,政府可收取的最低关税额是 33 美元。
(4)将关税定得足够高,使公司要重建工厂。讨论生产量和利润关于关税的灵敏性。说明实际关税额的重要性。
设每台彩电的关税额为 x 美元,每年 19 英寸彩电和 21 英寸彩电的生产量分别为 x1, x2 台,每年净利润为 w 美元。
1)生产量 x1, x2 关于关税 x 的灵敏性 a.粗分析 现在假设关税 x 的实际值是不同的,对几个不同的 x 值,重复前面的求解过程, 可以得到对生产量 x1, x2 关于 x 的敏感程度的一些数据。
即给定 x,对 y = w(x1, x2)=(339 – 0.01*x1 – 0.003*x2)*x1 +(399 – 0.004*x1 – 0.01*x2)*x2 –(400 000 + 195*x1 +225*x2)– x*(x1 + x2)分别求出函数 w 关于 x1,x2 的偏导数,再令 x1 和x2 的偏导数同时为 0,建立方程组求解。
可得相应 x1 = 4735.04-37.037 x , x2 = 7042.74-37.037 x
图 10 用 x 来表示 x1 和 x2 用 Excel 绘出生产量 x1, x2 关于关税 x 的散点图。
图 11 生产量 x1, x2 关于关税 x 的散点图 由上述图表可以看到生产量 x1, x2 对关税 x 是很敏感的。即如果给定不同的关税,则生产量 x1, x2 将会有明显变化。甚至从理论上分析,当 x 足够大时,x1, x2 的取值会变为负数。因此,x 的取值要合适、合理,所做的分析才有意义。
b.生产量 x1, x2 关于关税 x 的灵敏性的系统分析 前面已计算出,使偏导数同时为零的点为 x1 = 4735.04-37.037 x , x2 = 7042.74-37.037 x,若要 x1, x2≥0,只要 x≤127.8 即可。当 0≤x≤127.8 时,x1 和 x2 随着 x 的增大而不断减小。
c.生产量 x1, x2 对关税 x 的灵敏性的相对改变量:
由 x1 = 4735.04-37.037 x , x2 = 7042.74-37.037 x 可得:在点 x = 33 处,dx1/dx =-37.037, dx2/dx =-37.037 S(x1 , x)=(dx1/dx)*(x/x1)=-0.35 S(x2 , x)=(dx2/dx)*(x/x2)=-0.21 即每台彩电的关税额 x 增加 1%,则导致每年 19 英寸彩电和 21 英寸彩电的生产量 x1, x2分别减少 0.35%,0.21%
2)利润 w 关于关税 x 的灵敏性 a.粗分析 w =(339 – 0.01*x1 – 0.003*x2)*x1 +(399 – 0.004*x1 – 0.01*x2)*x2 –(400 000 + 195*x1 +225*x2)– x*(x1 + x2)由前面分析可得,生产量 x1, x2 对关税 x 是很敏感的,且此处分析的利润应该是在 x = 33 美元的情况下的最大利润,故将 x1 = 4735.04-37.037 x , x2 = 7042.74-37.037 x 代入式子 w =(339 – 0.01*x1 – 0.003*x2)*x1 +(399 – 0.004*x1 – 0.01*x2)*x2 –(400 000 + 195*x1 +225*x2)– x*(x1 + x2), 得
w =(339-0.01*(4735.04-37.037 x)-0.003*(7042.74-37.037 x))*(4735.04-37.037 x)+(399-0.004*(4735.04-37.037 x)-0.01*(7042.74-37.037 x))*(7042.74-37.037 x)-(400000 + 195*(4735.04-37.037 x)+ 225*(7042.74-37.037 x))-x*((4735.04-37.037 x)+(7042.74-37.037 x))用 Excel 绘出利润 w 关于关税 x 的散点图。
图 12 利润 w 关于关税 x 的散点图 由上述图表可以看到利润 w 对关税 x 是很敏感的。即如果给定不同的关税,则利润 x 将会有明显变化。甚至从理论上分析,当 x 足够大时,w 的取值会变为负数。因此,x 的取值要合适、合理,所做的分析才有意义。
b.利润 w 关于关税 x 的灵敏性的系统分析 由前面粗分析中的散点图可知,w 随着 x 的增大而不断减小。当 x≥57.4 时,利润 w 变为负数。
c.利润 w 对关税 x 的灵敏性的相对改变量:
由 x1 = 4735.04-37.037 x , x2 = 7042.74-37.037 x 可得:在点 x = 33 处,dw/dx = −9333.33 S(w , x)=(dw/dx)*(x/w)=-1.5
即每台彩电的关税额 x 增加 1%,则导致每年净利润为 w 减少 1.5%
3、、写出简短程序,绘制特殊图形(1)幂函数:y = x μ
(μ∈R 是常数); 此处我将 μ 的值分为 μ ≥ 0 和 μ < 0 分别举例绘出相应的具有代表性的图形。
当 μ ≥ 0 时,我列举了 μ = 0, 1/2, 1, 2, 3;
当 μ < 0 时,我列举了 μ =-1/2,-1,-2 一元函数作图的命令:Plot[{函数 1,函数 2,„ }, 作图范围, 可选项]
图 13 幂函数举例(2)指数函数:y = a x
(a>0,且 a≠1); 此处 a 的取值范围只有 0 < a < 1 和 a > 1,所以我分别举例绘出了 a = 2 和 a = 1/2 时的图形,16
它们各自具有一定的代表性。
一元函数作图的命令:Plot[{函数 1,函数 2,„ }, 作图范围, 可选项]
图 14 指数函数举例
(3)对数函数:y = log a x(a>0 且 a≠1,特别当 a = e 时,记为 y = lnx); 此处 a 的取值范围只有 0 < a < 1 和 a > 1,特别当 a = e 时,记为 y = lnx。
所以我分别举例绘出了 a = 7、a = 1/7、a = e 时的图形,它们各自具有一定的代表性。
y = log 7 x 和 y = log 1/7 x 用 Log[7, x]和 Log[1/7, x]表示。而 y = lnx 直接用 Log[x]表示。
一元函数作图的命令:Plot[{函数 1,函数 2,„ }, 作图范围, 可选项]
图 15 对数函数举例
(4)三角函数:如 y = sin x,y = cos x,y = tan x 等;
一元函数作图的命令:Plot[{函数 1,函数 2,„ }, 作图范围, 可选项] 此处三角函数的函数名首字母都要大写,否则软件不会将其视为三角函数,而是视为变量名。如果用 Pi 表示 π 时,首字母也需要大写,否则软件也会将其视为变量名。当输入正确时,下方会有的蓝色字体提示。
图 16 三角函数
(5)反三角函数:如 y = arcsin x,y = arccos x,y = arctan x 等。
一元函数作图的命令:Plot[{函数 1,函数 2,„ }, 作图范围, 可选项] 此处反三角函数的函数名只需在三角函数的函数名之前加一个“Arc”即可。
如果用 Pi 表示 π 时,首字母也需要大写,否则软件会将其视为一个变量名。
图 17 反三角函数
第三部分
结果与讨论(可加页)
一、实验结果分析(包括数据处理、实验现象分析、影响因素讨论、综合分析和结论等)
(1)问题 1:针对第 1 题中的 y = f(x1, x2)=(339 – 0.01*x1 – 0.003*x2)*x1 +(399 – 0.004*x1 – 0.01*x2)*x2 –(400 000 + 195*x1 +225*x2)在区域 S = {(x1, x2): x1≥0, x2≥0 }上求最大值,如何估计自变量的取值:
求解方法:
a.首先,用 Mathematica 绘出函数 f 的三维图像。
绘制二元函数 3D 图形的命令:Plot3D[函数, 第一变量的范围, 第二变量的范围, 可选项]
图 18 函数 f 的三维图像 由上图可知,f 是一个抛物面,且 f 在 S 内部达到最大值。
b.然后,再用 Mathematica 绘出函数 f 的等高线图。
绘制二元函数等高线图的命令:ContourPlot[函数,第一变量的范围,第二变量的范围,可选项]
图 19 函数 f 的等高线图 由上图可以估计出,f 的最大值出现在 x1 = 5000,x2 = 7000 附近。
(2)问题 2:如何应用 Mathematica 求解无约束的多变量最优化问题 解决方法:
以第 1 题为例,具体步骤如下:
a.利用 Mathematica 分别求出函数 f 关于 x1,x2 的偏导数。
b.函数 f 是一个抛物面,欲求得其最高点,只需令 x1 和 x2 的偏导数同时为 0,建立方程组求解即可。该方程组可利用 Mathematica 的 Solve 函数求解,解得:
x1 = 4735.04≈4735 , x2 = 7042.74≈7043 c.将求得的 x1, x2 的值代入函数 f 的表达式:
f(x1, x2)=(339 – 0.01*x1 – 0.003*x2)*x1 +(399 – 0.004*x1 – 0.01*x2)*x2 –(400 000 + 195*x1 +225*x2)即可求得 f 的最大值。求得 f 的最大值 = 553641
应用 Mathematica 求解的具体运行结果如下图所示:
图 20 应用 Mathematica 求解
(3)问题 3:如何进行灵敏性分析(即灵敏性分析的方法)
解决方法:
以生产量 x1, x2 关于关税 x 的灵敏性分析为例,具体方法如下:
a.粗分析 现在假设关税 x 的实际值是不同的,对几个不同的 x 值,重复前面的求解过程, 可以得到对生产量 x1, x2 关于 x 的敏感程度的一些数据。
即给定 x,对 y = w(x1, x2)=(339 – 0.01*x1 – 0.003*x2)*x1 +(399 – 0.004*x1 – 0.01*x2)*x2 –(400 000 + 195*x1 +225*x2)– x*(x1 + x2)分别求出函数 w 关于 x1,x2 的偏导数,再令 x1 和
x2 的偏导数同时为 0,建立方程组求解。
可得相应 x1 = 4735.04-37.037 x , x2 = 7042.74-37.037 x
图 21 用 x 来表示 x1 和 x2 用 Excel 绘出生产量 x1, x2 关于关税 x 的散点图。
图 22 生产量 x1, x2 关于关税 x 的散点图 由上述图表可以看到生产量 x1, x2 对关税 x 是很敏感的。即如果给定不同的关税,则生产量 x1, x2 将会有明显变化。甚至从理论上分析,当 x 足够大时,x1, x2 的取值会变为负数。因此,x 的取值要合适、合理,所做的分析才有意义。
b.生产量 x1, x2 关于关税 x 的灵敏性的系统分析 前面已计算出,使偏导数同时为零的点为 x1 = 4735.04-37.037 x , x2 = 7042.74-37.037 x,若要 x1, x2≥0,只要 x≤127.8 即可。当 0≤x≤127.8 时,x1 和 x2 随着 x 的增大而不断减小。
c.生产量 x1, x2 对关税 x 的灵敏性的相对改变量:
由 x1 = 4735.04-37.037 x , x2 = 7042.74-37.037 x 可得:在点 x = 33 处,dx1/dx =-37.037, dx2/dx =-37.037 S(x1 , x)=(dx1/dx)*(x/x1)=-0.35 S(x2 , x)=(dx2/dx)*(x/x2)=-0.21 即每台彩电的关税额 x 增加 1%,则导致每年 19 英寸彩电和 21 英寸彩电的生产量 x1, x2
分别减少 0.35%,0.21%
(4)问题 4:如何绘制对数函数 y = log a x 的图形。
解决方法:
此处 a 的取值范围只有 0 < a < 1 和 a > 1,特别当 a = e 时,记为 y = lnx。
所以我分别举例绘出了 a = 7、a = 1/7、a = e 时的图形,它们各自具有一定的代表性。
一元函数作图的命令:Plot[{函数 1,函数 2,„ }, 作图范围, 可选项]
其中,y = log 7 x 和 y = log 1/7 x 用 Log[7, x]和 Log[1/7, x]表示,y = lnx 直接用 Log[x]表示。
对于 Mathematica 中普通的对数函数 y = log a x 的输入,均可以用 Log[a, x]来实现。
而 y = lnx 可以直接用 Log[x]实现。
图 23 对数函数举例
二、小结、建议及体会 此次实验的内容主要是进行最优化模型的建模分析,并应用数据分析软件 Mathematica 进行求解。除此之外,老师还额外布置了绘制某些函数图形的任务。
在此次实验之前,我通过阅读相关资料,回顾了对现实问题进行建模分析和应用 Mathematica 进行求解的相关方法。上机实验时,我遇到不懂的问题也及时查阅了相关帮助文档,或者在网络教学平台上与其他同学交流讨论,然后顺利完成了此次实验。
通过此次实验,我更加认识到建模五步法的好处,也慢慢学会将现实问题和数学问题联系起来。同时,我也更加熟悉了最优化模型的分析方法和理论,以及如何应用数据分析工具
Mathematica 进行求解。除此之外,此次实验还帮助我查遗补漏,巩固了课程所学内容,夯实了理论基础,进一步提升了自己的问题分析能力、建模能力以及动手能力。
此次实验面临的问题主要是如何根据已知问题进行建模。在对题目进行深度解读后,我构建了前面所述模型,并最终通过 Mathematica 完成了模型的求解。虽然在具体操作时出现了一些小错误,但是经过多次修改运行后,目前已全部解决,最终顺利完成此次实验。
虽然我目前针对现实问题进行建模求解的能力还十分有限,但是我相信通过后续的不断学习和练习,我一定能不断提升自己的建模分析能力和动手求解能力,并更好地掌握和应用 Mathematica 这一软件。
老师提供的课件和相关资料比较有用,此次实验进行得较为顺利。无进一步建议。
第四部分
评分标准(教师可自行设计)及成绩
观测点 考核目标 权重 得分 实验预习1. 预习报告 2. 提问 3. 对于设计型实验,着重考查设计方案的科学性、可行性和创新性 对实验目的和基本原理的认识程度,对实验方案的设计能力 20%
实验过程 1. 是否按时参加实验 2. 对实验过程的熟悉程度 3. 对基本操作的规范程度 4. 对突发事件的应急处理能力 5. 实验原始记录的完整程度 6. 同学之间的团结协作精神 着重考查学生的实验态度、基本操作技能;严谨的治学态度、团结协作精神 30%
结果分析 1. 所分析结果是否用原始记录数据 2. 计算结果是否正确 3. 实验结果分析是否合理 4. 对于综合实验,各项内容之间是否有分析、比较与判断等 考查学生对实验数据处理和现象分析的能力;对专业知识的综合应用能力;事实求实的精神 50%
该项实验报告最终得分
教师签名:。
第二篇:数据分析与建模,实验报告,实验一,,简单数据建模
学生学号
实验课成绩
学 学 生 实 验 报 告 书
实验课程名称 数据分析与建模 开 开 课 学 院 管理学院 指导教师姓名 鄢 丹 学 学 生 姓 名
学生专业班级 信管
班
202_ —202_ 学年
第1
学期实验报告填写说明
1. 综合性、设计性实验必须填写实验报告,验证、演示性实验可不写实验报告。
2. 实验报告书 必须按统一格式制作(实验中心网站有下载)。
3. 老师在指导学生实验时,必须按实验大纲的要求,逐项完成各项实验;实验报告书中的实验课程名称和实验项目 必须 须与实验指导书一致。
4. 每项实验依据其实验内容的多少,可安排在一个或多个时间段内完成,但每项实验只须填写一份实验报告。
5. 每份实验报告教师都应该有签名、评分表及实验报告成绩。
6. 教师应及时评阅学生的实验报告并给出各实验项目成绩,完整保存实验报告。在完成所有实验项目后,教师应按学生姓名将批改好的各实验项目实验报告装订成册,构成该实验课程总报告,按班级交到实验中心,每个班级实验报告袋中附带一份实验指导书及班级实验课程成绩表。
7. 实验报告封面信息需填写完整,并给出实验环节的成绩,实验环节成绩按其类型采取百分制或优、良、中、及格和不及格五级评定(与课程总成绩一致),并记入课程总成绩中。
实验课程名称:_ 数据分析与建模__
实验项目名称 实验一
简单的数据建模 实验 成绩
实 实 验 者
专业班级
组 组
别 无 无 同 同 组 者 无 无 实验日期 202_ 年 年 9 月 月 26 日 第一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,主要仪器设备及耗材,实验方案与技术路线等)
一、实验目的、意义 本实验旨在通过资料查阅和上机实验,使学生加深了解数据分析与建模的理论与方法,掌握典型的数据模型的建立与使用。
二、实验基本原理与方法 数据分析的理论,最优化模型的建模方法。
应用 Excel 的方法。
三、实验内容及要求 1、应用 Excel 建模分析 某学院有 3 个系,共有学生 200 人,A 系 103 人,B 系 63 人,C 系 34 人。现在成立一个由 21 名学生组成的学生会,该如何公平地分配席位? 实验任务:用 利用 Q 值法分配席位,并且在 Excel 中进行 Q 值计算。
(提示:参考讲义中的计算过程。)、单变量最优化 一个汽车制造商售出一辆某品牌的汽车可获利 1500 美元,估计每 100 美元的折扣可以使销售额提高 15%。
(1)多大的折扣可以使利润最高?利用五步方法及单变量最优化模型。
(2)对你所得的结果,求关于所做的 15%假设的灵敏性。分别考虑折扣量和相应收益。
(3)假设实际每 100 美元的折扣仅可以使销售额提高 10%,对结果会有什么影响?如果每 100 美元折扣的提高量为 10%~15%之间的某个值,结果又如何?(4)什么情况下折扣会导致利润降低?
实验任务:请将上述求解过程,除了用导数求解外,再用 用 Excel 建模求解之。
(提示:考虑 Excel 的数据,图形,公式三者的关系;Excel。的函数。参考教材第一章。))
四、实验方案或技术路线(只针对综合型和设计型实验)
按照实验任务要求,理论结合实际的实验方案,巩固课程内容,温故知新,查遗补漏,夯实理论基础,提升实验动手能力。
技术路线是,从整体规划,分步骤实施,实验全面总结。
第二部分:实验过程记录(可加页)(包括实验原始数据记录,实验现象记录,实验过程发现的问题等)、应用 Excel 建模分析 1.分配方案:
第一步:对每个单位各分配一席; 第二步:当分配下一席位时,计算在当前席位份额下各单位的 Q 值,并比较相应 Q 值的大小,将下一席位分配给当前 Q 值最大的一方; Q 值计算公式为:
(其中,Qi 表示单位 i 的 Q 值,Pi 表示单位 i 的人数,Ni 表示单位 i 的当前席位数)
第三步:重复执行第二步,直至席位分配完为止。
2.实验步骤:本实验的实验工具为 Excel(1)首先,打开 Excel 新建一个表格,并做好前期的基本数据输入工作,表格内容包括三部分:
a.已知的每个系的人数和所求的每个系最终分得席位数; b.在不同的已分配席位数的情况下,三个系 Q 值的取值; c.席位分配过程:给席位编号,标注出每个席位的分配结果; 完成后结果如下图所示:
(2)然后,对每个系均分一个席位后,开始对第 4 个席位进行分配。此时各系已分配席位数均为 1,计算此时各系的 Q 值并比较大小:
a.计算 A 系的 Q 值,公式如图所示:
b.计算 B 系的 Q 值,公式如图所示:
c.计算 C 系的 Q 值:
Q 值大者得席位,所以第 4 个席位分配给 A 系。
(3)然后对第 5 个席位进行分配,由于只有 A 系的已分配席位数变为 2,所以此时只需计算 A 系的 Q 值,再比较各系 Q 值大小即可。A 系 Q 值的计算公式只需将原来的 A6 都换成 A7即可,如下图所示:
Q 值大者得席位,所以第 5 个席位分配给 B 系。
(4)然后对第 6 个席位进行分配,由于只有 B 系的已分配席位数变为 2,所以此时只需计算 B 系的 Q 值,再比较各系 Q 值大小即可。B 系 Q 值的计算公式只需将原来的 A6 都换成 A7即可,如下图所示:
Q 值大者得席位,所以第 6 个席位分配给 A 系。
(5)采用类似上述的方法(当已分配席位数加 1 时,Q 值的计算公式中 A 后面的数字也加 1 即可)依次对后面的席位进行分配,直到第 21 个席位分配完毕。
最终 A 系分得席位 11 个,B 系分得席位 6 个,C 系分得席位 4 个。最终分配结果及分配具体分配过程如下图:
6、单变量最优化((1)多大的折扣可以使利润最高?利用五 步方法及单变量最优化模型。
1.提出问题 【全部的变量包括】
一辆某品牌汽车的成本 C(美元)
一辆某品牌的汽车的折扣金额 100x(美元)
没有折扣时一辆某品牌汽车的售价 P(美元)
有折扣时一辆某品牌汽车的售价 p(美元)
没有折扣时的销量 Q(辆)
有折扣时的销量 q(辆)
没有折扣时的销售额 R(美元)
有折扣时的销售额 r(美元)
有折扣后的利润 L(美元)
【关于上述变量所做的假设】
P – C = 1500 p = P – 100x q = Q *(1 + 0.15x)L = q *(p – C)x >= 0 【目标】求 L 的最大值 2.选择建模方法 本题为单变量优化问题,则建模方法为:设 y = f(x)在 x >= 0 的区间范围内是可微的,若 f(x)在 x 处达到极大或极小, 则 f ΄(x)= 0。
3.推导数学表达式 L = q *(p – C)= Q *(1 + 0.15x)*(p – C)= Q *(1 + 0.15x)*(1500-100x)
= Q *(-15 x^2 + 125x + 1500)记 y = L 作为求最大值的目标变量,x 作为自变量,原问题就化为在集合 S={ x : x ≥0}上求以下函数的最大值:
y = f(x)= Q *(-15 x^2 + 125x + 1500)(Q 为非负常量)
4.求解模型 在本题中,即对 y = f(x)= Q *(-15 x^2 + 125x + 1500)在区间 x >= 0 上求最大值,Q 为非负常量。当 f ΄(x)= Q *(-30x + 125)= 0 时,解得 x ≈ 4.17 故 y = f(x)= Q *(-15 x^2 + 125x + 1500)在 x = 4.17 时取得最大值。
5.回答问题 答:417 美元折扣可以使利润最高。
【 【Excel 建模求解】
1.打开 Excel 新建一个表格,分别列出 X 栏和 Y 栏。X 栏依次写入 0,1,2,3 „„ 等等,Y 栏第一项,根据公式,将 x 以 A2 替代,写入公式“=-15*A2*A2+125*A2+1500”(此处假设 Q = 1),其余的 Y 栏数据,采用拖曳复制的方式复制粘贴公式。当 X 栏有值时,Y 栏就有对应的值。
2.选中 X 栏和 Y 栏的数据,点击菜单栏的【插入】然后插入【散点图】,得到如下图表:
由表和图可知,当 x 在 4 附近时,y 取得最大值。将 x 的取值区间缩小到[3.5 , 4.5] , 再绘出一次散点图,如下:
由上述表和图可知,当 x = 4.2 时,y 取得最大值。
回答问题:大约 420 美元折扣可以使利润最高。
((2)对你所得的结果,求关于所做的 15% 假设的灵敏性。分别考虑折扣量和相应收益。
设销售额提高百分比为 r 1.折扣量 100x 关于销售额提高百分比 r 的灵敏性(故考虑 x 关于 r 的灵敏性即可)
a.粗分析 前面已假定 r =15%,现在假设 r 的实际值是不同的,对几个不同的 r 值,重复前面的求解过程,可以得到对问题的解 x 关于 r 的敏感程度的一些数据。
即给定 r,对 y = f(x)=(1 + r x)*(1500-100x)(此处假设 Q = 1)求导,得到 f“(x)=-200rx + 1500r-100,令 f”(x)= 0,可得相应 x =(15r-1)/2r , 故折扣量 100x = 50(15r-1)/r ,采用
类似第(1)问的 Excel 建模方法,绘出折扣量 100x 关于销售额提高百分比 r 的散点图。
由上述图表可看到折扣量 100x 对参数 r 是很敏感的。即如果给定不同的销售额提高百分比r,则折扣量 100x 将会有明显变化。因此,r 的取值要合适、合理,所做的分析才有意义。
b.折扣量 100x 对销售额提高百分比 r 灵敏性的系统分析 前面已计算出,使 f“(x)=0 的点为 x =(15r-1)/2r,若要 x≥0,只要 r >= 0.067 , 最佳折扣量100x可由x =(15r-1)/2r即100x = 50(15r-1)/r给出,对 r < 0.067 ,在[0,+∞)上都有f”(x)<0,最佳折扣量为 x=0。下图给出了 r =0.05 的情况(此处假设 Q = 1):
c.折扣量 100x 对 r 的灵敏性的相对改变量:
由 x =(15r-1)/2r 可得在点 r=0.15 处,dx/dr = 1/(2 r^2)
S(100x , r)= S(x , r)=(dx/dr)*(r/x)= 1/(2rx)= 0.8
即若销售额提高百分比 r 增加 1%,则导致折扣量 100x 增加 0.8%
2.收益(即利润)L 关于销售额提高百分比 r 的灵敏性 a.粗分析 L = q *(p – C)= Q *(1 + rx)*(p – C)= Q *(1 + rx)*(1500-100x)
不妨设 Q = 1,由前面分析可得,折扣量 100x 对销售额提高百分比 r 是很敏感的,且此处分析的利润应该是给定 r 的情况下的最大利润,故将 x =(15r-1)/2r 代入式子 L =(1 + rx)*(1500-100x)得 L = 25(15r+1)^2 / r= 25(225r + 1/r + 30)。
采用类似前面的 Excel 建模方法,绘出利润 L 关于销售额提高百分比 r 的散点图。
由上述图表可看到利润 L 对参数 r 是很敏感的。即如果给定不同的销售额提高百分比 r,则利润 L 将会有明显变化。因此,r 的取值要合适、合理,所做的分析才有意义。
b.利润 L 对销售额提高百分比 r 灵敏性的系统分析 对 L 求导可得 L“(r)= 25(225 – 1/r^2),使 L”(r)=0 的点为 r = 1/15≈0.067,当 r < 0.067 时,L 随着 r 的增大而减小;当 r >= 0.067 时,L 随着 r 的增大而增大,r=0.067 是极小值点。
c.利润 L 对 r 的灵敏性的相对改变量:
由 L = 25(225r + 1/r + 30)可得在点 r=0.15 处,dL/dr = 25(225 – 1/r^2)≈ 4513.89 S(L , r)=(dL/dr)*(r/L)=(225r – 1/r)/(225r + 1/r + 30)≈ 0.385 即若销售额提高百分比 r 增加 1%,则导致利润 L 增加 0.385%
((3)假设实际每 100 美元的折扣仅可以使销售额提高 10%,对结果会有什么影响?如果每 100为 美元折扣的提高量为 10%~15% 之间的某个值,结果又如何? 假设实际每 100 美元的折扣仅可以使销售额提高 10%,当 r = 0.1 时,折扣量 100x = 50(15r-1)/r = 250,利润 L= Q *(1 + 0.1x)*(1500-100x)= 1562.5Q(Q 为常量)答:会使折扣量变为 250 美元,利润变为 1562.5Q(Q 为没有折扣时的销量)如果每 100 美元折扣的提高量为 10%~15%之间的某个值,折扣量 100x 的变化曲线如下图所示:
100x = 50(15r-1)/r
利润 L(假设 Q = 1,仅考虑变化趋势)的变化曲线如下图所示:L = 25(225r + 1/r + 30)
((4)什么情况下折扣 会导致利润降低? 利润 L = y = f(x)= Q *(-15 x^2 + 125x + 1500)利润 L(假设 Q = 1)随 x 变化的变化曲线如下图所示:
由第(1)问所求可得,极大值点为 x = 4.17(折扣量 100x = 417 美元),当折扣量 100x <= 417 美元时,随着折扣量的增加,利润增加; 当折扣量 100x > 417 美元时,随着折扣量的增加,利润降低。
由上图还可知,当 x 取[8 , 8.5]区间上的某个值时,利润恰好等于 1500 美元。所以对 x 的取值再进行细分,绘出散点图如下:
由图可知,当 x > 8.33 时,即当折扣量> 833 美元时,此时利润小于没有折扣时的利润。
第三部分
结果与讨论(可加页)
一、
实验结果分析(包括数据处理、实验现象分析、影响因素讨论、综合分析和结论等)、应用 Excel 建模分析(1)问题 1:已分配席位数和席位号服从等差数列,重复输入浪费时间。
解决方法:使用 Excel 的自动填充功能 以已分配席位数的输入为例,具体操作如下:
a.在准备填充的第一个单元格输入原本应输入的值,此处输入 1,然后保持鼠标停留在该单元格; b.然后在菜单栏找到【开始】,点开后找到【填充】并点击;
c.点击【填充】后选择【序列】,然后进行参数设置。此处应选择【列】和【等差数列】,【步长值】输入等差数列公差值,【终止值】为等差数列最后一个数的值。操作如下图:
d.使用自动填充之后可以得到结果如下:
(2)问题 2:本实验的实验任务是利用 Q 值法分配席位,并且在 Excel 中进行 Q 值计算。
我认为如果在 Excel 中仅仅只进行 Q 值计算,是无法准确地确定 Q 值计算次数的终止点,容易产生一些不必要的计算。
解决方法:
我将表格的内容分为三部分:
a.已知的每个系的人数和所求的每个系最终分得席位数;(有助于更直观地了解已知条件和最终结论;同时 Q 值计算公式中我使用了 B2、C2、D2 单元格,如果三个系的人数发生变化,则只需要修改此处的数据即可,不必修改公式)
b.在不同的已分配席位数的情况下,三个系 Q 值的取值; c.席位分配过程:给席位编号,标注出每个席位的分配结果;(有助于更直观地了解 Q 值法分配的原理;便于最后计算各系的最终分得席位数)
此种分法便于确定 Q 值计算次数的终止点。具体方法是:
每进行一次 Q 值计算,则分配一次席位,分配结果直接写在表格中相应位置,更加直观。当所有席位分配完毕,则是 Q 值计算的终止点,此时在表格中回顾席位分配过程并计数即可得到各系最终分得的席位数。
13、单变量最优化(1)问题 1:绘制散点图之前,要先在表格中输入自变量的值,该数据服从等差数列。
解决方法:使用 Excel 的自动填充功能 具体操作:类似【用 应用 Excel 建模分析】中的问题 1 的操作步骤。
(2)问题 2:绘制散点图之前因变量的计算公式处理方法 解决方法:使用拖曳复制再粘贴的方法。
以第(1)问的第一个散点图为例,具体操作如下:
a.打开 Excel 新建一个表格,分别列出 X 栏和 Y 栏。
b.X 栏采用 Excel 的自动填充功能,依次写入 0,1,2,3 „„ 等等,Y 栏第一项,根据公式,将 x 以 A2 替代,手写输入公式“=-15*A2*A2+125*A2+1500”(此处假设 Q = 1),c.其余的 Y 栏数据,采用拖曳复制的方式复制粘贴公式。首先选中 Y 栏第一项,点击鼠标右键,点击【复制】;然后选中待填入数据的所有 Y 栏单元格,点击鼠标右键,点击【粘贴选项】中的【公式】;则当 X 栏有值时,Y 栏就有对应的值。
d.绘散点图:全部选中 X 栏和 Y 栏的数据,点击菜单栏的【插入】然后插入【散点图】,得到如下图表:
(3)问题 3:使用 Excel 求函数极值点的方法
解决方法:除了用公式法和导数求解之外,使用 Excel 采用多次绘散点图的方法也可求出函数极值点。
以第(1)问为例,具体操作如下:
采用前面的问题(2)中的方法,得到第一个散点图如下:
由表和图可知,当 x 在 4 附近时,y 取得最大值。
故将 x 的取值区间缩小到[3.5 , 4.5] , 再绘出一次散点图,如下:
由上述表和图可知,当 x ≈ 4.2 时,y 取得最大值。而导数计算结果为 x≈4.17,可知绘散点图求函数极值点是可行的。
如果想得到更精确的结果,可以将 x 的取值区间继续缩小,每个值之间的差也不断缩小,直至更加接近于真正的极值点。
二、
小结、建议及体会 此次实验涉及到的知识点包括数据分析的理论、最优化模型的建模方法、应用 Excel 的方法等,我按照实验任务的要求,查阅相关资料,制定出理论结合实际的实验方案,采用“从整体规划,分步骤实施,实验全面总结”的技术路线完成了实验。
此次试验,巩固了我在课堂所学的内容,加深了我对数据分析与建模的理论与方法的了解,帮助我基本掌握了典型的数据模型的建立与使用,提升了我的实验动手能力。
此次实验我主要面临的问题是如何使用 Excel 建模。由于先前对 Excel 的了解甚少,所以此次实验的困难可能会稍大一点,不过,我也因此学到了 Excel 的许多使用技巧,包括自动填充、拖曳复制粘贴公式等,使我受益匪浅。
同时,我还学习了利用表格中的数据绘制散点图,以此类推,也掌握了其他图形的绘制方法。这使得我对于以后其他情况下的数据分析处理多了一种分析方法。我感觉数据分析与建模真的是一门很有用的课,建模帮助我们将现实问题转化为数学问题,再进而求解,更加方便。而模型的求解过程帮助我们掌握了一些建模分析的软件,这将会成为我们人生的一笔财富,成为我们日后需要进行数据分析时的助力。
建议:我觉得关于 Excel 建模方面的知识还是有点少,课件里的内容不是很便于学习。如果可以的话,希望老师可以提供一份较为系统的利用 Excel 建模的过程的资料(步骤叙述明确,带有截图和提示)。不过,该课程后期并不会继续使用 Excel 建模,所以此建议请老师斟酌时间和精力再考虑,或者选择熟悉 Excel 建模过程的同学帮助老师制作此资料,供其他不擅长的同学学习。
第四部分
评分标准(教师可自行设计)及成绩
观测点 考核目标 权重 得分 实验预习1. 预习报告 2. 提问 3. 对于设计型实验,着重考查设计方案的科学性、可行性和创新性 对实验目的和基本原理的认识程度,对实验方案的设计能力 20%
实验过程 1. 是否按时参加实验 2. 对实验过程的熟悉程度 3. 对基本操作的规范程度 4. 对突发事件的应急处理能力 5. 实验原始记录的完整程度 6. 同学之间的团结协作精神 着重考查学生的实验态度、基本操作技能;严谨的治学态度、团结协作精神 30%
结果分析 1. 所分析结果是否用原始记录数据 2. 计算结果是否正确 3. 实验结果分析是否合理 4. 对于综合实验,各项内容之间是否有分析、比较与判断等 考查学生对实验数据处理和现象分析的能力;对专业知识的综合应用能力;事实求实的精神 50%
该项实验报告最终得分
教师签名:。
第三篇:数据分析与建模,实验报告,实验二,,数据分析工具初步使用
学生学号
实验课成绩
学 学 生 实 验 报 告 书
实验课程名称 数据分析与建模 开 开 课 学 院 管理学院 指导教师姓名 鄢 丹 学 学 生 姓 名
学生专业班级 信管 16 班
202_ —202_ 学年
第1
学期实验报告填写说明
1. 综合性、设计性实验必须填写实验报告,验证、演示性实验可不写实验报告。
2. 实验报告书 必须按统一格式制作(实验中心网站有下载)。
3. 老师在指导学生实验时,必须按实验大纲的要求,逐项完成各项实验;实验报告书中的实验课程名称和实验项目 必须与实验指导书一致。
4. 每项实验依据其实验内容的多少,可安排在一个或多个时间段内完成,但每项实验只须填写一份实验报告。
5. 每份实验报告教师都应该有签名、评分表及实验报告成绩。
6. 教师应及时评阅学生的实验报告并给出各实验项目成绩,完整保存实验报告。在完成所有实验项目后,教师应按学生姓名将批改好的各实验项目实验报告装订成册,构成该实验课程总报告,按班级交到实验中心,每个班级实验报告袋中附带一份实验指导书及班级实验课程成绩表。
7. 实验报告封面信息需填写完整,并给出实验环节的成绩,实验环节成绩按其类型采取百分制或优、良、中、及格和不及格五级评定(与课程总成绩一致),并记入课程总成绩中。
实验课程名称:_ 数据分析与建模__
实验项目名称 实验二
数据分析工具的初步使用 实验 成绩
实 实 验 者
专业班级
组 组
别 无 无 同 同 组 者 无 无 实验日期 202_ 年 年 10 月 月 10 日 一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,主要仪器设备及耗材,实验方案与技术路线等)
一、实验目的、意义 本实验旨在通过资料查阅和上机实验,熟悉和掌握数据分析工具 Mathematica。
二、实验 基本原理 与方法
数据分析工具 Mathematica 的使用方法,以及帮助指南文档等。
三、实验内容及要求 应用 Mathematica 完成下列题目的运算求解或绘图。
(1)分别计算 2+4,3 2-2 3,的值。
(2)对 的值,分别取有效数字位数 6 位,20 位,30 位。
(3)给变量 a 赋值为 2,并计算 a 2-6,3a+b 的值。
(4)定义函数 f(x)=xsinx+x 2 +2x,分别求 f(x)在 x=1,π/2 时的值,再求 f(x 2)。
(5)设函数,求 的值。
(6)作函数 f(x)=x 2 的图形。
(7)将 f(x)=x 2 与 g(x)=x-1 画在一个坐标系内。
(8)在同一坐标系中绘制
与 的图形。
(9)绘制函数 在区间[0,2π]上的图形。
(10)绘制由坐标(-1,2),(0,2.5),(1,3),(2,4),(3,4.5),(4,5.5)构成的散点图。
(11)绘制函数 sin(x+y)cos(x+y)的 3D 立体图。
(12)绘制函数 在-2≤x≤2,-2≤y≤2 上的图形。
(13)绘制函数 在-2≤x≤2,-2≤y≤2 上的图形,去掉坐标系,边框,网格线。
(14)绘制螺旋线
在 0≤t≤4π 上的图形。
(15)利用参数方程绘制 z=x 2 + y 2 在 0≤z≤8 上的图形。
四、实验方案或技术路线(只针对综合型和设计型实验)
按照实验任务要求,理论结合实际的实验方案,巩固课程内容,温故知新,查遗补漏,夯实理论基础,提升实验动手能力。
技术路线是,从整体规划,分步骤实施,实验全面总结。
第二部分:实验过程记录(可加页)(包括实验原始数据记录,实验现象记录,实验过程发现的问题等)
(1)分别计算 2+4,3 2-2 3,的值。
步骤:以 2+4 的计算过程为例。首先输入“In”后的式子,如“2+4”;然后同时按下键盘上的“shift”和“enter”键,就可得到“Out”后面的计算结果,如“2+4”的结果为“6”。其他式子也是按照此方法计算。其中,运算符“+”、“-”、“*”、“/”、“^”(乘方)均可以在键盘上找到,而根号的输入如下:
鼠标先在导航栏上找到【面板】并点击,再选择【特殊字符】,再选择【符号】,便可找到根号。当光标停留在该符号上时,会显示“sqrt”,即开根号的意思。根号的具体位置如下图所示:
按照上述方法得到的运行结果如下图所示:
(2)对 的值,分别取有效数字位数 6 位,20 位,30 位。
取有效数字需要用到近似运算符,语法如下:N[表达式,有效数字位数]。系统默认是至少16 位,但标准输出只显示前 6 位有效数字。
%表示上一次的输出结果;%% 表示上上一次的输出结果„„以此类推。
% a(a 为常数)表示第 a 次的输出结果。
结合本题来看, 具体分析如下:
N[%]表示输出上一次的输出结果,并取 6 位有效数字; N[%4, 20]表示输出第 4 次的输出结果 Out[4],并取 20 位有效数字 N[%4, 30]表示输出第 4 次的输出结果 Out[4],并取 30 位有效数字 运行结果如下图所示:
(3)给变量 a 赋值为 2,并计算 a 2-6,3a+b 的值。
变量的赋值、表示与运算:变量名必须以小写字母开头,不能含有空格或标点符号;变量赋值用“=”表示;变量一旦被赋值,会一直保留,直到它被清除或被重新赋值。可用命令“Clear [变量]”清除原来的赋值。
具体输入及运行结果如下:
(4)定义函数 f(x)=xsinx+x 2 +2x,分别求 f(x)在 x=1,π/2 时的值,再求 f(x 2)。
多元函数的自定义命令:自定义函数 [ 变量 1_, 变量 2_, „] := 表达式 求函数在某一点的值时,直接将自变量的值代入再输出即可。
注意:此处 Sin 函数的首字母 S 需要大写,否则软件不会将其视为正弦函数,而是视为一个变量。如果用 Pi 表示 π 时,首字母也需要大写,否则软件会将其视作一个变量名。
(5)设函数,求 的值。
定义分段函数,只需要分段定义自定义函数即可,并在后面添加范围限制,格式为:
/ ;范围限制(其中“逻辑与”用“&&”表示,“逻辑或”用“||”表示)
(6)作函数 f(x)=x 2 的图形。
一元函数作图的命令:Plot[函数, 作图范围, 可选项] 故本题为:
f[x_] := x^2 Plot[f[x], {x,-1, 1}]
(7)将 f(x)=x 2 与 g(x)=x-1 画在一个坐标系内。
当两图画在一个坐标系时,一元函数作图的命令为:
Plot[{函数 1, 函数 2, „}, 作图范围, 可选项] 故本题为:Plot[{x^2, x-1}, {x,-1, 1}]
(8)在同一坐标系中绘制
与 的图形。
参数方程作图的命令:ParametricPlot[参数方程, 参数范围, 可选项] 若以参数方程组取代参数方程 , 可在同一坐标系中绘制多个参数方程所确定的函数的图形。AspectRatio->Automatic 为可选项,表示按坐标系刻度的实际比例 1:1 作图,默认情况下是 0.618:1。
故本题为:ParametricPlot[{{Sin[t], Cos[t]}, {Sin[t], 2*Cos[t]}}, {t, 0, 2*Pi}]
(9)绘制函数 在区间[0,2π]上的图形。
极坐标式函数作图的命令:PolarPlot[极坐标函数, 变量范围, 可选项] 故本题为:PolarPlot[1−Cos[
第四篇:数学建模与数学实验
通过多年来的教学改革与教学实践,教学效果显著,模块化分层次教学、换位式教学和启发式教学的方法得到了学生们的认可。这种方式大大提高了学生们的动手能力,并贯穿于平时的教学实践中,同时也反映出学生撰写科技论文的写作水平,为学生进一步参加数学建模竞赛奠定了良好的基础。该课程的成功经验在我校、市内以及西部地区起到很好的示范辐射作用,得到专家和学生的好评。
校外专家
(一)评价:
刘琼荪(全国数学建模竞赛重庆赛区组委会秘书长,重庆大学教授)
重庆邮电大学是我国最早开设数学建模系列课程的学校之一, 经过十多年的努力,该课程已经建设成为培养学生的创新和竞争能力的优秀课程。该课程在教学环节上充分体现出了教学研究型大学的特色,坚持培养学生“以竞赛为契机,以能力提升为宗旨”的指导思想,在教学内容和教学方式方面进行了大胆、慎重的改革, 把课堂教学、课后实践、在数学建模基地做数学实验、参加讨论班研讨、参加国内外数学建模竞赛结合起来,既激发了学生进一步学习数学的兴趣,又提高了学生的科学素质和能力,收到了很好的效果。该类课程自开设以来,已有逾万名学生学习本课程。全校每年有1000余名学生参加全国或校内竞赛,近三年参加全国大学生数模竞赛中, 获全国奖27项(规定每年一个学校最多10项), 成绩在重庆赛区参赛学校中名列前茅。另外,陈理荣教授等编著的教材《数学建模导论》(北京邮电大学出版社出版)也已为全国20余所大学用作数学建模课程的教材被广泛使用,杨春德教授等编著的《数学建模的认识与实践》也为本门课程的建设提供了素材。且《数学建模》已成为重庆市精品课程,“数学建模与数学实验”教学团队已获重庆市市级教学团队称号。
有鉴于此,我认为《数学建模与数学实验》已完全达到了重庆邮电大学重点课程的要求。
校外专家
(二)评价:
朱宁(全国大学生数学建模优秀指导教师,桂林电子科技大学教授)
全国大学生数学建模竞赛自90年代在我国开展以来,一直受到全国各高校的重视,把竞赛作为培养数学知识应用的一个平台。重庆邮电大学是较早参加这活动的高校,近几年,在竞赛中屡获佳绩,走在同类高校的前列,引起了广泛的重视。本人认为重庆邮电大学在数学建模赛成功的主要经验有如下几方面: 首先是有一支实力雄厚、敬业的师资队伍。《数学建模与数学实验》课程建设成员11名,其中有教授4人,副教授6人,4人具有博士学位,1人获全国大学生数学建模竞赛优秀指导教师称号。教学成果多,教学团队整体实力强,“数学建模与数学实验”教学团队已获重庆市市级教学团队称号。
其次《数学建模与数学实验》类课程形成了“三层次—两阶段”的教学和竞赛的课程改革方案,设计并探索了数学应用型人才培养理念,在教学模式和教学方法和评价方式等方面均有创新,形成了“教学-实践-竞赛” 的数学建模教学模式,形成了一套具有特色的加强数学模型思想的教学模式。
第三是注重校际间交流,吸取好的经验,完善教学过程。教师曾多次在国内外关于数学建模教学与应用会议上介绍经验,并先后在国内外核心期刊上发表论文数篇。每年参加赛区举办的数学实验课程和数学建模竞赛的教学经验交流会议。该课程建设已在西部地区起到了示范作用。
鉴于以上内容,个人认为《数学建模与数学实验》已达到了重庆邮电大学重点课程的要求。
校内同行评价
胡学刚(全国数学建模竞赛优秀指导教师,重庆邮电大学教务处副处长、教授)
《数学建模与数学实验》类课程先后为不同层次的学生开设了任选课、限选课和必修课。近年来,课程建设小组以《数学建模与数学实验》类课程为平台,以数学建模竞赛为契机,在工科数学类课程的教育教学改革中取得了突出成绩,主要表现在以下几个方面:
1.坚持数学建模类课程建设与工科数学教学改革相结合,数学建模类课程建设与数学建模竞赛相结合,理论教学与实验实践、课外活动相结合,将数学建模的思想融入到其它数学类课程的教学中,进一步深化工科数学类课程的教学改革。该课程建设特色鲜明,成效显著。
2.课题组老师热情指导学生开展数学建模活动,积极组织学生参加校内、国内及美国大学生数学建模竞赛。从最初的鼓励学生参赛,到现在同学们积极主动参赛;从最初的几个队参赛到现在的近百个队参赛,数学建模竞赛经历了一次次飞跃。经过多年的探索,课题组总结了一套成功的指导培训经验,使我校学生参加全国竞赛取得了优异成绩,近3年来,我校共有27个队获得国家级奖励,在重庆赛区位居前列,特别是202_年名列全国第二(公示中)。
3.师资队伍建设成效显著。近年来,课题组新增2位教师获得博士学位,1位教师博士即将毕业,教授由申报时的0人变为4人。队伍中现拥有全国模范教师、重庆市中青年骨干教师、重庆邮电大学优秀青年教师。他们多次在赛区组织的教练交流活动中介绍数学建模类课程程建设经验和竞赛经验,在重庆市乃至西部地区发挥了示范辐射作用。
4.课程建设成绩显著。在该门课程建设过程中,编著出版了《数学建模的认识与实践》一书,《数学建模》已成为重庆市精品课程,“数学建模与数学实验”已获重庆市市级教学团队称号,《数学建模理论与方法》于202_年成为重庆邮电大学立项建设教材。
有鉴于此,该课程是有较大影响的富有特色的课程,已具备了重庆邮电大学重点课程的条件。
学生评价
(一):
数学建模与数学实验这门课程是一门开放性和主动性的一门课程,它就是需要从现实生活、现实问题中抽象出数学模型,从而解决问题。这门课程融合了许多学科,对于学生来说,有机会广泛涉猎各种知识,这对于我们后续的发展是十分有好处的,因为目前在实际部门工作,也许不需要你对某一方面的有很深的知识,主要是遇到一个问题,能有解决的方法;再有就是对于继续深造的同学,也十分有益,因为通过广泛的知识储备,学生可以从中找到自己感兴趣的方向,继续深入的做下去,《数学建模与数学实验》这门课就为我们在这两方面打下了良好的基础。
同时,数学建模有利于培养学生的创造性思维能力,数学建模主要考查学生的数学思想方法,它是一种数学活动,而不单单像传统的数学练习题一样,做出来的答案是唯一的。相反,它可以有多种多样的答案,只要学生建立的模型是可行的,那它就是正确的。在学习这门课程的过程中,我也做过很多的实际题目,从那些过程中,我体会到的数学在实际生活中的应用,更重要的是培养了我们合作交流的方法、习惯,特别是促进学生的数学应用意识,提高了解决实际问题的能力。无论是数学研究还是数学学习,其目的之一就是将数学运用于社会,运用于现实,数学建模就重视培养学生的数学思维,加强数学应用意识,切实提高分析和解决实际问题的能力。
学习《数学建模与数学实验》是我大三的时候,朱伟老师将这门数学课讲得生动有趣,他没有介绍过于高深的理论,而是从实际应用出发。让我们对这门课程充满了兴趣,同时也对数学有了重新的认识,目前我正在进行硕士研究生阶段的学习,觉得那个时候学到的一些理论知识还有用,虽然那个时候没有过多的去深入研究那些知识,但现在当我遇到问题的时候,我知道有那样的一个理论存在,所以对于我来说就多了一些解决问题的方法。总之,在解决实际问题时,我们只有多了解一些方法,才能去掌握它,从而运用它,《数学建模与数学实验》就是一个连接理论与实际应用的桥梁。
(重庆邮电大学信息与计算科学专业,现西南财经大学统计学院硕士研究生 周黎)
校内学生(二)评价
大一的时候我就接触过数学建模,那是学校组织的数学建模竞赛,我们小组在比赛中获得了第三名,虽然是一个小小的第三名,当时还是给我很大的鼓舞,因为那时候大一能得奖好像只有两组,因此这学期一听说要开数模选修课,我就立马去报了名,抱着一点能学点东西的态度,认认真真的听完了前面大半的内容,后面由于很难坐倒好坐位,就只有自学了。
通过这门课的学习,我认识到了数模课多么的博大精深,虽然还是要靠一点小聪明,但主要还是要靠勤奋,因为数模涉及到太多的东西了,基本涉及到所有数学方面的知识,还有社会,科学等各方面的知识,要想能在这上面有所成就,只有靠平时的认真学习,打下牢实的基础。只有这样,才有可能在这上面有所发展。学习这门课,不管从学知识的角度,还是从学做学问的角度,对我而言,我都有很大的收获,衷心感谢各位数学组的老师在星期六不辞辛苦为我们上课。
(重庆邮电大学通信学院, 杨鹏)
校内学生(三)评价
从小到大,我对数学充满了爱好和兴趣,于是报名参加了数模学习辅导班。通过一个学期的数模学习,使自己学到了很多东西,不仅对数模的概念有了一定的了解,对数学建模的方法有了一定的掌握,同时也使自己加深了对数学知识的理解,能灵活运用数学解决一些实际吻题。数学建模是一种具有创造性的科学方法,它将现实问题简化,抽象为一个数学问题或者数学模型,然后采用恰当的数学方法求解,进而对现实问题进行定量分析和研究,最终达到解决实际问题的目的。随着计算机的运用和发展,数学建模成为高科技的一种“数学技术”,起着关键性的作用,作为计算机学员的一名学生,掌握新的技术和方法是必要的,是受益匪浅的。通过一个学期的学习,数模培养了我的洞察力,想象力,逻辑思维能力以及分析问题,解决问题的能力。在学习过程中,虽然碰到了很多的问题和困难,但是在老师的指点和教导下,使得很多问题都得到了解决,在这里要感谢辛勤教育我们的老师。虽然我没有去参加数模竞赛,但是我确实学到了很多东西,我相信这些我所学到的知识,对我的将来是有好处的。
(重庆邮电大学计算机学院:陈辉)
第五篇:数学建模各种分析方法
现代统计学
1.因子分析(Factor Analysis)
因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。
运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。
2.主成分分析
主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。
主成分分析和因子分析的区别
1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。
2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。
3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。
4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。
5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。
和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。
总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。
在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。
3.聚类分析(Cluster Analysis)
聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类的分析技术。
在市场研究领域,聚类分析主要应用方面是帮助我们寻找目标消费群体,运用这项研究技术,我们可以划分出产品的细分市场,并且可以描述出各细分市场的人群特征,以便于客户可以有针对性的对目标消费群体施加影响,合理地开展工作。
4.判别分析(Discriminatory Analysis)
判别分析(Discriminatory Analysis)的任务是根据已掌握的1批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的1个新样品,判断它来自哪个总体。
根据资料的性质,分为定性资料的判别分析和定量资料的判别分析;采用不同的判别准则,又有费歇、贝叶斯、距离等判别方法。
费歇(FISHER)判别思想是投影,使多维问题简化为一维问题来处理。选择一个适当的投影轴,使所有的样品点都投影到这个轴上得到一个投影值。对这个投影轴的方向的要求是:使每一类内的投影值所形成的类内离差尽可能小,而不同类间的投影值所形成的类间离差尽可能大。
贝叶斯(BAYES)判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断。所谓先验概率,就是用概率来描述人们事先对所研究的对象的认识的程度;所谓后验概率,就是根据具体资料、先验概率、特定的判别规则所计算出来的概率。它是对先验概率修正后的结果。
距离判别思想是根据各样品与各母体之间的距离远近作出判别。即根据资料建立关于各母体的距离判别函数式,将各样品数据逐一代入计算,得出各样品与各母体之间的距离值,判样品属于距离值最小的那个母体。5.对应分析(Correspondence Analysis)
对应分析是一种用来研究变量与变量之间联系紧密程度的研究技术。
运用这种研究技术,我们可以获取有关消费者对产品品牌定位方面的图形,从而帮助您及时调整营销策略,以便使产品品牌在消费者中能树立起正确的形象。
这种研究技术还可以用于检验广告或市场推广活动的效果,我们可以通过对比广告播出前或市场推广活动前与广告播出后或市场推广活动后消费者对产品的不同认知图来看出广告或市场推广活动是否成功的向消费者传达了需要传达的信息。
6.典型相关分析
典型相关分析是分析两组随机变量间线性密切程度的统计方法,是两变量间线性相关分析的拓广。各组随机变量中既可有定量随机变量,也可有定性随机变
量(分析时须F6说明为定性变量)。本法还可以用于分析高维列联表各边际变量的线性关系。注意:
1.严格地说,一个典型相关系数描述的只是一对典型变量之间的相关,而不是两个变量组之间的相关。而各对典型变量之间构成的多维典型相关才共同揭示了两个观测变量组之间的相关形式。
2.典型相关模型的基本假设和数据要求
要求两组变量之间为线性关系,即每对典型变量之间为线性关系;
每个典型变量与本组所有观测变量的关系也是线性关系。如果不是线性关系,可先线性化:如经济水平和收入水平与其他一些社会发展水之间并不是线性关系,可先取对数。即log经济水平,log收入水平。3.典型相关模型的基本假设和数据要求
所有观测变量为定量数据。同时也可将定性数据按照一定形式设为虚拟变量后,再放入典型相关模型中进行分析。
7.多维尺度分析(Multi-dimension Analysis)
多维尺度分析(Multi-dimension Analysis)是市场研究的一种有力手段,它可以通过低维空间(通常是二维空间)展示多个研究对象(比如品牌)之间的联系,利用平面距离来反映研究对象之间的相似程度。由于多维尺度分析法通常是基于研究对象之间的相似性(距离)的,只要获得了两个研究对象之间的距离矩阵,我们就可以通过相应统计软件做出他们的相似性知觉图。
在实际应用中,距离矩阵的获得主要有两种方法:一种是采用直接的相似性评价,先所有评价对象进行两两组合,然后要求被访者所有的这些组合间进行直接相似性评价,这种方法我们称之为直接评价法;另一种为间接评价法,由研究人员根据事先经验,找出影响人们评价研究对象相似性的主要属性,然后对每个研究对象,让被访者对这些属性进行逐一评价,最后将所有属性作为多维空间的坐标,通过距离变换计算对象之间的距离。
多维尺度分析的主要思路是利用对被访者对研究对象的分组,来反映被访者对研究对象相似性的感知,这种方法具有一定直观合理性。同时该方法实施方便,调查中被访者负担较小,很容易得到理解接受。当然,该方法的不足之处是牺牲了个体距离矩阵,由于每个被访者个体的距离矩阵只包含1与0两种取值,相对较为粗糙,个体距离矩阵的分析显得比较勉强。但这一点是完全可以接受的,因为对大多数研究而言,我们并不需要知道每一个体的空间知觉图。
多元统计分析是统计学中内容十分丰富、应用范围极为广泛的一个分支。在自然科学和社会科学的许多学科中,研究者都有可能需要分析处理有多个变量的数据的问题。能否从表面上看起来杂乱无章的数据中发现和提炼出规律性的结论,不仅对所研究的专业领域要有很好的训练,而且要掌握必要的统计分析工具。对实际领域中的研究者和高等院校的研究生来说,要学习掌握多元统计分析的各种模型和方法,手头有一本好的、有长久价值的参考书是非常必要的。这样一本书应该满足以下条件:首先,它应该是“浅入深出”的,也就是说,既可供初学者入门,又能使有较深基础的人受益。其次,它应该是既侧重于应用,又兼顾必要的推理论证,使学习者既能学到“如何”做,而且在一定程度上了解“为什么”这样做。
最后,它应该是内涵丰富、全面的,不仅要基本包括各种在实际中常用的多元统计分析方法,而且还要对现代统计学的最新思想和进展有所介绍、交代。因子分析
主成分分析通过线性组合将原变量综合成几个主成分,用较少的综合指标来代替原来较多的指标(变量)。在多变量分析中,某些变量间往往存在相关性。是什么原因使变量间有关联呢?是否存在不能直接观测到的、但影响可观测变量变化的公共因子?因子分析(Factor Analysis)就是寻找这些公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。
例如,随着年龄的增长,儿童的身高、体重会随着变化,具有一定的相关性,身高和体重之间为何会有相关性呢?因为存在着一个同时支配或影响着身高与体重的生长因子。那么,我们能否通过对多个变量的相关系数矩阵的研究,找出同时影响或支配所有变量的共性因子呢?因子分析就是从大量的数据中“由表及里”、“去粗取精”,寻找影响或支配变量的多变量统计方法。
可以说,因子分析是主成分分析的推广,也是一种把多个变量化为少数几个综合变量的多变量分析方法,其目的是用有限个不可观测的隐变量来解释原始变量之间的相关关系。
因子分析主要用于:
1、减少分析变量个数;
2、通过对变量间相关关系探测,将原始变量进行分类。即将相关性高的变量分为一组,用共性因子代替该组变量。
1.因子分析模型
因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。
因子分析模型描述如下:
(1)X =(x1,x2,…,xp)¢是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等(只要将变量标准化即可实现)。
(2)F =(F1,F2,…,Fm)¢(m
(3)e =(e1,e2,…,ep)¢与F相互独立,且E(e)=0, e的协方差阵∑是对角阵,即各分量e之间是相互独立的,则模型:
x1 = a11F1+ a12F2 +…+a1mFm + e1
x2 = a21F1+a22F2 +…+a2mFm + e2
………
xp = ap1F1+ ap2F2 +…+apmFm + ep
称为因子分析模型,由于该模型是针对变量进行的,各因子又是正交的,所以也称为R型正交因子模型。
其矩阵形式为:
x =AF + e.其中:
x=,A=,F=,e=
这里,(1)m £ p;
(2)Cov(F,e)=0,即F和e是不相关的;
(3)D(F)= Im,即F1,F2,…,Fm不相关且方差均为1;
D(e)=,即e1,e2,…,ep不相关,且方差不同。
我们把F称为X的公共因子或潜因子,矩阵A称为因子载荷矩阵,e 称为X的特殊因子。
A =(aij),aij为因子载荷。数学上可以证明,因子载荷aij就是第i变量与第j因子的相关系数,反映了第i变量在第j因子上的重要性。
2.模型的统计意义
模型中F1,F2,…,Fm叫做主因子或公共因子,它们是在各个原观测变量的表达式中都共同出现的因子,是相互独立的不可观测的理论变量。公共因子的含义,必须结合具体问题的实际意义而定。e1,e2,…,ep叫做特殊因子,是向量x的分量xi(i=1,2,…,p)所特有的因子,各特殊因子之间以及特殊因子与所有
公共因子之间都是相互独立的。模型中载荷矩阵A中的元素(aij)是为因子载荷。因子载荷aij是xi与Fj的协方差,也是xi与Fj的相关系数,它表示xi依赖Fj的程度。可将aij看作第i个变量在第j公共因子上的权,aij的绝对值越大(|aij|£1),表明xi与Fj的相依程度越大,或称公共因子Fj对于xi的载荷量越大。为了得到因子分析结果的经济解释,因子载荷矩阵A中有两个统计量十分重要,即变量共同度和公共因子的方差贡献。
因子载荷矩阵A中第i行元素之平方和记为hi2,称为变量xi的共同度。它是全部公共因子对xi的方差所做出的贡献,反映了全部公共因子对变量xi的影响。hi2大表明x的第i个分量xi对于F的每一分量F1,F2,…,Fm的共同依赖程度大。
将因子载荷矩阵A的第j列(j =1,2,…,m)的各元素的平方和记为gj2,称为公共因子Fj对x的方差贡献。gj2就表示第j个公共因子Fj对于x的每一分量xi(i=1,2,…,p)所提供方差的总和,它是衡量公共因子相对重要性的指标。gj2越大,表明公共因子Fj对x的贡献越大,或者说对x的影响和作用就越大。如果将因子载荷矩阵A的所有gj2(j =1,2,…,m)都计算出来,使其按照大小排序,就可以依此提炼出最有影响力的公共因子。
3.因子旋转
建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以便对实际问题进行分析。如果求出主因子解后,各个主因子的典型代表变量不很突出,还需要进行因子旋转,通过适当的旋转得到比较满意的主因子。
旋转的方法有很多,正交旋转(orthogonal rotation)和斜交旋转(oblique rotation)是因子旋转的两类方法。最常用的方法是最大方差正交旋转法(Varimax)。进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,使大的载荷更大,小的载荷更小。因子旋转过程中,如果因子对应轴相互正交,则称为正交旋转;如果因子对应轴相互间不是正交的,则称为斜交旋转。常用的斜交旋转方法有Promax法等。
4.因子得分
因子分析模型建立后,还有一个重要的作用是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价。例如地区经济发展的因子分析模型建立后,我们希望知道每个地区经济发展的情况,把区域经济划分归类,哪些地区发展较快,哪些中等发达,哪些较慢等。这时需要将公共因子用变量的线性组合来表示,也即由地区经济的各项指标值来估计它的因子得分。
设公共因子F由变量x表示的线性组合为:
Fj = uj1 xj1+ uj2 xj2+…+ujpxjp
j=1,2,…,m
该式称为因子得分函数,由它来计算每个样品的公共因子得分。若取m=2,则将每个样品的p个变量代入上式即可算出每个样品的因子得分F1和F2,并将其在平面上做因子得分散点图,进而对样品进行分类或对原始数据进行更深入的研究。
但因子得分函数中方程的个数m小于变量的个数p,所以并不能精确计算出因子得分,只能对因子得分进行估计。估计因子得分的方法较多,常用的有回归估计法,Bartlett估计法,Thomson估计法。
(1)回归估计法
F = X b = X(X ¢X)-1A¢ = XR-1A¢
(这里R为相关阵,且R = X ¢X)。
(2)Bartlett估计法
Bartlett估计因子得分可由最小二乘法或极大似然法导出。
F = [(W-1/2A)¢ W-1/2A]-1(W-1/2A)¢ W-1/2X =(A¢W-1A)-1A¢W-1X
(3)Thomson估计法
在回归估计法中,实际上是忽略特殊因子的作用,取R = X ¢X,若考虑特殊因子的作,此时R = X ¢X+W,于是有:
F = XR-1A¢ = X(X ¢X+W)-1A¢
这就是Thomson估计的因子得分,使用矩阵求逆算法(参考线性代数文献)可以将其转换为:
F = XR-1A¢ = X(I+A¢W-1A)-1W-1A¢
5.因子分析的步骤
因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。
(i)因子分析常常有以下四个基本步骤:
(1)确认待分析的原变量是否适合作因子分析。
(2)构造因子变量。
(3)利用旋转方法使因子变量更具有可解释性。
(4)计算因子变量得分。
(ii)因子分析的计算过程:
(1)将原始数据标准化,以消除变量间在数量级和量纲上的不同。
(2)求标准化数据的相关矩阵;
(3)求相关矩阵的特征值和特征向量;
(4)计算方差贡献率与累积方差贡献率;
(5)确定因子:
设F1,F2,…, Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;
(6)因子旋转:
若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。
(7)用原指标的线性组合来求各因子得分:
采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。
(8)综合得分
以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。
F =(w1F1+w2F2+…+wmFm)/(w1+w2+…+wm)
此处wi为旋转前或旋转后因子的方差贡献率。
(9)得分排序:利用综合得分可以得到得分名次。
在采用多元统计分析技术进行数据处理、建立宏观或微观系统模型时,需要研究以下几个方面的问题:
· 简化系统结构,探讨系统内核。可采用主成分分析、因子分析、对应分析等方法,在众多因素中找出各个变量最佳的子集合,从子集合所包含的信息描述多变量的系统结果及各个因子对系统的影响。“从树木看森林”,抓住主要矛盾,把握主要矛盾的主要方面,舍弃次要因素,以简化系统的结构,认识系统的内核。
· 构造预测模型,进行预报控制。在自然和社会科学领域的科研与生产中,探索多变量系统运动的客观规律及其与外部环境的关系,进行预测预报,以实现对系统的最优控制,是应用多元统计分析技术的主要目的。在多元分析中,用于预报控制的模型有两大类。一类是预测预报模型,通常采用多元线性回归或逐步回归分析、判别分析、双重筛选逐步回归分析等建模技术。另一类是描述性模型,通常采用聚类分析的建模技术。
· 进行数值分类,构造分类模式。在多变量系统的分析中,往往需要将系统性质相似的事物或现象归为一类。以便找出它们之间的联系和内在规律性。过去许多研究多是按单因素进行定性处理,以致处理结果反映不出系统的总的特征。进行数值分类,构造分类模式一般采用聚类分析和判别分析技术。
如何选择适当的方法来解决实际问题,需要对问题进行综合考虑。对一个问题可以综合运用多种统计方法进行分析。例如一个预报模型的建立,可先根据有关生物学、生态学原理,确定理论模型和试验设计;根据试验结果,收集试验资料;对资料进行初步提炼;然后应用统计分析方法(如相关分析、逐步回归分析、主成分分析等)研究各个变量之间的相关性,选择最佳的变量子集合;在此基础上构造预报模型,最后对模型进行诊断和优化处理,并应用于生产实际。