<ol id="ebnk9"></ol>
    1. 統計建模與R軟件實驗報告

      發布時間:2025-06-17 16:23:09   來源:黨團工作    點擊:   
      字號:

       開課學院、實驗室:

       數學與統計學院 實驗時間 :2013 年 3 月 日

        實驗項目 名 稱 多維數組和矩陣 實驗項目類型 驗證 演示 綜合 設計 其他 指導 教師 張應應 成 績

        一、 實驗目的 1• 了解 R 軟件的基本功能以及基本操作 2. 掌握 R 軟件的基本操作 二、 實驗內容 生成一個 5 階的 Hilbert 矩陣 1 H (h j ) nn, h ij _ ,i, j 1,2,...n. i j 1 (1) 計算 Hilbert 矩陣 H 的行列式 (2) 求 H 的逆矩陣 (3) 求 H 的特征值和特征向量。

       三、 實驗原理、方法(算法)、步驟 1. 函數 det(A) 是求矩陣 A 的行列式的值 2. 求矩陣 A 的逆,其命令形式為 slove(A) 3. 函數 eigen ( Sn )是求對稱矩陣 Sm 的特征值與特征向量 n<-5;x<-array(0,dim=c (n,n)) for (i in 1:n){for (j in 1:n){x[i,j]v-1/(i+j-1)}};x det(x) solve(x) eige n(x) 四、 實驗環境(所用軟件、硬件等)及實驗數據文件 軟件:

       R 2.15.3 五、 實驗結果及實例分析

       教師簽名 年 月曰

        > n< _5;x<_array(0,dim=c (n,n)) > for (i in 1:n){ + for (j in 1:n){ + x[i,j]<-1/(i+j-1) + } + };x [,1] [,2] [,3] [,4] [,5] [1,] 1.0000000 0.5000000 0.3333333 0.2500000 0.2000000 [2,] 0.5000000 0.3333333 0.2500000 0.2000000 0.1666667 [3,] 0.3333333 0.2500000 0.2000000 0.1666667 0.1428571 [4,] 0.2500000 0.2000000 0.1666667 0.1428571 0.1250000 [5,] 0.2000000 0.1666667 0.1428571 0.1250000 0.1111111 > det(x) [1] 3.749295e-12 > solve(x) [,2] [,3] [,4] [,5]

       [,1] [1,] 25 -300 1050 -1400 630 [2,] -300 4800 -18900 26880 -12600 [3,] 1050 -18900 79380 -■117600 56700 [4,] -1400 26880 - ■117600 179200 -88200 [5,] 630 -12600 56700 -88200 44100

       > eige n(x) $values [1] 1.567051e+00 2.085342e-01 1.140749e-02 3.058980e-04 3.287929e-06 $vectors [,1] [,2] [,3] [,4] [,5] [1,] 0.7678547 0.6018715 -0.2142136 0.04716181 0.006173863 [2,] 0.4457911 -0.2759134 0.7241021 -0.43266733 -0.116692747 [3,] 0.3215783 -0.4248766 0.1204533 0.66735044 0.506163658 [4,] 0.2534389 -0.4439030 -0.3095740 0.23302452 -0.767191193 [5,] 0.2098226 -0.4290134 -0.5651934 -0.55759995 0.376245545 分析:從實驗結果來看。

       R 軟件在處理數據上相當準確,方便。

       開課學院、實驗室:

       數學與統計學院 實驗時間 :2013 年 3 月 日

        實驗項目 描述統計量 實驗項目類型 名 稱 驗證 演示 綜合 設計 其他 指導 教師 張應應 成 績

        、實驗目的

       1. 掌握利用 R 軟件描述統計量的方法 2. 學會利用 R 軟件繪制數據的分布圖 3. 掌握多元數據的數據特征與相關分析在 R 軟件中的操作 、實驗內容 用 Pearson 相關檢驗法檢驗習題 3.7 中的身高與體重是否相關 三、實驗原理、方法(算法)、步驟 Pearson 相關性檢驗:利用統計量 t 服從自由度為 n-2 的 t 分布的性質,對數據 X 和 丫 的相 關性進行檢驗。

       r xy n 2

       t

       _______

       r xy 其中 四、實驗環境(所用軟件、硬件等)及實驗數據文件 R 2.15.3 數據文件 3.7 數據 .txt ,其內容如下: 學號姓名性別年齡身高體重 01 Alice F 13 56.5 84.0 02 Becka F 13 65.3 98.0 03 Gail F 14 64.3 90.0 04 Kare n F 12 56.3 77.0 05 Kathy F 12 59.8 84.5 06 Mary F 15 66.5 112.0 07 Sandy F 11 51.3 50.5 08 Sharo n F 15 62.5 112.5 09 Tammy F 14 62.8 102.5 10 Alfred M 14 69.0 112.5 11 Duke M 14 63.5 102.5

       教師簽名 年 月曰

        12 Guido M 15 67.0 133.0 13 James M 12 57.3 83.0 14 Jeffrey M 13 62.5 84.0 15 John M 12 59.0 99.5 16 Philip M 16 72.0 150.0 17 Robert M 12 64.8 128.0 18 Thomas M 11 57.5 85.0 19 William M 15 66.5 112.0 五、實驗結果及實例分析 student<-read.table("3.7 數據.txt",header=T) attach(stude nt) > cor.test(身高 , 體重 ) #Pearson 相關性檢驗 Pears on"s product-mome nt correlati on data: 身高 and 體重 t = 7.5549, df = 17, p-value = 7.887e-07 alter native hypothesis: true correlatio n is not equal to 0 95 perce nt con fide nee in terval: 0.7044314 0.9523101 sample estimates: cor 0.8777852 其 p 值 7.887e-07<0.05,拒絕原假設,所以身高與體重相關

       開課學院、實驗室: 數學與統計學院 實驗時間 :

       2013 年 月 日

        實驗項目 參數估計 實驗項目類型 名 稱 驗證 演示 綜合 設計 其他 指導 教師 張應應 成 績

        、實驗目的

       1 、學會利用 R 軟件完成一個和兩個正態總體的區間估計。

       2 、學會利用 R 軟件完成非正態總體的區間估計。

       3 、學會利用 R 軟件進行單側置信區間估計 、實驗內容 正常人的脈搏平均每分鐘 72 次,某一聲測得 10 例四乙基鉛中毒患者的脈搏數(次 /min )如 下:

       54 67 68 78 70 66 67 70 65 69 已知人的脈搏次數服從正態分布,試計算這 10 名患者平均脈搏次數的點估計和 95% 勺區間估 計,并做單側區間估計,試分析這 10 名患者的平均脈搏次數是否低于正常人的平均脈搏次 數。

       三、實驗原理、方法(算法)、步驟 假設正態總體 X ~ N ( , 2 ) , X 1 ,X 2 , X n 為來自總體 X 的一個樣本, 1 為置信度, X 為 樣本均值, S 2 為樣本方差。

       2已知和未知情況下,均值 的單側置信區間估計。分別討論總體方差 若2 已知,得到 P X

       Z a 1 于是得到的置信度為 P

       X— 乙

       1 1 的單側置信區間分別為 X

        Z a ,

       , Jn 因此,的置信度為 X 〒 Z a 一 :

       n , 若2未知,得到 "X 的單側置信下限、上限分別為: ——乙 、 n P XS 于是得到 — S X —t a (n 1), , 、 n 因此, 的置信度為 1 t a (n 1) 的置信度為 X P t a (n 1) 1 S

       L 的單側置信區間分別為 S ,X 「 n

       t a (n 1) 的單側置信下限、上限分別為

       1) , 教師簽名 年 月曰

       數據見實驗內容,所用軟件: 五、實驗結果及實例分析 在 R 軟件中運行代碼: > x<-c(54,67,68,78,70,66,67,70,65,69) > t.test(x) #做單樣本正態分布區間估計 One Sample t-test data: x t = 35.947, df = 9, p-value = 4.938e-11 alter native hypothesis: true mea n is not equal to 0 95 perce nt con fide nee in terval: 63.1585 71.6415 sample estimates: mean of x 67.4 ####平均脈搏點估計為 67.4, 95%置信度的區間估計為 [63.1585, 71.6415]。

       > t.test(x,alternative="less",mu=72) #做單樣本正態分布單側區間估計 One Sample t-test data: x t = -2.4534, df = 9, p-value = 0.01828 alter native hypothesis: true mea n is less tha n 72 95 perce nt con fide nee in terval: -Inf 70.83705 sample estimates: mea n of x 67.4 p-value = 0.01828<0.05,拒絕原假設,平均脈搏低于常人。X S

       t a (n .n X S

       t a (n .n 1) 四、實驗環境(所用軟件、硬件等)及實驗數據文件 R2.15.1

       開課學院、實驗室:

       實驗時間 :2013 年 月 日

        實驗項目 假設檢驗 實驗項目類型 名 稱 驗證 演示 綜合 設計 其他 指導 教師 張應應 成 績

        一、 實驗目的 1 、 了解假設檢驗的基本概念與步驟 2 、 掌握幾種重要的參數檢驗 3 、 掌握若干重要的非參數檢驗 二、 實驗內容 為研究某中心要對抗凝血酶活力的影響, 隨機安排新藥組病人 12 例,對照組病人 10 例, 分別測定其抗凝血酶活力,其結果如下:

       新藥組:

       126 125 136 128 123 138 142 116 110 108 115 140 對照組:

       162 172 177 170 175 152 157 159 160 162 試分析新藥組和對照粗病人的抗凝血酶活力有無差別( 0.05 )

       三、 實驗原理、方法(算法)、步驟 1. 基本原理:解決一個具體的假設檢驗問題,一般要借助直觀分析和理論分析思想。其 基本原理是實際推斷原理:“小概率事件在一次實驗中幾乎不可能發生”,如果發生,就認為 是不正常的,應該拒絕。

       2. 方法:

      ?。?1 )提出原假設 Ho ( 2 )

       確定假設檢驗統計量 Z ,并在 Ho 成立的條件下,導出 Z 的分布 ( 3 )

       確定拒絕域:由直觀分析先確定拒絕的形式,然后由顯著水平 a 及 Z 的 分布 P 確定拒絕域的臨界值,進而確定拒絕域 C ( 4 )根據具體的一次樣本值做出推斷 3. 具體算法:

       假設 X 1 ,X 2 , X n1 是來自總體 X ~ N( 1 , 1 2 )

       的樣本, Y,Y 2 , Y n2 是來自總體 Y~N( 2 , ; )

       的樣本,且兩樣本獨立,其檢驗問題有:

       雙邊檢驗:

       H 。

      ?。?/p>

       1 2 , H 1 : 1 2 單邊檢驗 I H 。

      ?。?/p>

       1 2 , H 1 : 1 2

       單邊檢驗 “ H ° : 1 2 , H 「 1 2

       則認為 H 。

       不成立, 四、實驗環境(所用軟件、硬件等)及實驗數據文件 見實驗內容 軟件:

       R2.15.3 R 軟件。

       五、實驗結果及實例分析 > a <- c(126,125,136,128,123,138,142,116,110,108,115,140) > b <- c(162,172,177,170,175,152,157,159,160,162) ###正態性檢驗:

       > ks.test(a,"p no rm",mea n( a),sd(a)) On e-sample Kolmogorov-Smir nov test data: a D = 0.1464, p-value = 0.9266 alter native hypothesis: two-sided > ks.test(b,"p no rm",mea n( b),sd(b)) On e-sample Kolmogorov-Smir nov test data: b D = 0.2222, p-value = 0.707 alter native hypothesis: two-sided ####方差齊性檢驗:

       > var.test(a,b)方差 i 2

       2 未知, S 2 和 S ; 分別是 X 和 丫 的樣本方差。由統計知識可知,當 H 。

       為真時, T 亠 1 L 其中 悶需

       ~t( n i n 2 2) n 1

       1 ) s :

       (n 2

       1)S ; n 2

       n 1

       n 2

       2 因此,當 T 滿足(成為拒絕域):

       t (n i 2 雙邊檢驗: n 2 2) 單邊檢驗 I t (m n 2 2) 單邊檢驗 II t ( n i n 2 2) 此方法也稱為 t 檢驗法。

       教師簽名 年 月曰

        F test to compare two varia nces data: a and b F = 1.9646, num df = 11, denom df = 9, p-value = 0.32 alter native hypothesis: true ratio of varia nces is not equal to 1 95 perce nt con fide nee in terval: 0.5021943 7.0488630 sample estimates: ratio of varia nces 1.964622 ####可認為 a 和 b 的方差相同。

       ####選用方差相同模型 t 檢驗:

       > t.test(a,b,var.equal=TRUE) Two Sample t-test data: a and b t = -8.8148, df = 20, p-value = 2.524e-08 alter native hypothesis: true differe nce in means is not equal to 0 95 perce nt con fide nce in terval: -48.24975 -29.78358 sample estimates: mean of x mean of y 125.5833 164.6000 p-value = 2.524e-08<0.05,因而認為兩者有顯著差別。

       開課學院、實驗室:

       數學與統計學院 實驗時間 :2013 年 月 日 實驗項目 名 稱 回歸分析 實驗項目類型 驗證 演示 綜合 設計 其他 指導 教師 張應應 成 績

       一、 實驗目的 1. 掌握回歸分析的原理以及在 R 軟件上的使用 2. 掌握回歸診斷在 R 軟件上的使用 3. 掌握回歸診斷的原理 二、 實驗內容 為了估計山上積雪融化后對下游灌溉的影響, 在山上建立一個 觀測站,測量最大面積積雪深度 X 與當年 灌溉面積 Y,測得連續 10 年的數據 10 年中最大積雪深度與當年灌溉面積的數據 年序 X/m Y/hm A 2 序號 X/m Y/hmA2 1 5.1 1907 6 7.8 3000 2 3.5 1287 7 4.5 1947 3 7.1 2700 8 5.6 2273 4 6.2 2373 9 8.0 3113 5 8.8 3260 10 6.4 2493 1•試畫相應的散點圖,判斷 Y 與 X 是否有線性關系

       2•求出 Y 關于 X 的一元線性回歸方程; 3. 對方程做顯著性分析; 4• 先測得今年的數據是 X=7m ,給出今年灌溉面積的預測值和相應的區間估計( a =0.05 )

       三、 實驗原理、方法(算法)、步驟 回歸分析研究的主要問題是:

       1. 確定 丫 與 X1 , X2....Xp 間的定量關系表達式,即回歸方程 2. 對求得的回歸方程的可信度進行檢驗 3. 判斷自變量 Xj(j=1,2,...p)

       對 丫 有無影響 4. 利用所求的的回歸方程進行預測和控制,在比較嚴密的分析中,一般不輕易剔除變量, 而是對顯著差異變量進行分析。

       四、 實驗環境(所用軟件、硬件等)及實驗數據文件 軟件:

       R 2.15.3 數據見實驗內容 五、實驗結果及實例分析

       教師簽名 年 月曰

        ####輸入數據并運行得:

       x<-c(5.1,3.5,7.1,6.2,8.8,7.8,4.5,5.6,8.0,6.4) y<-c(1907,1287,2700,2373,3260,3000,1947,2273,3113,2493) plot(x,y)

        分析結果:由散點圖可得 x,y 線性相關 lm.sol<-lm(y~1+x) summary(lm.sol) Call: lm(formula = y ~ 1 + x) Residuals: Min 1Q Media n 3Q Max -128.591 -70.978 -3.727 49.263 167.228 Coefficie nts: Estimate Std. Error t value Pr(>|t|) (In tercept) 140.95 125.11 1.127 0.293

        x 364.18 19.26 18.908 6.33e-08 ***

        Sign if. codes: 0 ‘ *** "0.00** "0.01 "* " 0.05 "."0.1 ‘ "1

       Residual sta ndard error: 96.42 on 8 degrees of freedom Multiple R-squared: 0.9781, Adjusted R-squared: 0.9754 F-statistic: 357.5 on 1 and 8 DF, p-value: 6.33e-08 分析結果:由上述結果可得 y 關于 x 的一元線性回歸方程為 y=140.95+364.18x ; 并由 F 檢驗和 t 檢驗,可得回歸方程通過了回歸方程的顯著性檢驗 ####對數據進行預測,并且給相應的區間估計 n ew<-data.frame(x=7) lm.pred<-predict(lm.sol, new,i nterval="predictio n",level=0.95) lm.pred fit lwr upr 1 2690.227 2454.971 2925.484 分析結果:預測值為 2690.227,估計區間為[2454.971 ,2925.484]

       開課學院、實驗室:數學與統計 實驗時間 :2013 年 04 月 20 日 實驗項目 判別分析 實驗項目類型 名 稱 驗證 演示 綜合 設計 其他 指導 教師 張應應 成 績

        一、 實驗目的 1. 在已知樣本有多少類的情況下對樣本進行分類; 2• 熟悉 R 軟件的各種操作; 3. 利用 R 軟件進行各種方式的判別分析。

       二、 實驗內容 根據經驗 今天與昨天的溫度差 X1 及今天的壓溫差(氣壓與溫度之差) X2 是預報明天下雨 或不下雨的兩個重要因素?,F有一批已收集的數據資料,如表所示,金測得 x1=8.1 , x2=2.0 試問預報明天下雨還是預報明天不下雨?分別用距離判別、 Bayes 判別、(考慮方差相同與方 差不同兩種情況)和 Fisher 判別來得到你所需要的結論 表 8.7. 三、 實驗原理、方法(算法)、步驟 距離判別法:

       W ( x )

       ( X X ⑵) T

       2 ( x x( 2 ) ) (x

       X ⑴ ) T

       Bayes 判別法:. 1 T 1 T 1 W(x) -(x 2 ) T

       2

       (x 2 ) (x J T

       1

       (x 2 2 1

       Fisher 判別法:

       W(x) d T S 1 (x x) 四、 實驗環境(所用軟件、硬件等)及實驗數據文件 實驗數據見實驗內容 軟件:

       R2.15.1 五、 實驗結果及實例分析:

       ## 距離判別 classX1=data.frame( x1=c(-1.9,-6.9,5.2,5.0,7.3,6.8,0.9,-12.5,1.5,3.8), x2=c(3.2,10.4,2.0,2.5,0.0,12.7,-15.4,-2.5,1.3,6.8) ) classX2=data.frame( x1=c(0.2,-0.1,0.4,2.7,2.1,-4.6,-1.7,-2.6,2.6,-2.8). 具體數據見統計建模與 R 軟件 P420 1

       (1) 2 ( X X ) ,判斷其值是否大于 0. J ,判斷值與 的關系;

       x2=c(0.2,7.5,14.6,8.3,0.8,4.3,10.9,13.1,12.8,10.0) ) TstX=data.frame( x1=c(8.1), x2=c(2.0) ) ## 對訓練樣本的回代情況 ## var.equal=T :有 4 個錯判,錯判率為 4/20=0.2 ## var.equal=F: 有 5 個錯判,錯判率為 5/20=0.25 source("discrimi nian t.dista nce.R") discrimi nian t.dista nce(classX1,classX2,var.equal=T) discrimi nian t.dista nce(classX1,classX2,var.equal=F) ## 對測試樣本進行判別:均判為第 1 組 discrimi nian t.dista nce(classX1,classX2,TstX,var.equal=T) discrimi nian t.dista nce(classX1,classX2,TstX,var.equal=F) ## Bayes ## TrnX1, TrnX2 以矩陣的形式輸入 TrnX1=matrix( c(-1.9,-6.9,5.2,5.0,7.3,6.8,0.9,-12.5,1.5,3.8, 3.2,10.4,2.0,2.5,0.0,12.7,-15.4,-2.5,1.3,6.8), n col=2) Trn X2=matrix( c(0.2,-0.1,0.4,2.7,2.1,-4.6,-1.7,-2.6,2.6,-2.8, 0.2,7.5,14.6,8.3,0.8,4.3,10.9,13.1,12.8,10.0), n col=2) TstX=data.frame( x1=c(8.1), x2=c(2.0)

       教師簽名 年 月曰

        ## 對訓練樣本的回代情況 ## var.equal=T :有 4 個錯判,錯判率為 4/20=0.2 ## var.equal=F: 有 5 個錯判,錯判率為 5/20=0.25 source("discrim inian t.bayes.R") discrimi nian t.bayes(TrnX1,TrnX2,rate=1,var.equal=T) discrimi nian t.bayes(TrnX1,TrnX2,rate=1,var.equal=F) ## 對測試樣本進行判別:均判為第 1 組 discrimi nia nt.bayes(TrnX1,TrnX2,rate=1,TstX,var.equal=T) discrimi nia nt.bayes(TrnX1,TrnX2,rate=1,TstX,var.equal=F) discrimi nia nt.bayes(classX1,classX2,rate=1,TstX,var.equal=T) discrimi nian t.bayes(classX1,classX2,rate=1,TstX,var.equal=F) ## Fisher ## 對訓練樣本的回代情況 ## 有 4 個錯判,錯判率為 4/20=0.2 source("discrimi nia nt.fisher.R") discrimi nian t.fisher(classX1,classX2) ## 對測試樣本進行判別:判為第 1 組 discrimi nian t.fisher(classX1,classX2,TstX) ## 三種方法均預報明天下雨 colMea ns(classX1) colMea ns(classX2) x1 x2 -0.38 8.25

       開課學院、實驗室:

       數學與統計學院 實驗時間 :2013 年 4 月 日 實驗項目 主成分分析 實驗項目類型 名 稱 驗證 演示 綜合 設計 其他 指導 教師 張應應 成 績

        一、 實驗目的 1. 掌握利用主成分分析的理論思想,將多指標化為少數幾個綜合的指標; 2. 熟練應用 R 軟件來進行主成分分析; 3. 利用主成分分析的結果對具體問題作出合理的解釋分析。

       二、 實驗內容 用主成分法探討城市工業主體,表格里是某市工業部門 13 個行業,分別是冶金,電力,煤 炭,化學,機械,建材,食品,森工,紡織,縫紉,皮革,造紙,文教藝術品, 8 個指標, 分別是年末固定資產凈值 X1 ,職工人數 X2 ,工業總產值 X3 ,全員勞動生產率 X4 ,百元固 定原值實現產值 X5 ,資金利稅率 X6 ,標準燃料消費量 X7, 和能源利用開發效果 X8. 的數據。

       見統計建模與 R 軟件 P475 表 9.7 (1) 利用主成分分析方法分析確定 8 個指標的幾個主成分,并對主成分進行解釋; (2) 利用主成分得分對 13 個行業內進行排序和分類。

       三、 實驗原理、方法(算法)、步驟 基本原理:

       主成分分析是數學上對數據降維的一種方法。其基本思想是設法將原來眾多的具有一定相關 性的指標 X1 , X2, …, XP (比如 p 個指標),重新組合成一組較少個數的互不相關的綜合指 標 Fm 來代替原來指標。

       計算步驟:

       (1) 計算協方差矩陣; (2) 求出工的特征值 i 入及相應的正交化單位特征向量; (3) 選擇主成分; (4) 選擇主成分; (5) 選擇主成分 . 四、 實驗環境(所用軟件、硬件等)及實驗數據文件 數據見實驗內容 R 2.15.3

       五、 實驗結果及實例分析

       (1)利用主成分確定了 8 個指標的主成分,有 4 個,即主成分碎石圖所示 > in dustry<-data.frame( +X1=c(90342,4903,6735,49454,139190,12215,2372,11062,17111,1206,2150,5251,14341), +X2=c(52455,1973,21139,36241,203505,16219,6572,23078,23907,3930,5704,6155,13203), +X3=c(101091,2035,3767,81557,215898,10351,8103,54935,52108,6126,6200,10383,19396), +X4=c(19272,10313,1780,22504,10609,6382,12329,23804,21796,15586,10870,16875,14691), + X5=c(82.0,34.2,36.1,98.1,93.2,62.5,184.4,370.4,221.5,330.4,184.2,146.4,94.6), + X6=c(16.1,7.1,8.2,25.9,12.6,8.7,22.2,41.0,21.5,29.5,12.0,27.5,17.8), +X7=c(197435,592077,726396,348226,139572,145818,20921,65486,63806,1840,8913,78796,6354), +X8=c(0.172,0.003,0.003,0.985,0.628,0.066,0.152,0.263,0.276,0.437,0.274,0.151,1.574)) > in dustry.pr<-pri ncomp(i ndustry,cor=T) > summary(industry.pr) ####做主成分分析,得到 4 個主成分,累積貢獻率達 94.68% Importa nee of comp onen ts: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Stan dard deviation 1.7620762 1.7021873 0.9644768 0.80132532 0.55143824 Proportion of Variance 0.3881141 0.3621802 0.1162769 0.08026528 0.03801052 Cumulative Proportion 0.3881141 0.7502943 0.8665712 0.94683649 0.98484701 Comp.6 Comp.7 Comp.8 Stan dard deviation 0.29427497 0.179400062 0.0494143207 Proportion of Variance 0.01082472 0.004023048 0.0003052219 Cumulative Proportion 0.99567173 0.999694778 1.0000000000 > load<-loadi ngs(i ndustry.pr) #### 求出載荷矩陣 > load Loadi ngs: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8

       X1 -0.477 -0.296 -0.104 0.184 0.758 0.245 X2 -0.473 -0.278 -0.163 -0.174 -0.305 -0.518 0.527 X3 -0.424 -0.378 -0.156 -0.174 -0.781 X4 0.213 -0.451 0.516 0.539 0.288 -0.249 0.220 X5 0.388 -0.331 -0.321 -0.199 -0.450 0.582 0.233 X6 0.352 -0.403 -0.145 0.279 -0.317 -0.714 X7 -0.215 0.377 -0.140 0.758 -0.418 0.194 X8 -0.273 0.891 -0.322 0.122 SS loadi ngs 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 Proporti on Var 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 Cumulative Var 0.125 0.250 0.375 0.500 0.625 0.750 0.875 1.000

       > plot(load[,1:2]) > text(load[,1],load[,2],adj=c(-0.4,-0.3)) > screeplot(i ndustry.pr, npcs=4,type="li nes") #### 得出主成分的碎石圖 Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8

        LB -0.1 -0.2 0.U 0.2 0.4 Comp 1 > p<-predict(industry.pr) ####預測數據,講預測值放入 p 中 > order(p[,1]);order(p[,2]);order(p[,3]);order(p[,4]); ####將預測值分別以第一,第二,第三,第四主成分進行排序 [1] 5 1 3 2 4 6 13 11 9 7 12 10 8 [1] 5 8 4 910 1 13 12 7 11 6 2 3 [1] 8 1 5 3 9 12 7 10 2 6 11 4 13 [1] 11 6 5 7 10 13 12 9 1 8 3 2 4 > kmeans(scale(p),4)

       ####將預測值進行標準化,并分為 4 類 Industry ,pr > biplot(i ndustry.pr) ####得出在第一,第二主成分之下的散點圖 賈 * 2 S 口O O Comp 1 Comp .3 Gornp.G Comp 7 9 1 /.I g

       教師簽名 年 月曰

        K-means clustering with 4 clusters of sizes 5, 1,4, 3 Cluster means: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 1 0.5132590 -0.03438438 -0.3405983 -0.5130031 0.2355151 0.22441040 2 -2.5699693 -1.32913757 -0.4848689 -0.9460127 -0.9000187 -0.06497950 3 0.2381581 0.72871986 -0.2995918 0.3126036 -0.4744091 -0.19709710 4 -0.3163193 -0.47127333 1.1287426 0.7535380 0.5400265 -0.08956137 Comp.7 Comp.8 1 -0.38197798 -0.7474855 2 -0.67500209 0.4569548 3 0.09063069 0.9826915 4 0.74078975 -0.2167643 Clusteri ng vector: [1] 4 3 3 4 2 1 1 1 1 3 1 3 4 With in cluster sum of squares by cluster: [1] 19.41137 0.00000 24.49504 16.61172 (between_SS / total_SS = 37.0 %)

       Available comp onen ts: [1] "cluster" "cen ters" "totss" "withi nss" "tot.withi nss" ⑹ "betwee nss" "size" #######用 order ()分別對 4 個主成分的預測值進行排序,結果是如下表( 26),而利用 kmeans ()進行動態排序得到如下分類:

       第 1 類:建材(6),森工(7),食品(8),紡織(9),皮革(11); 第 2 類:機械(5); 第 3 類:電力(2),煤炭(3),縫紉(10)造紙(12); 第 4 類:冶金(1)化學(4),文教藝術用品(13 )。

       成分 13 個行業排序結果 第一主成分:: 5 1 3 2 4 6 13 11 9 7 12 10 8 第二主成分:

       5 8 4 9 10 1 13 12 7 11 6 2 3 第三主成分:

       8 1 5 3 9 12 7 10 2 6 11 4 13 第四主成分:

       11 6 5 7 10 13 12 9 1 8 3 2 4 表(26)各行業按主成分得分進行排序結果

      国产另类无码专区|日本教师强伦姧在线观|看纯日姘一级毛片|91久久夜色精品国产按摩|337p日本欧洲亚洲大胆精

      <ol id="ebnk9"></ol>