證券分析師考試復(fù)習(xí)知識(shí)點(diǎn)匯總【第四章】

2020-03-09 15:34:36        來(lái)源:網(wǎng)絡(luò)

  第四章 數(shù)理方法

  第一部分 概率基礎(chǔ)

  一、概率與隨機(jī)變量的含義、計(jì)算和原理

  1、事件和概率

  隨機(jī)試驗(yàn):進(jìn)行試驗(yàn)時(shí),會(huì)出現(xiàn)什么結(jié)果,是不確定的。

http://images.51zhishang.com/2019/1015/20191015095416690.gif2020證券從業(yè)資格考試備考通關(guān)秘籍 點(diǎn)擊下載>>

http://images.51zhishang.com/2019/1015/20191015095416171.jpg

部分資料預(yù)覽 

http://images.51zhishang.com/2019/1015/20191015095418142.png

  樣本點(diǎn):每一種可能的結(jié)果。

  樣本空間:全體樣本點(diǎn)集合。

  (撲克牌數(shù)字、花色)

  事件:樣本空間(可測(cè))子集。

  2、集合、事件與概率

  概率:對(duì)某個(gè)事件發(fā)生可能性的度量。

  最基礎(chǔ)的事件運(yùn)算:子事件、事件并(和)、事件交(積)、事件補(bǔ)(余事件)。

  (1)概率主觀定義。依據(jù)各自的經(jīng)驗(yàn)和自信,對(duì)于事件A發(fā)生的可能性有不同的看法,分別給出的估計(jì)概率。

  (2)概率的公理化定義。

  樣本空間s上的概率測(cè)度P滿足以下概率公理:

 ?、賹?duì)于任意的事件A 屬于S,0≤P(A)≤1,表示一個(gè)事件的概率必定在0和1之間;

 ?、赑(S)=1,表示樣本空間s包含所有可能的結(jié)果,事件s的概率應(yīng)該為1;

  ③如果對(duì)于任意的i≠j,Ai∩Aj=Φ(空集)

  那么P(A1 ∪A2∪…)=P(A1)+ P(A2)+…,表示如果事件A和事件B不相交,那么它們并集的概率等于兩個(gè)事件概率和。(和的概率等于概率之和)

  3、條件概率與事件獨(dú)立。

  在給定事件B已經(jīng)發(fā)生的條件下事件A發(fā)生的概率記為P(A / B)。

  如果說(shuō)事件A和事件B是相互獨(dú)立的,則

  P(A/B)=P(A),表示事件B的發(fā)生對(duì)事件A發(fā)生的機(jī)會(huì)不產(chǎn)生任何影響。

  如果P(A∩B)=P(A/B)P(B)=P(A)P(B),我們說(shuō)事件A和事件B是相互獨(dú)立的。否則,我們說(shuō)事件A和事件B是相互依賴的。

  例題:考慮擲骰子的試驗(yàn)。樣本空間S是六個(gè)樣本點(diǎn),出現(xiàn)點(diǎn)數(shù)為1的概率,記為集合A={1},則P(A)=1/6。但是,如果考慮奇數(shù)點(diǎn)出現(xiàn)的條件下點(diǎn)數(shù)1出現(xiàn)的概率,則在給定信息影響下,使得樣本空間從S={1,2,3,4,5,6}縮小到B={1,3,5},此條件概率記為P(A丨B)=1/3。

  4、隨機(jī)變量和概率分布

  隨機(jī)變量:是從樣本空間到實(shí)數(shù)集的一個(gè)函數(shù),一般用大寫(xiě)字母表示,它的取值用小寫(xiě)字母表示。(取值隨機(jī)會(huì)而定的變量)

  (1)離散隨機(jī)變量及其概率分布函數(shù)。設(shè)隨機(jī)變量X取值為有限個(gè)或者可數(shù)多個(gè)值,則:

  P(X=xi)=pi i=i,2,…,n

  稱為隨機(jī)變量X的(概率)分布。

  (2)連續(xù)隨機(jī)變量與概率密度函數(shù)。

  概率分布函數(shù):隨機(jī)變量取值范圍在一個(gè)區(qū)間或者整個(gè)實(shí)數(shù)軸。

  設(shè)X是隨機(jī)變量,其值小于等于x的事件{X≤x}發(fā)生概率用F(x)表示,我們稱F(x)=P(X≤x)為隨機(jī)變量X的分布函數(shù)。某個(gè)連續(xù)的隨機(jī)變量X的概率密度函數(shù)滿足的三條性質(zhì):

  1)對(duì)于所有的x∈R,有f(x)≥0;

  5、常用分布。在金融模型中,常見(jiàn)的分布包括二項(xiàng)分布、正態(tài)分布、對(duì)數(shù)正態(tài)分布、t分布和F分布。

  (1)二項(xiàng)式分布。B(n,P)。其中n和P是兩個(gè)參數(shù), n是正整數(shù),0≤p≤1。

  考慮一個(gè)僅有兩個(gè)結(jié)果的試驗(yàn),比如價(jià)格上漲或下跌,隨機(jī)變量X的值為0或1。隨機(jī)變量X服從貝努利分布的假設(shè)為 P(X=1)=p,P(X=0)=1-p,這里0≤p≤1

  如果X1,X2,...,Xn是相互獨(dú)立,且服從貝努利分布,那么是一個(gè)取值為0,1,2,…,n的離散的隨機(jī)變量。

  6、隨機(jī)變量的數(shù)字特征(隨機(jī)變量的矩)

  (1)數(shù)學(xué)期望。一般地,如果X是一個(gè)離散的隨機(jī)變量,它的分布為

  P(X=xi)=pi,i=1,2,…n…,它的期望值為

  即是X的期望值是它的所有可能的取值的加權(quán)平均,其權(quán)數(shù)是它取該值的概率。

  (3)方差(二階中心距)與標(biāo)準(zhǔn)差。

  如果r=2,E[(X-μ)2]被稱為X的分布的方差或 x的方差。常常記它為σ2或var(X)。

  σ2的正平方根σ被稱為x的標(biāo)準(zhǔn)差,反映了隨機(jī)變量波動(dòng)程度的量(衡量風(fēng)險(xiǎn)的大小)。關(guān)于方差,常用公式:

  (4)偏度與峰度。

  1)偏度。使用3階中心矩度量X關(guān)于其均值的對(duì)稱性衡量分布是否有偏(用來(lái)描述隨機(jī)變量的對(duì)稱程度)

  如果X的概率密度函數(shù)關(guān)于期望值是對(duì)稱的,比如正態(tài)分布,μ3=E[X—E(X)]3=0是無(wú)偏的 ,對(duì)于u3>0,說(shuō)明分布是正偏或者右偏,反之為負(fù)偏或者左偏。

  偏度系數(shù):

  負(fù)的偏度系數(shù),揭示了分布有很長(zhǎng)的左尾(概率),反映了出現(xiàn)大負(fù)值的概率高。如果組合資產(chǎn)的收益率分布是負(fù)(左)偏的,則出現(xiàn)巨額損失的概率增加。

  2)峰度

  常使用4階中心矩用于度量X的尾部特性,也衡量分布在均值附近的陡峭程度,如果x取值在概率上集中在均值附近,則u4 將傾向于小,否則就傾向于大。

  峰度系數(shù)為β2=u4/u22

  超額峰度 =β2-3

  正態(tài)分布的峰度=3

  正態(tài)隨機(jī)變量的超額峰度=0。

  厚尾:分布有正的超額峰度(峰度>3),意味著來(lái)自于這樣一個(gè)分布的隨機(jī)樣本會(huì)有更多的極端值,故稱這樣的分布為尖峰的。

  輕尾:具有負(fù)的超額峰度的分布(峰度<3),也稱為低峰的。

  (5)契比雪夫定理(不等式)。

  隨機(jī)變量和它的均值的差的絕對(duì)值超過(guò)它的標(biāo)準(zhǔn)差K倍的概率小于1/K2

  該定理給出了任一隨機(jī)變量取值的界限。在判斷程序化投機(jī)(趨勢(shì))交易或者價(jià)差(套利)交易中觸發(fā)條件的發(fā)生概率較為有效。

  例題:下列關(guān)于正態(tài)分布的結(jié)論哪個(gè)是不正確的?

  A.峰度為3.

  B.偏度為1.

  C.整個(gè)分布特性可由均值和方差描述。

  D.正態(tài)分布的密度函數(shù)表示如下:

  答案:B

  二、多元分布函數(shù)及其數(shù)字特征

  (用于分析組合資產(chǎn)的收益率)

  1、 多元分布函數(shù)

  聯(lián)合累計(jì)分布函數(shù):

  X和Y是相互獨(dú)立的,當(dāng)且僅當(dāng):f(x,y)=g(x)h(y)

  2、多元分布函數(shù)的數(shù)字特征

  (1)協(xié)方差。(X,Y的二階混合中心距)

  σXY,或COV(X,Y)

  σXY=E[(X-EX)(Y-EY)]=E[XY]-E[X]E[Y]

  是XY之間相關(guān)性的一個(gè)測(cè)度。如果X和Y是相互獨(dú)立的,那么cov(X,Y)=0。

  (2)相關(guān)關(guān)系。

  PXY的取值一定在-1和1之間。如果X和Y是相互獨(dú)立的,那么PXY=0。相關(guān)系數(shù)是在計(jì)量經(jīng)濟(jì)學(xué)中使用回歸分析技術(shù)時(shí)必須使用的工具。

  (3)協(xié)方差矩陣。

  描述多元隨機(jī)變量。一個(gè)隨機(jī)向量的期望值等于它的各個(gè)分量的期望值組成的向量。

  隨機(jī)向量X的協(xié)方差矩陣如下:

  例題:給定隨機(jī)變量X、Y,常數(shù)a、b、c、d,下列哪個(gè)結(jié)論是錯(cuò)誤的。

  A.若x和Y是相關(guān)的,則E(ax+by+c)=aE(x)+bE(y)+c

  B.若x和Y是相關(guān)的,則Var(ax+by+c)=Var(ax+by)+c

  C.若x和Y是相關(guān)的,則Cov(ax+by,cx+dy)=acVar(X)+bdVar(Y)+(ad+bc)Cov(x,Y)

  D.若x和Y是不相關(guān)的,則Var(x-y)=Var(x+y)

  =Var(x)+Var(y)

  答案:B Var(ax+by+c)=Var(ax十by)= 2a Var(x)+ 2b VAR(y)+ 2ab Cov(x,y)。

  解析:

  Var(x+y)=Var(x)+Var(y)+2Cov(x,y)

  Var(x-y)=Var(x)+Var(y)-2Cov(x,y)

  x和Y是不相關(guān)的,Cov(x,y)=0,所以兩者相等。

  三、隨機(jī)變量的函數(shù)

  1、隨機(jī)變量的線性組合。

  對(duì)于以人民幣計(jì)價(jià)的投資組合中現(xiàn)金為1 000萬(wàn)元,組合中美元資產(chǎn)為1 000萬(wàn)美元,美元匯率為X,其均值為0.01,標(biāo)準(zhǔn)差為0.001,這個(gè)組合可以被表示為Y=a+bX,其期望、方差和標(biāo)準(zhǔn)差分別為:

  E(a+bX)=a+bE(X),

  var(a+bX)=b2var(X),

  y的均值:E(Y)=E(1+1 000X)

  =1+1 000×0.01=11

  y的標(biāo)準(zhǔn)差=1 000×0.001=1

  隨機(jī)變量線性組合的方差:

  2、隨機(jī)變量的加權(quán)和

  如果a'=(a1, a2,..., an)是常數(shù)向量,那么有:

  如果a是資產(chǎn)組合的權(quán)重,μ是資產(chǎn)組合收益率,σ是資產(chǎn)組合波動(dòng)率,上述結(jié)果就是資產(chǎn)組合收益率的期望和方差的計(jì)算公式,可用于計(jì)算組合風(fēng)險(xiǎn)價(jià)值。

  3、隨機(jī)變量的積

  隨機(jī)變量乘積Y=X1Y2,其期望為:

  E(X1X2)=E(X1)E(X2)+Cov(X1,X2)

  當(dāng)這些變量相互獨(dú)立時(shí),乘積期望就是均值的積。

  4、隨機(jī)變量變換(函數(shù))的分布。

  假設(shè)X是一個(gè)連續(xù)隨機(jī)變量,概率密度函數(shù)為f(x),g(x)是一個(gè)單調(diào)函數(shù),那么Y=g(X)是一個(gè)新的隨機(jī)變量。我們把x表述成y的函數(shù)為X=W(y),那么y的概率密度函數(shù) h(y)為:

  四、對(duì)數(shù)正態(tài)分布等統(tǒng)計(jì)分布的特征和計(jì)算

  (用于進(jìn)行高頻金融數(shù)據(jù)的分析)

  1、對(duì)數(shù)正態(tài)分布與三大統(tǒng)計(jì)分布

  (1)對(duì)數(shù)正態(tài)分布。 (期權(quán)定價(jià)模型)

  如果一個(gè)隨機(jī)變量x的對(duì)數(shù)形式Y(jié)=ln(X)是正態(tài)分布,則可以稱這一變量服從對(duì)數(shù)正態(tài)分布。

  如果資產(chǎn)的對(duì)數(shù)收益率是獨(dú)立同分布,且都正態(tài)分布,那么在此假定下,簡(jiǎn)單收益率是獨(dú)立同分布的對(duì)數(shù)正態(tài)分布的隨機(jī)變量,均值和方差分別為:

  反之,假設(shè)簡(jiǎn)單收益率Rt服從對(duì)數(shù)正態(tài)分布,均值為m1,方差為m2,則對(duì)應(yīng)的對(duì)數(shù)收益率rt的均值和方差分別為:

  (2)卡方(χ2)分布。

  一個(gè)標(biāo)準(zhǔn)正態(tài)隨機(jī)變量的平方服從自由度為1的χ2分布。即如果Z~N(0,1),那么Z2~ χ2(1)。如果Z1,Z2,…,Zn是相互獨(dú)立的標(biāo)準(zhǔn)正態(tài)分布,那么

  F的概率密度函數(shù)可通過(guò)變量替換方法得到,它是非負(fù)的,且偏向右邊凸起。

  例題:有著相同均值和標(biāo)準(zhǔn)差的正態(tài)分布和t分布,下列哪個(gè)結(jié)論正確?

  A.它們有著相同的峰度

  B.t分布有著更大的峰度

  C.隨著自由度增加,t分布的峰度逐漸收斂到正態(tài)分布峰度

  D.當(dāng)自由度相對(duì)較小的時(shí)候,對(duì)t分布而言,正態(tài)分布是一個(gè)較好的近似估計(jì)

  答案:C

  2、尾概率分布特點(diǎn)

  極值理論(EVT)——x超過(guò)某個(gè)閥值點(diǎn)U的極限分布服從以下分布族:

  F(y)=1-exp(-y),ξ=0

  當(dāng)y=(x-u)/β時(shí)。簡(jiǎn)單而言就是通過(guò)刻度(Scale)參數(shù)β和形狀(Shape)參數(shù)ξ確定,其中參數(shù)ξ決定了尾概率中尾巴趨于零(消失)的速度。

  正態(tài)分布對(duì)應(yīng)于ξ=0,則尾巴概率以指數(shù)速度消失(趨于0)。但是,經(jīng)典的金融數(shù)據(jù),基本都有ξ>0,這就是著名的厚尾(肥尾或者重尾)現(xiàn)象。

  極值理論在風(fēng)險(xiǎn)管理(即VaR,Value at Risk 風(fēng)險(xiǎn)價(jià)值)中具有非常重要的影響。

  第二部分 統(tǒng)計(jì)基礎(chǔ)

  統(tǒng)計(jì)推斷問(wèn)題:由總體抽取一個(gè)樣本(樣本大小為n)來(lái)推知總體的某一性質(zhì)。

  a、可信度:有多大把握說(shuō)明統(tǒng)計(jì)推斷結(jié)論

  b、精度:在區(qū)間估計(jì)中可信度依賴區(qū)間的長(zhǎng)度

  影響統(tǒng)計(jì)推斷的基本因素包括:樣本大小、總體的波動(dòng)規(guī)律(分布)、我們希望的可靠程度(置信水平)。

  五、總體、樣本和統(tǒng)計(jì)量的含義

  1.總體與樣本

  總體(母體):研究對(duì)象的全體,稱為 X

  個(gè)體:組成總體的每個(gè)成員

  總體分布函數(shù):X的分布函數(shù)

  數(shù)理統(tǒng)計(jì)方法實(shí)質(zhì)上是由局部來(lái)推斷整體的方法,即通過(guò)一些個(gè)體的特征來(lái)推斷總體的特征。

  2.統(tǒng)計(jì)量。

  (1)樣本均值:

  用來(lái)估計(jì)總體的均值:μ

  (2)樣本方差:

  用于估計(jì)總體方差 :σ2

  六、統(tǒng)計(jì)推斷參數(shù)估計(jì)

  1、點(diǎn)估計(jì)

  使用樣本數(shù)據(jù)以及一些非樣本的先驗(yàn)信息為未知參數(shù)提供一個(gè)估計(jì)值。

  設(shè)(X1,X2,…,Xn。)是來(lái)自總體x的樣本, θ是總體的未知參數(shù),若用一個(gè)統(tǒng)計(jì)量

  點(diǎn)估計(jì)方法:矩估計(jì)和最大似然估計(jì)

  (1) 矩估計(jì)法。用樣本的各階原點(diǎn)矩去估計(jì)對(duì)應(yīng)的各階總體的原點(diǎn)矩。

  (2)最大似然估計(jì)

  最大似然估計(jì)的基本思想是:當(dāng)從模型總體中隨機(jī)抽取凡組樣本觀測(cè)值后,最合理的參數(shù)估計(jì)量應(yīng)該使得從模型中抽取該n組樣本觀測(cè)值的概率最大。

  (3)求置信區(qū)間的一般步驟:

  1)先求出θ的一個(gè)點(diǎn)估計(jì)(通常為最大似然估計(jì))

  七、統(tǒng)計(jì)推斷的假設(shè)檢驗(yàn)

  1、假設(shè)檢驗(yàn)問(wèn)題與假設(shè)檢驗(yàn)的處理思路。

  (1)假設(shè)檢驗(yàn)問(wèn)題提出。

  程序化交易的某個(gè)交易策略,選擇過(guò)去連續(xù)100天模擬交易結(jié)果,按天統(tǒng)計(jì)勝率為56%,需要判斷如下假設(shè):勝率大于50%。如果不考慮盈虧比例,是否需要采用該策略進(jìn)行真實(shí)交易?這就是一個(gè)假設(shè)檢驗(yàn)的問(wèn)題。

  基于樣本判定一個(gè)關(guān)于總體分布的理論假設(shè)是否成立就是假設(shè)檢驗(yàn)。其基本思想是當(dāng)觀察到的數(shù)據(jù)差異達(dá)到一定程度時(shí),就會(huì)反映與總體理論假設(shè)的真實(shí)差異,從而拒絕理論假設(shè)。

  如果提出一種想法(Hypotheses),我們希望檢驗(yàn)這種想法是否正確。這種想法或假設(shè)稱為“原假設(shè)”(也稱為零假設(shè)),記為H0(零表示所提想法沒(méi)有改變或沒(méi)有差別)。

  一般零假設(shè)是經(jīng)過(guò)長(zhǎng)期檢驗(yàn)被認(rèn)為是正確的,在現(xiàn)在的新情況希望檢驗(yàn)它是否仍然正確,所以H0不應(yīng)輕易被否定。

  (2)假設(shè)檢驗(yàn)基本思路。

  檢驗(yàn)統(tǒng)計(jì)量是統(tǒng)計(jì)檢驗(yàn)的重要工具,其功能在用之于構(gòu)造觀察數(shù)據(jù)與期望數(shù)之間的差異程度。

  否定論證是假設(shè)檢驗(yàn)的重要推理方法,其要旨在:先假定原假設(shè)成立,如果導(dǎo)致觀察數(shù)據(jù)的表現(xiàn)與此假定矛盾,則否定原假設(shè)。通常使用的一個(gè)準(zhǔn)則是小概率事件的實(shí)際推斷原理。

  2、兩類錯(cuò)誤概率。

  第一類錯(cuò)誤(概率)即原假設(shè)成立,而錯(cuò)誤地加以拒絕(的棄真概率);

  第二類錯(cuò)誤(概率)即原假設(shè)不成立,而錯(cuò)誤地接受它(的取偽概率)。

  在使用模型的決策會(huì)產(chǎn)生兩類錯(cuò)誤,第一類錯(cuò)誤是拒絕一個(gè)正確的模型,第二類錯(cuò)誤是接受一個(gè)錯(cuò)誤的模型。

  3、顯著水平。

  理想的檢驗(yàn)規(guī)則是使得棄真概率(a)和取偽概率(β)都很小,但是,如果樣本容量給定,犯兩類錯(cuò)誤的概率不可能同時(shí)小,通常一個(gè)減小,另一個(gè)就會(huì)增加,只有增加樣本容量,才能使他們同時(shí)減小。

  奈曼-皮爾森 (Neyman—Pearson)原則:在控制棄真概率(a)的條件下,使得取偽概率(β)盡量小,有時(shí)把原則簡(jiǎn)化為控制第一類錯(cuò)誤的概率a。

  在收集數(shù)據(jù)之前假定一個(gè)準(zhǔn)則,在原假設(shè)成立條件下,樣本落入拒絕域的概率不超過(guò)事先設(shè)定的 ,則稱該拒絕域所代表的檢驗(yàn)為顯著水平α的檢驗(yàn),而α稱為顯著水平。

  所謂顯著水平檢驗(yàn)就是控制第一類錯(cuò)誤概率的檢驗(yàn)。

  4、假設(shè)檢驗(yàn)的數(shù)學(xué)概念。

  假設(shè)檢驗(yàn)需要顯著性水平(定義的小概率),依據(jù)這個(gè)小概率,確定否定H0的空間——拒絕域,利用樣本計(jì)算的統(tǒng)計(jì)量落在了拒絕域,就說(shuō)明小概率事件發(fā)生了,這時(shí)對(duì)于H0的否決就是顯著的。

  5、假設(shè)檢驗(yàn)的基本步驟

  (1)根據(jù)實(shí)際問(wèn)題的要求,提出原假設(shè)H0,及備擇假設(shè)H1;

  (2)給定顯著性水平α以及樣本容量n;

  (3)確定檢驗(yàn)統(tǒng)計(jì)量以及拒絕域的形式;

  (4)按P值{當(dāng)H0為真拒絕H0}≤α求出拒絕域;

  (5)取樣,根據(jù)樣本觀察值作出決策,是接受H0,還是拒絕H0。

  例題:假設(shè)檢驗(yàn)在5%顯著性水平意味著(  )。

  A.P(接受H0丨H0為真)=0.05%

  B.P(接受H0丨H0為假)=0.05%

  C.P(拒絕H0丨H0為真)=0.05%

  D.P(拒絕H0丨H0為假)=0.05%

  答案:C

  例題:下面哪個(gè)關(guān)于假設(shè)檢驗(yàn)的論述是不正確的?

  A.第二類錯(cuò)誤指在原假設(shè)錯(cuò)誤時(shí),未能拒絕原假設(shè)的錯(cuò)誤

  B.假設(shè)檢驗(yàn)是依據(jù)來(lái)自某總體的樣本計(jì)算的統(tǒng)計(jì)量,推斷總體參數(shù)

  C.在其他條件相同的時(shí)候,降低犯第一類錯(cuò)誤的代價(jià)是增加犯第二類錯(cuò)誤的概率

  D.對(duì)于P值決策規(guī)則,就是說(shuō)如果p值大于顯著性水平,則拒絕原假設(shè)

  答案:D

  解析:當(dāng)所觀察到的p值低于(不高于)顯著性水平時(shí),我們可以拒絕原假設(shè)。

  第三部分 回歸分析

  在經(jīng)濟(jì)和金融分析中,經(jīng)常要對(duì)變量之間的相互關(guān)系進(jìn)行分析,回歸分析是分析變量之間關(guān)系的一種重要分析方法。

  只有一個(gè)解釋變量的線性回歸分析稱一元線性回歸分析,含有多個(gè)解釋變量的線性回歸分析稱多元線性回歸分析。

  回歸分析作為有效方法應(yīng)用在經(jīng)濟(jì)或者金融數(shù)據(jù)分析中,具體遵循以下步驟:

  第一步,模型設(shè)定;

  第二步,參數(shù)估計(jì);

  第三步,模型檢驗(yàn);

  第四步,模型應(yīng)用。

  八、一元回歸模型的含義和特征

  1、相關(guān)關(guān)系分析

  變量和變量之間通常存在兩種關(guān)系:確定性函數(shù)關(guān)系和相關(guān)關(guān)系。

  確定性函數(shù)關(guān)系表示變量之間存在一一對(duì)應(yīng)的確定關(guān)系;

  相關(guān)關(guān)系表示一個(gè)變量的取值不能由另外一個(gè)變量唯一確定,即當(dāng)變量X取某一個(gè)值時(shí),變量Y對(duì)應(yīng)的不是一個(gè)確定的值,而是對(duì)應(yīng)著某一種分布,各個(gè)觀測(cè)點(diǎn)對(duì)應(yīng)在一條直線上。

  分析兩個(gè)變量之間的相關(guān)關(guān)系,通常通過(guò)觀察變量之間的散點(diǎn)圖和求解相關(guān)系數(shù)的大小來(lái)度量變量之間線性關(guān)系的相關(guān)程度。

  補(bǔ)充知識(shí):通過(guò)散點(diǎn)圖看相關(guān)關(guān)系

  線性相關(guān):變量之間的關(guān)系近似地表現(xiàn)為一條直線

  非線性相關(guān)或者曲線相關(guān):變量之問(wèn)的關(guān)系近似地表現(xiàn)為一條曲線

  完全相關(guān):如果一個(gè)變量的取值完全依賴于另一個(gè)變量,各個(gè)觀測(cè)點(diǎn)落在一條直線上

  無(wú)相關(guān)關(guān)系:兩個(gè)變量的觀測(cè)點(diǎn)很分散,無(wú)任何規(guī)律。

  相關(guān)系數(shù)的計(jì)算公式:

  相關(guān)系數(shù)r的取值范圍為:-1≤r≤1。

  當(dāng) l r l 越接近于1時(shí),表示兩者之間的相關(guān)關(guān)系越強(qiáng);

  當(dāng) l r l 越接近于0時(shí),表示兩者之間的相關(guān)關(guān)系越弱。

  當(dāng)r>0時(shí),表示兩者之間存在正向的相關(guān)關(guān)系;

  當(dāng)r<0時(shí),表示兩者之間存在負(fù)向的相關(guān)關(guān)系;

  當(dāng)r=0時(shí),并不表示兩者之間沒(méi)有關(guān)系,而是兩者之間不存在線性關(guān)系。

  2、 一元線性回歸模型的基本假定

  yi稱為因變量或被解釋變量,xi稱為自變量或解釋變量;ui是一個(gè)隨機(jī)變量,稱為隨機(jī)(擾動(dòng))項(xiàng);a和β是兩個(gè)常數(shù),稱為回歸參數(shù);下標(biāo)i表示變量的第i個(gè)觀察值或與隨機(jī)項(xiàng)。

  4、一元線性回歸模型的檢驗(yàn)

  (一)擬合優(yōu)度

  反映回歸直線與樣本觀察值擬合程度的量,這個(gè)量就是擬合優(yōu)度,又稱樣本“可決系數(shù)”,常用R2表示。

  TSS為總離差平方和,ESS為回歸平方和,RSS為殘差平方和。顯然,在總離差平方和一定時(shí),回歸平方和越大,擬合優(yōu)度越大,映了線性回歸效果越好,說(shuō)明了回歸直線和樣本觀察值擬合程度越好。

  反之,則越差。R2的取值范圍為:0≤R2≤1,R2越接近1,擬合效果越好;R2越接近0。擬合效果越差。

  5、、一元線性回歸分析的預(yù)測(cè)

  在預(yù)測(cè)期內(nèi)自變量已知時(shí),預(yù)測(cè)因變量的值,我們稱之為無(wú)條件預(yù)測(cè),如果在預(yù)測(cè)期內(nèi)自變量未知,這時(shí)的因變量預(yù)測(cè)值就是有條件預(yù)測(cè)。

  (一)點(diǎn)預(yù)測(cè)

  設(shè)回歸模型為:yi=α+βxi+μi(i=1,2,3,…,n)。

  假定抽樣期之外的某預(yù)測(cè)期f的自變量xf已知,上述模型適用于該預(yù)測(cè)期,這時(shí)因變 yf= α+βxf+μf ,并且隨機(jī)項(xiàng)滿足基本假定。則 yf 的預(yù)測(cè)值存在兩個(gè),一個(gè)是期望值,另一個(gè)就是yf 的點(diǎn)預(yù)測(cè)值。

  2.y個(gè)別值的區(qū)間預(yù)測(cè)

  一元線性回歸時(shí)y的真實(shí)值yf的置信度為1-α的置信區(qū)間為:

  6、案例分析

  (一)分析目的

  以2015年2月2日至2015年3月16日美元指數(shù)為解釋變量(x),同期的黃金現(xiàn)貨價(jià)格(y,美元)為被解釋變量,樣本容量為31,試對(duì)其建立簡(jiǎn)單的一元線性回歸模型。

  (二)模型的設(shè)定

  1.畫(huà)散點(diǎn)圖

  首先將美元指數(shù)(x)和黃金現(xiàn)貨價(jià)格(Y)導(dǎo)入到SPSS 20.0里,然后點(diǎn)擊SPSS菜單欄中的“圖形一舊對(duì)話框一散點(diǎn)/點(diǎn)狀”,在彈出散點(diǎn)圖”對(duì)話框中,選擇“簡(jiǎn)單分布”,再點(diǎn)擊“定義”按鈕,在彈出的“簡(jiǎn)單散點(diǎn)圖”對(duì)話框中,將變量Y導(dǎo)入到“Y軸框”中,變量x導(dǎo)入到“x軸框”中,最后點(diǎn)擊“確定”按鈕,彈出圖4—1所示的散點(diǎn)圖。

  從 散點(diǎn)圖可以看出,被解釋變量Y和解釋變量x具有較為明顯的負(fù)向相關(guān)關(guān)系。進(jìn)一步,求出兩者之間的相關(guān)系數(shù)。

  2.求相關(guān)系數(shù)

  單擊菜單欄中的“分析一相關(guān)一雙變量”,在彈出的“雙變量相關(guān)”對(duì)話框中,將變量x、Y導(dǎo)人到“變量框”中,相關(guān)系數(shù)選用默認(rèn)的“Pearson相關(guān)系數(shù)”,最后點(diǎn)擊“確定”按鈕,彈出表4-1所示的結(jié)果。

  從表4-1的輸出結(jié)果可以看出,被解釋變量Y和解釋變量x之間的Pearson相關(guān)系數(shù)約為-0.843,且在1%的顯著性水平下拒絕相關(guān)系數(shù)為零的原假設(shè),表明兩者的線性關(guān)系程度高??梢詫?duì)其建立一元線性回歸分析。

  將被解釋變量Y和解釋變量x建立如下的一元線性回歸模型:

  其中,Yt和Xt分別表示被解釋變量和解釋變量,α、β表示待估計(jì)的參數(shù)。μt為隨機(jī)擾動(dòng)項(xiàng),反映了除解釋變量Xt和被解釋變量Yt之間的線性關(guān)系之外的隨機(jī)因素對(duì)被解釋變量Yt的影響,是不能由xt和Yt之間的線性關(guān)系所解釋的變異部分。

  3.參數(shù)估計(jì)

  點(diǎn)擊“分析一回歸一線性”,在彈出的“線性回歸”對(duì)話框中,將x導(dǎo)入到“自變量”框中,將變量Y導(dǎo)入到“因變量”框中,最后點(diǎn)擊 “確定”按鈕,得到如下表4-2~表4-4所示的輸出結(jié)果。

  根據(jù)上述輸出結(jié)果,得出如下參數(shù)估計(jì):

  4.模型的檢驗(yàn)

  (1)擬合優(yōu)度檢驗(yàn)。

  由表4-2可以看出,可決系數(shù)R2約等于0.711,說(shuō)明所建立的一元線性回歸模型整體上對(duì)樣本數(shù)據(jù)擬合效果較好,解釋變量“美元指數(shù)”解釋了被解釋變量“黃金現(xiàn)貨價(jià)格”變動(dòng)的71.1%。

  (2)回歸模型的預(yù)測(cè)。

  當(dāng)2015年3月17日美元指數(shù)為99.66,根據(jù)上述模型估計(jì)結(jié)果,預(yù)測(cè)2015年3月17日黃金現(xiàn)貨價(jià)格為多少美元?(把99.66帶入前面得到的回歸方程中即可。)

  九、多元線性回歸模型的含義和特征

  1、多元線性回歸模型的含義

  多元線性回歸主要用于分析影響因變量的因素中,不僅涉及一個(gè)自變量,可能涉及多個(gè)自變量。

  例如,我們?cè)诜治鲆患夜姽緝r(jià)值時(shí),需要研究其多個(gè)財(cái)務(wù)指標(biāo),比如負(fù)債比例,資產(chǎn)回報(bào)率等指標(biāo)序列(每個(gè)月指標(biāo)),這些指標(biāo)構(gòu)成公司價(jià)值(序列)的核心影響因素,我們定義公司價(jià)值(序列)為因變量時(shí),這些財(cái)務(wù)指標(biāo)(序列)就是自變量。

  多元線性回歸模型分析一個(gè)因變量和幾個(gè)自變量之間的關(guān)系。形式如下:

  yi=β0+ β1x1i+ β2x2i+…+ βkxki+ui

  其中,i=1,2,…,n;yi是x1i,x2i,…,xki 的線性部分加上隨機(jī)擾動(dòng)項(xiàng) ui; β0, β1, β2,…, βk 是參數(shù);隨機(jī)擾動(dòng)項(xiàng) ui 指的是包含在Yi中但不能被k個(gè)自變量的線性關(guān)系所解釋的變異性。

  3、多元線性回歸模型的參數(shù)估計(jì)

  關(guān)于多元線性回歸模型的參數(shù)估計(jì),我們也是利用樣本數(shù)據(jù)估計(jì)未知參數(shù),從而獲得回歸模型去推斷總體。

  同一元回歸分析模型的原理一樣,按照最小二乘準(zhǔn)則,采用使殘差平方和最小的原則去確定樣本回歸函數(shù)。

  4、多元線性回歸模型的檢驗(yàn)

  (一)擬合優(yōu)度

  對(duì)于多元線性回歸模型的擬合優(yōu)度檢驗(yàn)常采用多重可決系數(shù),記為R2。它表示總離差平方和中線性回歸解釋的部分所占的比例,即

  顯然,R2越接近于1,線性回歸模型的解釋力越強(qiáng)。

  當(dāng)利用R2來(lái)度量不同多元線性回歸模型的擬合優(yōu)度時(shí),存在一個(gè)嚴(yán)重的缺點(diǎn),R2的值隨著解釋變量的增多而增大,即便引入一個(gè)無(wú)關(guān)緊要的解釋變量,也會(huì)使得R2變大。

  (二)F檢驗(yàn)

  多元線性回歸模型的F檢驗(yàn),又稱為回歸方程的顯著性檢驗(yàn)或回歸模型的整體性檢驗(yàn),反映的是多元線性回歸模型中被解釋變量與所有解釋變量之間線性關(guān)系在總體上是否顯著。

  第一步,提出假設(shè)。設(shè)原假設(shè)H0:β1= β2=…= βk=0,備擇假設(shè)H1:βj(j=1,2,…,k)不全為零。

  第二步,構(gòu)造F統(tǒng)計(jì)量。

  即F統(tǒng)計(jì)量服從分子自由度為k,分母自由度為n-k-1的F分布。

  第三步,給定的著水平α,查分子自由度為k,分母自由度為n-k-1的F分布表,得臨界值Fa(k,n-k-1)。

  第四步,根據(jù)決策準(zhǔn)則,如果F>Fa( k,n-k-1),則拒絕H0:β1= β2=…=βk=0的原假設(shè),接受備擇假設(shè)H1:βj(j=1,2,…,k)不全為零,表明回歸方程線性關(guān)系顯著;若F

  (三)t檢驗(yàn)

  與一元線性回歸分析中的t檢驗(yàn)相同,t檢驗(yàn)有如下4個(gè)步驟:

  第一步,提出假設(shè)。設(shè)原假設(shè)H0:βj=0(j=1,2,…,k),備擇假設(shè)H1:βj≠0(j=1,2,…,k)。

  第二步,構(gòu)造t統(tǒng)計(jì)量。

  即服從自由度為n-k-1的t分布。

  第三步,給定顯著水平a,查自由度為n-k-1的t分布表,得臨界值tα/2(n-k-1)。

  第四步,根據(jù)決策準(zhǔn)則,如果|t|>ta/2(n-k-1),則拒絕H0:βj=0(j=1,2,…,k)的原假設(shè),接受備擇假設(shè)H1:βj≠0(j=1,2,…,k),表明在其他解釋變量不變的情況下,解釋變量xj對(duì)被解釋變量y的影響顯著;若|t|< ta/2(n-k-1),則不能拒絕

  H0:βj=0(j=1,2,…,k)的原假設(shè),表明在其他解釋變量不變的情況下,解釋變量xj對(duì)被解釋變量y的影響不顯著。

  5、案例分析

  (一)分析目的

  為分析紐約原油價(jià)格(WTI)、黃金ETF持倉(cāng)(噸)和美國(guó)標(biāo)準(zhǔn)普爾500指數(shù),對(duì)黃金價(jià)格的影響,收集了2004年11月21日至2013年11月24日每周末的周度數(shù)據(jù),樣本容量為471,試對(duì)其進(jìn)行多元線性回歸分析。

  (二)模型設(shè)定

  取黃金期貨價(jià)格為因變量,紐約原油價(jià)格(美元/桶)、黃金ETF持有量(噸)、美國(guó)標(biāo)準(zhǔn)普爾500指數(shù)為自變量。

  首先對(duì)變量取對(duì)數(shù),建立多元線性回歸模型為:

  其中,變量依次分別為黃金期貨價(jià)格(GOLD)(美元/盎司)、紐約原油價(jià)格(WTT)、黃金ETF持有量(噸)和美國(guó)標(biāo)準(zhǔn)普爾500指數(shù)各自取對(duì)數(shù);β0、β1、β2和β3為待估計(jì)的參數(shù);μt為隨機(jī)擾動(dòng)項(xiàng),包含在因變量中但不能被3個(gè)自變量的線性關(guān)系所解釋的變異性。

  (三)模型的估計(jì)

  同一元線性回歸分析中的SPSS操作步驟一樣,首先將變量“Ln_GOLD、Ln_WTI、Ln_ETF、Ln_SP500”數(shù)據(jù)導(dǎo)入到SPSS中,采用普通最小二乘法,最終得到如下輸出結(jié)果(見(jiàn)表4-5~表4-7)

  2.F檢驗(yàn)

  針對(duì)H0:β1=β2=β3=0,根據(jù)表4-6中的F值所對(duì)應(yīng)的Sig.值等于0.000<0.05,表明在5%的顯著性水平下拒絕原假設(shè)。

  說(shuō)明回歸方程線性關(guān)系顯著,表明“紐約原油價(jià)格”、“黃金ETF持有量”和“美國(guó)標(biāo)準(zhǔn)普爾500指數(shù)”聯(lián)合起來(lái)對(duì)“黃金期貨價(jià)格”產(chǎn)生顯著的影響。

  3.t檢驗(yàn)

  分別針對(duì)H0:βj=0(j=1,2,3),給定顯著性水平α=0.05,從表4-7中可以看出βj樣本的t統(tǒng)計(jì)量值所對(duì)應(yīng)的Sig.值均為0.000<0.05,表明在5%的顯著性水平下拒絕原假設(shè),各回歸系數(shù)均通過(guò)顯著性檢驗(yàn),

  也就是說(shuō),當(dāng)其他解釋變量保持不變的情況下,解釋變量“紐約原油價(jià)格”、“黃金ETF持有量”和“美國(guó)標(biāo)準(zhǔn)普爾500指數(shù)’,分別對(duì)被解釋變量“黃金期貨價(jià)格”均有顯著的影響。

  (五)模型的應(yīng)用

  1.回歸系數(shù)的含義

  從模型估計(jì)結(jié)果可以得出,在假定其他條件保持不變的情況下,當(dāng)紐約原油價(jià)格每提高1%時(shí),黃金價(jià)格平均提高0.193%;當(dāng)黃金ETF持有量每增加1%時(shí),黃金價(jià)格平均提高0.555%;當(dāng)美國(guó)標(biāo)準(zhǔn)普爾500指數(shù)每提高1%時(shí),黃金價(jià)格平均提高0.329%。

  2.模型的預(yù)測(cè)

  利用以上回歸模型對(duì)黃金價(jià)格做出預(yù)測(cè)。

  對(duì)于各自變量給出預(yù)測(cè)假設(shè):原油價(jià)格為50美元桶,黃金ETF持有量為700噸,美國(guó)標(biāo)準(zhǔn)普爾500指數(shù)為1 800點(diǎn),將其代入模型,得到紐約黃金價(jià)格的預(yù)測(cè)值約為990.832美元/盎司。

  十、非線性模型線性化的原理

  變量y與x之間可能不存在線性關(guān)系,有一部分可以通過(guò)變量的替換,轉(zhuǎn)化為線性的回歸模型處理。

  線性關(guān)系只是要求參數(shù)和隨機(jī)擾動(dòng)項(xiàng)是線性的,而并不要求變量之間是線性關(guān)系。

  例如:y=α+β / X+ε ,只要將z=1/x代入變換即可線性化。

  十一、回歸模型常見(jiàn)問(wèn)題和處理方法

  在經(jīng)濟(jì)和金融實(shí)務(wù)中,常常出現(xiàn)數(shù)據(jù)不能滿足線性模型的系列假定,比如隨機(jī)擾動(dòng)項(xiàng)不能滿足同方差的假定,或產(chǎn)生自相關(guān)現(xiàn)象等。為此,需要對(duì)模型遇到的該類問(wèn)題做技術(shù)處理。

  1、多重共線性

  (1)多重共線性概念與產(chǎn)生原因

  在經(jīng)典多元線性回歸模型

  yi=β0+ β1x1i+ β2x2i+… βkxki+ui

  或用矩陣表示:Y= βX+U 中,其基本假設(shè)之一是解釋變量之間不存在線性關(guān)系。

  如果解釋變量之間存在嚴(yán)格或者近似的線性關(guān)系,這就產(chǎn)生了多重共線性問(wèn)題。

  產(chǎn)生多重共線性的原因復(fù)雜,一般常見(jiàn)原因有:

  (1)經(jīng)濟(jì)變量之間有相同或者相反的變化趨勢(shì);

  (2)模型中包含有滯后變量;

  (3)從總體中取樣受到限制等。

  (2)多重共線性后果

  1)多重共線性使得參數(shù)估計(jì)值不穩(wěn)定,并對(duì)于樣本非常敏感;

  2)使得參數(shù)估計(jì)值的方差增大;

  3)由于參數(shù)估計(jì)值的方差增大,會(huì)導(dǎo)致參數(shù)估計(jì)置信區(qū)間增大,從而降低預(yù)測(cè)精度;

  4)嚴(yán)重的多重共線性發(fā)生時(shí),模型的檢驗(yàn)容易做出錯(cuò)誤的判斷。例如,參數(shù)估計(jì)方差增大,導(dǎo)致對(duì)于參數(shù)進(jìn)行顯著性t檢驗(yàn)時(shí),會(huì)增大不拒絕原假設(shè)的可能性。

  (3)多重共線性檢驗(yàn)

  1)簡(jiǎn)單相關(guān)系數(shù)檢驗(yàn)法。

  通過(guò)求出解釋變量之間的簡(jiǎn)單相關(guān)系數(shù)r作出判斷,通常情況下,若l r l接近1,則可以認(rèn)為多重共線性的程度越高。

  2)綜合統(tǒng)計(jì)檢驗(yàn)法。

  采用最小二乘原理進(jìn)行參數(shù)估計(jì)時(shí),當(dāng)出現(xiàn)可決系數(shù)R2較大,模型參數(shù)的聯(lián)合檢驗(yàn)(F檢驗(yàn))顯著性明顯,但單個(gè)參數(shù)的t檢驗(yàn)可能不顯著,甚至可能得出估計(jì)的回歸系數(shù)與實(shí)際的符號(hào)相反的結(jié)論時(shí),可以認(rèn)為模型存在多重共線性問(wèn)題。

  (4)消除多重共線性影響的方法

  1)逐步回歸法。

  以Y為被解釋變量,逐個(gè)引入解釋變量,構(gòu)成回歸模型,進(jìn)行模型估計(jì)。根據(jù)擬合優(yōu)度的變化以及結(jié)合F檢驗(yàn)和t檢驗(yàn)的顯著性決定是否保留新引入的變量。

  如果新引入了變量后使得F檢驗(yàn)和t檢驗(yàn)均顯著,并且增加了擬合優(yōu)度,則說(shuō)明新引入的變量是一個(gè)獨(dú)立解釋變量,可考慮在模型中保留該變量;

  如果新引入的變量未能明顯改進(jìn)擬合優(yōu)度值,或者F檢驗(yàn)和t檢驗(yàn)出現(xiàn)了不顯著現(xiàn)象,則說(shuō)明新引入的變量與其他變量之間存在共線性。

  使用逐步回歸法找出引起多重共線性的解釋變量,將其剔除。最后保留在模型中的解釋變量對(duì)被解釋變量具有較好的解釋作用。

  需要注意的是,逐步回歸法有可能會(huì)剔除掉重要的解釋變量從而導(dǎo)致模型產(chǎn)生設(shè)定偏誤。

  2)變換模型的形式。

  通過(guò)將原模型作適當(dāng)?shù)淖儞Q,可能會(huì)消除或減弱原模型中的解釋變量之間的相關(guān)性,例如,可以將原模型:yi=β0+ β1x1i+ β2x2i+… +βkxki+ui

  變化為差分模型:

  △yi=β1△x1i+ β2△x2i+…+βk△xki+△ui

  這樣可以有效地消除原模型中存在的多重共線性。

  3)增加樣本容量。

  多重共線性的主要后果是參數(shù)估計(jì)量具有較大的方差,所以采取適當(dāng)方法減小參數(shù)估計(jì)量的方差,雖然沒(méi)有消除模型中的多重共線性,但確能消除多重共線性造成的后果。

  增加樣本容量,可使參數(shù)估計(jì)量的方差和標(biāo)準(zhǔn)誤差減少,因此,盡可能增加樣本容量,使樣本容量遠(yuǎn)大于解釋變量的個(gè)數(shù),從而改進(jìn)模型參數(shù)的估計(jì)。

  4)嶺回歸法。

  嶺回歸(ridge regression)是一種專用于共線性數(shù)據(jù)分析的有偏估計(jì)回歸方法,實(shí)質(zhì)上是一種改良的最小二乘估計(jì)法,通過(guò)放棄最小二乘法的無(wú)偏性,以損失部分信息、降低精度為代價(jià)獲得回歸系數(shù)更為符合實(shí)際、更可靠的回歸方法,對(duì)病態(tài)數(shù)據(jù)的擬合要強(qiáng)于最小二乘法。

  散點(diǎn)圖中顯示了不同類型的異方差與同方差之間的差異。

  (2)異方差產(chǎn)生的原因

  (1)模型的設(shè)定問(wèn)題。在模型的設(shè)定過(guò)程中,省略了重要解釋變量,或者由于變量之間本為非線性關(guān)系而設(shè)定為線性關(guān)系從而導(dǎo)致異方差的產(chǎn)生。

  (2)測(cè)量誤差。由于觀測(cè)解釋變量和被解釋變量出現(xiàn)了偏誤而產(chǎn)生了異方差。

  (3)橫截面數(shù)據(jù)中各單位的差異。由于同一時(shí)點(diǎn)不同對(duì)象的差異通常會(huì)大于同一對(duì)象不同時(shí)間上的差異,因此橫截面數(shù)據(jù)比時(shí)間序列數(shù)據(jù)更容易產(chǎn)生異方差。

  (3)異方差的后果

  計(jì)量經(jīng)濟(jì)學(xué)模型一旦出現(xiàn)異方差性,如果仍采用OLS估計(jì)模型參數(shù),會(huì)產(chǎn)生下列不良后果:(1)OLS估計(jì)量仍然具有無(wú)偏性,但OLS估計(jì)的方差不再是最小的。

  (2)顯著性檢驗(yàn)失去意義。

  (3)模型的預(yù)測(cè)失效。當(dāng)模型出現(xiàn)異方差性時(shí),參數(shù)OLS估計(jì)值的變異程度增大,從而造成對(duì)被解釋變量Y的預(yù)測(cè)誤差變大,降低預(yù)測(cè)精度,預(yù)測(cè)功能失效。

  (4)異方差的檢驗(yàn)方法

  1)圖示判斷法。

  異方差的檢驗(yàn)方法很多,可以通過(guò)散點(diǎn)圖做出直觀判斷,還可以利用X-e2殘差圖判斷異方差性,看是否形成一斜率零的直線,作為判斷基礎(chǔ)。

  2)統(tǒng)計(jì)檢驗(yàn)方法。

  檢驗(yàn)異方差的方法很多,常用的方法有帕克(Park)檢驗(yàn)與戈里瑟(Gleiser)檢驗(yàn)、戈德菲爾德-匡特(Goldfeld-Quandt)檢驗(yàn)(G-Q檢驗(yàn))、懷特(White)檢驗(yàn)、ARCH檢驗(yàn)等。

  (2)異方差問(wèn)題的處理

  當(dāng)模型檢驗(yàn)出存在異方差性時(shí),常用加權(quán)最小二乘法(WLS)進(jìn)行估計(jì)。

  其基本思想為:加權(quán)最小二乘法是對(duì)原模型加權(quán),使之變成一個(gè)新的不存在異方差性的模型,然后采用OLS估計(jì)其參數(shù),現(xiàn)在常用的統(tǒng)計(jì)或者數(shù)學(xué)計(jì)算軟件均支持該算法。

  除此之外,還可以對(duì)模型進(jìn)行對(duì)數(shù)變換,即將解釋變量和被解釋變量分別取對(duì)數(shù)后,再做OLS估計(jì),這樣通常可以降低異方差性的影響。

  3、序列相關(guān)性問(wèn)題

  (1)序列相關(guān)概念及后果

  對(duì)于回歸模型Y=XB+U,基本假設(shè)之一是隨機(jī)誤差項(xiàng)互不相關(guān),如果對(duì)于不同的樣本點(diǎn),隨機(jī)誤差項(xiàng)之間存在某種相關(guān)性,則出現(xiàn)序列相關(guān)性。其他條件不變時(shí),序列相關(guān)性表示

  Cov(μi,uj)≠(i,j)。常見(jiàn)的自相關(guān)為一階自相關(guān),其表示形式為:ui=pui-1+vi,

  其中,ρ為自相關(guān)系數(shù),通常-1

  若模型出現(xiàn)序列相關(guān)性,仍采用OLS估計(jì)模型參數(shù),則會(huì)產(chǎn)生下列不良后果:

  (1)參數(shù)估計(jì)量的線性和無(wú)偏性雖不受影響,但是參數(shù)估計(jì)量失去有效性;

  (2)模型的顯著性檢驗(yàn)失去意義;

  (3)模型的預(yù)測(cè)失效。

  (2)序列相關(guān)的檢驗(yàn)

  序列相關(guān)性檢驗(yàn)方法有多種,但基本思路相同:首先采用OLS對(duì)模型做估計(jì),獲得隨機(jī)誤差項(xiàng)的估計(jì)量。再通過(guò)分析這些估計(jì)量之間的相關(guān)性,以判斷隨機(jī)誤差項(xiàng)是否具有序列相關(guān)性。

  常用的序列相關(guān)性檢驗(yàn)的方法有:圖示檢驗(yàn)法、回歸檢驗(yàn)法、杜賓 一瓦森(Durbin—Watson)檢驗(yàn)法、拉格朗日乘數(shù)(Lagrange Muhiplier)檢驗(yàn)等,

  圖示法簡(jiǎn)單,回歸檢驗(yàn)法可以滿足任何類型序列相關(guān)性檢驗(yàn),拉格朗日乘數(shù)檢驗(yàn)適用于高階序列相關(guān)以及模型中存在滯后被解釋變量的情形。但是較多使用的是杜賓一瓦森檢驗(yàn)(DW檢驗(yàn))。

  2)DW檢驗(yàn)。

  該檢驗(yàn)假設(shè)條件為解釋變量x為非隨機(jī)變量,隨機(jī)擾動(dòng)項(xiàng)滿足下述一階自回歸形式:

  μi=ρμi-1+vi,并且回歸模型中不應(yīng)含有滯后因變量作為解釋變量,且回歸模型含有不為零的截距項(xiàng)。

  DW檢驗(yàn)具體步驟如下:

  第一步,計(jì)算DW值;

  第二步,給定顯著性水平α,由樣本容量n和解釋變量的個(gè)數(shù)k(不包含常數(shù)項(xiàng))的值查DW分布表,得臨界值下限dL和上限dU;

  第三步,判斷是否存在自相關(guān)性。當(dāng)DW值在2附近時(shí),模型不存在階自相關(guān)。當(dāng)DW為其他數(shù)值時(shí),需要查表比較。

  (3)消除自相關(guān)影響方法

  若模型經(jīng)檢驗(yàn)證明存在序列相關(guān)性,則常采用廣義差分法、一階差分法、科克倫一奧克特迭代法和德賓兩步法等方法估計(jì)模型。

  第四部分 時(shí)間序列分析

  十二、時(shí)間序列的基本概念

  1、隨機(jī)過(guò)程

  隨機(jī)變量按照時(shí)間的先后順序排列的集合叫隨機(jī)過(guò)程。

  設(shè)Y為一個(gè)隨機(jī)變量,若Y為連續(xù)型的隨機(jī)變量,記為Y(t);若是離散型的隨機(jī)變量,記為Yt。

  若一個(gè)隨機(jī)過(guò)程的均值和方差不隨時(shí)間的改變而改變,且在任何兩期之間的協(xié)方差值僅依賴于兩期的距離或滯后的長(zhǎng)度,而不依賴于時(shí)間,這樣的隨機(jī)過(guò)程稱為平穩(wěn)性隨機(jī)過(guò)程。反之,稱為非平穩(wěn)隨機(jī)過(guò)程。

  3、平穩(wěn)和非平穩(wěn)時(shí)間序列

  時(shí)間序列的統(tǒng)計(jì)特征不會(huì)隨著時(shí)間的變化而變化,即反映統(tǒng)計(jì)特征的均值、方差和協(xié)方差等均不隨時(shí)間的改變而改變,稱為平穩(wěn)時(shí)間序列;反之,稱為非平穩(wěn)時(shí)間序列。

  4、單整

  如果非平穩(wěn)序列{yt},通過(guò)d次差分成為一個(gè)平穩(wěn)序列,而這個(gè)序列的d-1次差分序列是不平穩(wěn)的,那么稱序列{yt}為d階單整序列,記為yt~I(xiàn)(d)。

  例如,當(dāng)d=1時(shí),yt~I(xiàn)(1)表示經(jīng)過(guò)一次差分就可變成平穩(wěn)序列。

  特別地,如果序列{yt}本身是平穩(wěn)的,則稱為零階單整序列,記為yt~I(0)。

  5、非平穩(wěn)序列轉(zhuǎn)化為平穩(wěn)序列

  (1)差分平穩(wěn)過(guò)程。

  若一個(gè)時(shí)間序列滿足1階單整,即原序列非平穩(wěn),通過(guò)1階差分即可變?yōu)槠椒€(wěn)列;

  (2)趨勢(shì)平穩(wěn)過(guò)程。

  有些時(shí)間序列在其趨勢(shì)線上是平穩(wěn)的,因此,將該時(shí)間序列對(duì)時(shí)間做回歸,回歸后的殘差項(xiàng)將是平穩(wěn)的。

  十三、平穩(wěn)時(shí)間序列

  1、移動(dòng)平均(MA)過(guò)程

  (1)MA(q)的基本概念

  2、自回歸(AR)過(guò)程

  (1)AR(P)的基本概念。

  P階自回歸過(guò)程可表示為:

  yt=C+?1yt-1+?2yt-2...+?pyt-p+εt

  我們把它記為AR(p)。

  3、ARMA模型。

  實(shí)際上AR模型和MA模型都是自回歸移動(dòng)平均過(guò)程的特例。階數(shù)為(p,q)的自回歸移動(dòng)平均過(guò)程可表示為:

  利用滯后算子可以很容易證明ARMA(p,q)過(guò)程是平穩(wěn) 的。ARMA模型的估計(jì)需要使用非線性估計(jì)方法,實(shí)務(wù)中常使用數(shù)學(xué)軟件進(jìn)行估計(jì)。

  十四、非平穩(wěn)時(shí)間序列

  1、ARIMA模型

  作差分是把非平穩(wěn)過(guò)程轉(zhuǎn)換成平穩(wěn)過(guò)程常用的方法。

  如果上述模型中xt是一個(gè)ARMA(P,q)過(guò)程,那么我們稱上述模型的Yt是一個(gè)自回歸融合移動(dòng)平均過(guò)程

  (Autoregressive—Integrated Moving-Average process),記為ARIMA(p,1,q)。如果xt是Yt經(jīng)過(guò)d階差分后的一個(gè)ARMA(p,q)過(guò)程,那么yt是一個(gè)ARIMA(p,d,q)。

  2、非平穩(wěn)序列的單位根檢驗(yàn)

  檢驗(yàn)時(shí)間序列的平穩(wěn)性方法通常采用單位根檢驗(yàn),常用的單位根檢驗(yàn)方法有DF檢驗(yàn)(Dickey—Fuller Test)和ADF檢驗(yàn)(Augment Dickey—Fuller Test)。

  DF檢驗(yàn)的原假設(shè)為:H0:?=1,若拒絕原假設(shè),則所檢驗(yàn)序列不存在單位根,為平穩(wěn)性時(shí)間序列;若不拒絕原假設(shè),則所檢驗(yàn)序列存在單位根,為非平穩(wěn)時(shí)間序列。

  (2)ADF檢驗(yàn)

  DF檢驗(yàn)存在一個(gè)問(wèn)題:當(dāng)序列存在1階滯后相關(guān)時(shí)才有效,但大多數(shù)時(shí)間序列存在高級(jí)滯后相關(guān),直接使用DF檢驗(yàn)法會(huì)出現(xiàn)偏誤。

  在這種情況下,人們將原DF檢驗(yàn)方法進(jìn)行了拓展,拓展為增廣的DF檢驗(yàn)(Augmented Dickey—Fuller Test),簡(jiǎn)稱為ADF檢驗(yàn),該方法可以用來(lái)檢驗(yàn)含有高階序列相關(guān)的序列是否平穩(wěn)性問(wèn)題。

  ADF檢驗(yàn)的三種模型形式:

  其檢驗(yàn)的原假設(shè)仍為H0:λ=0,即當(dāng)拒絕原假設(shè),表明序列不存在單位根,為平穩(wěn)性時(shí)間序列;不拒絕原假設(shè),表明序列存在單位根,為非平穩(wěn)性時(shí)間序列。

  十五、協(xié)整分析和誤差修正模型

  1、協(xié)整

  協(xié)整指的是多個(gè)非平穩(wěn)性時(shí)間序列的某種線性組合是平穩(wěn)的。

  某些時(shí)間序列是非平穩(wěn)時(shí)間序列,但他們之間卻往往存在長(zhǎng)期的均衡關(guān)系,具體來(lái)講,對(duì)于兩個(gè)時(shí)間序列均{xt}和{yt}為一階單整序列,即xt~I(1),yt~I(1),若存在一組非零常數(shù) a0和a1,使得a1x1+a2y2~I(0)則稱xt和Yt之間存在協(xié)整關(guān)系。

  2、誤差修正模型

  傳統(tǒng)的經(jīng)濟(jì)模型通常表述的是變量之間的一種“長(zhǎng)期均衡”關(guān)系,而實(shí)際經(jīng)濟(jì)數(shù)據(jù)卻是由“非均衡過(guò)程”生成的。

  因此,建模時(shí)需要用數(shù)據(jù)的動(dòng)態(tài)非均衡過(guò)程來(lái)逼近經(jīng)濟(jì)理論的長(zhǎng)期均衡過(guò)程,于是產(chǎn)生了誤差修正模型(Error Correction Model)。

  誤差修正模型基本思想是,若變量問(wèn)存在協(xié)整關(guān)系,則表明這些變量問(wèn)存在著長(zhǎng)期均衡關(guān)系,而這種長(zhǎng)期均衡關(guān)系是在短期波動(dòng)過(guò)程中的不斷調(diào)整下得以實(shí)現(xiàn)的。

  由于大多數(shù)金融時(shí)間序列的一階差分是平穩(wěn)序列,受長(zhǎng)期均衡關(guān)系的支配,這些變量的某些線性組合也可能是平穩(wěn)的。

  即所研究變量中的各長(zhǎng)期分量相互抵消,產(chǎn)生了一個(gè)平穩(wěn)的時(shí)間序列,這是由于一種調(diào)節(jié)機(jī)制——所謂的誤差修正機(jī)制在起作用,它防止了長(zhǎng)期均衡關(guān)系出現(xiàn)較大的偏差。因此,任何一組相互協(xié)整的時(shí)間序列變量都存在誤差修正機(jī)制,通過(guò)短期調(diào)節(jié)行為,達(dá)到變量間長(zhǎng)期均衡關(guān)系的存在。

  4、案例分析

  (1)分析目的

  根據(jù)某地區(qū)1950~1990年的人均食物年支出和人均年生活費(fèi)收入月度數(shù)據(jù),判斷該兩組時(shí)間序列的平穩(wěn)性,檢驗(yàn)食物支出和生活費(fèi)收入之間的Grange因果關(guān)系,從長(zhǎng)期看,判斷兩者是否存在協(xié)整關(guān)系?從短期看,判斷是否存在誤差修正機(jī)制?

  (2)操作步驟

  第一步,首先,將人均食品支出和人均年生活費(fèi)收入消除物價(jià)變動(dòng)的影響,得到實(shí)際人均年食品支出(Y),和實(shí)際人均年生活費(fèi)收入(X),再對(duì)Y和X分別取對(duì)數(shù),記Y=lnY,x=lnX。

  第二步,分別將變量x,y序列導(dǎo)入到Eviews 中,打開(kāi)“series:x(或Series:Y)”對(duì)話框,點(diǎn)擊“View—Unit Root Test”,彈出Unit Root Test”對(duì)話框,在“Test Type”下面選擇采用

  默認(rèn)的“Augmented Dickey—Fuller”;通過(guò)觀察x、Y的序列圖得出兩者均呈現(xiàn)明顯的上升趨勢(shì),所以在“Include in Test Equation”下面選擇

  Trend and Intercept”;在“Test for Unit Root in”下面選擇“Level”:在“Lagged Difference”下面將數(shù)值改為“2”,再點(diǎn)擊OK鍵,最后彈出單位根檢驗(yàn)結(jié)果。

  單位根檢驗(yàn)回歸方程設(shè)定(水平變量)

  表4-10和表4-11可以看出,x和Y序列的ADF檢驗(yàn)統(tǒng)計(jì)量值均大于在1%、5%和10%顯著性水平下的臨界值,表明x和Y序列均為非平穩(wěn)性時(shí)間序列。

  第三步,再分別對(duì)x和Y序列作1階差分得△x和△y序列,對(duì)其進(jìn)行平穩(wěn)性檢驗(yàn)。

  從表4-12和表4-13可以看出,x和△y序列的單位根檢驗(yàn)統(tǒng)計(jì)量值分別約為-3.5586和-2.7080,均大于1%顯著性水平下的l臨界值-3.6171,小于10%顯著性水平下的臨界值-2.6092,表明1階差分后的x和Y序列在10%的顯著性水平均為平穩(wěn)性時(shí)間序列,即x和Y序列均為1階單整序列。

  第四步 Granger因果關(guān)系檢驗(yàn)

  第五步 將取對(duì)數(shù)后的人均食品支出(y)作為被解釋變量,對(duì)數(shù)化后的人均年生活費(fèi)收入(x)作為解釋變量,用普通最小二乘乘法估計(jì)回歸模型。

  估計(jì)模型為:

  yt=-0.0768+0.9121xt+et

  第六步,在Eviews 命令窗口中,輸入“Genr et = resid”,將上述OLS回歸得到的殘差序列命名為新序列et,然后雙擊et序列,對(duì)et進(jìn)行單位根檢驗(yàn),其檢驗(yàn)輸出結(jié)果見(jiàn)表4-19。

  殘差序列et的ADF檢驗(yàn)統(tǒng)計(jì)量值約為-4.0345,均小于1%、5%和10%顯著性水平下的臨界值,拒絕存在單位根檢驗(yàn)的原假設(shè),表明殘差序列是一個(gè)平穩(wěn)性時(shí)間序列,說(shuō)明對(duì)數(shù)化后的實(shí)際人均年食品支出Y和實(shí)際人均年生活費(fèi)收入x之間存在協(xié)整關(guān)系。

  第七步,用△y作為被解釋變量,△x和ecmt-1(為et序列的滯后項(xiàng))作為解釋變量,做OLS線性回歸。

  該誤差修正模型的估計(jì)結(jié)果為:

  上式估計(jì)結(jié)果表明,城鎮(zhèn)居民月人均食物支出的變化不僅取決于人均年生活費(fèi)收入的變化,還取決于上一期食物支出對(duì)均衡水平的偏離。

  誤差系數(shù)ecmt-1的估計(jì)值為-0.6582,體現(xiàn)了對(duì)偏離的修正,上一期偏離越遠(yuǎn),本期修正的量就越大,即系統(tǒng)存在誤差修正機(jī)制。

  第五部分 常用統(tǒng)計(jì)軟件及應(yīng)用

  十六、 常用統(tǒng)計(jì)軟件

  1、SAS

  SAS是目前國(guó)際上最為流行的一種大型統(tǒng)計(jì)分析系統(tǒng),被譽(yù)為統(tǒng)計(jì)分析的標(biāo)準(zhǔn)軟件。

  盡管價(jià)格不菲,SAS已被廣泛應(yīng)用于政府行政管理、科研、教育、生產(chǎn)和金融等不同領(lǐng)域,并且發(fā)揮著愈來(lái)愈重要的作用。

  2、SPSS

  SPSS作為僅次于SAS的統(tǒng)計(jì)軟件工具包,在社會(huì)科學(xué)領(lǐng)域有著廣泛的應(yīng)用。

  SPSS是世界上最早的統(tǒng)計(jì)分析軟件,由美國(guó)斯坦福大學(xué)的三位研究生于20世紀(jì)60年代末研制。

  由于SPSS容易操作,輸出漂亮,功能齊全,價(jià)格合理,所以很快地應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會(huì)科學(xué)的各個(gè)領(lǐng)域。

  3、Excel

  它嚴(yán)格說(shuō)來(lái)并不是統(tǒng)計(jì)軟件,但作為數(shù)據(jù)表格軟件,必然有一定的統(tǒng)計(jì)計(jì)算功能。凡是有Microsoft Office的計(jì)算機(jī),基本上都裝有Excel。但要注意,有時(shí)在裝0ffice時(shí)沒(méi)有裝數(shù)據(jù)分析的功能,那就必須裝了才行。

  4、Minitab

  Minitab提供對(duì)存儲(chǔ)在二維工作表中的數(shù)據(jù)進(jìn)行分析的多種功能,包括:基本統(tǒng)計(jì)分析、回歸分析、方差分析、多元分析、非參數(shù)分析、時(shí)間序列分析、試驗(yàn)設(shè)計(jì)、質(zhì)量控制、模擬、繪制高質(zhì)量三維圖形等。

  從功能來(lái)看,Minitab除各種統(tǒng)計(jì)模型外,還具有許多統(tǒng)計(jì)軟件不具備的功能——矩陣運(yùn)算。

  5、 Eviews

  Eviews是專門(mén)從事數(shù)據(jù)分析、回歸分析和預(yù)測(cè)的工具。使用Eviews可以迅速地從數(shù)據(jù)中尋找出統(tǒng)計(jì)關(guān)系,并用得到的關(guān)系去預(yù)測(cè)數(shù)據(jù)的未來(lái)值。

  應(yīng)用范圍包括:科學(xué)實(shí)驗(yàn)數(shù)據(jù)分析與評(píng)估、金融分析、宏觀經(jīng)濟(jì)預(yù)測(cè)、仿真、銷(xiāo)售預(yù)測(cè)和成本分析等。


2022年中級(jí)經(jīng)濟(jì)師3天特訓(xùn)營(yíng)免費(fèi)領(lǐng)!!

經(jīng)濟(jì)專業(yè)中級(jí)資格考試報(bào)名條件有哪些

職上網(wǎng)輔課程 更多>>
課程套餐 課程內(nèi)容 價(jià)格 白條免息分期 購(gòu)買(mǎi)
2021年證券從業(yè)考試-簽約旗艦托管班 錄播+直播+考前預(yù)測(cè)卷+模考卷+講義+協(xié)議 ¥2580 首付258元 視聽(tīng)+購(gòu)買(mǎi)
2021年證券從業(yè)考試-簽約旗艦直達(dá)班 錄播+直播+考前預(yù)測(cè)卷+??季?講義+重讀 ¥1980 首付198元 視聽(tīng)+購(gòu)買(mǎi)
2021年證券從業(yè)考試-進(jìn)階直達(dá)班 錄播+直播+??季?重讀 ¥1680 首付168元 視聽(tīng)+購(gòu)買(mǎi)
版權(quán)及免責(zé)聲明
職上網(wǎng)輔導(dǎo)班
免費(fèi)試聽(tīng)
  • 李雅
    金融培訓(xùn)專家

    金融學(xué)碩士,從事金融教學(xué)多年,專注“金融類資格考試”等培訓(xùn),講課條理分明,善于總結(jié)小口訣。
    免費(fèi)試聽(tīng)
  • 胡芳
    金融培訓(xùn)專家

    吉林大學(xué)金融學(xué)博士,國(guó)家理財(cái)規(guī)劃師、風(fēng)險(xiǎn)管理師長(zhǎng)期致力于金融行業(yè)考試研究和培訓(xùn)工作,具有多年大學(xué)執(zhí)教經(jīng)驗(yàn)。
    免費(fèi)試聽(tīng)
  • 劉暢
    金融培訓(xùn)專家

    高級(jí)經(jīng)濟(jì)師、金融風(fēng)控高級(jí)主管,多次在《財(cái)經(jīng)界》等國(guó)家級(jí)刊物發(fā)表文章,長(zhǎng)期從事金融考試培訓(xùn),授課清新明快。
    免費(fèi)試聽(tīng)