第一步:明確時(shí)間。步驟:數(shù)據(jù)-定義日期。日期模式有很多種,看實(shí)際情況而定。
第二步:創(chuàng)建模型。步驟:分析-預(yù)測(cè)-創(chuàng)建模型。
第一個(gè)選項(xiàng)卡包含專家建模,指數(shù)平滑方法和ARIMA。
專家建模師是傻瓜相機(jī),基本不靠譜。波動(dòng)序列采用ARIMA,平滑采用指數(shù)法。
擬合好壞,ARIMA看的是穩(wěn)定的R平方,指數(shù)平滑看的是R平方。
第二個(gè)選項(xiàng)卡:統(tǒng)計(jì)選項(xiàng)卡-擬合測(cè)量。
第三頁簽:圖表,重點(diǎn)關(guān)注單個(gè)模型圖,可以全部選擇,看看對(duì)應(yīng)哪些圖,多畫幾張。
比如你想預(yù)測(cè)未來五年,你可以把自變量的數(shù)據(jù)再填五年,別的什么都不填,然后點(diǎn)擊分析,預(yù)測(cè),建模型,保存,選擇預(yù)測(cè)值,下限,上限,你的原始數(shù)據(jù)集就有預(yù)測(cè)值了。
可靠的
Spsspro支持代碼導(dǎo)出模塊,覆蓋了大量的評(píng)估、優(yōu)化和預(yù)測(cè)模型,可以滿足數(shù)據(jù)建模中使用的大部分模型。
所有算法模型操作都非常簡單,只需拖拽變量,系統(tǒng)會(huì)自動(dòng)生成結(jié)果。
除了數(shù)據(jù)分析,SPSSPRO還可以做數(shù)據(jù)處理。
目前有常見的離群點(diǎn)處理、缺失值處理、數(shù)據(jù)降維等60多種處理方法。
方法介紹,曲線擬合過程2/8【分析】,【回歸】,【曲線估計(jì)】,選擇相應(yīng)的變量和擬合模型,得到結(jié)果,擬合效果良好。
3/8用指數(shù)模型預(yù)測(cè)4/8用加權(quán)最小二乘法擬合模型!5/8首先,按照傳統(tǒng)的運(yùn)算方法,N代表X和Y的個(gè)數(shù),所以N要作為一個(gè)加權(quán)的情況來處理。
6/8此時(shí)對(duì)X的統(tǒng)計(jì)分析顯示有171個(gè)數(shù)據(jù),然后進(jìn)行線性回歸7/8。此操作與以下操作相同。在一定范圍內(nèi)搜索8/8變權(quán)值,得到優(yōu)化的權(quán)值結(jié)果。
Logistic回歸主要分為三類,一類是有因變量的二元logistic回歸,稱為二項(xiàng)式logistic回歸,另一類是有無序因變量的多類別logistic回歸,比如選擇哪個(gè)產(chǎn)品,稱為多項(xiàng)式logistic回歸。
還有一種是對(duì)因變量進(jìn)行排序分類的邏輯回歸,比如疾病的嚴(yán)重程度是高、中、低等。這種回歸也稱為累積邏輯回歸或有序邏輯回歸。二元邏輯回歸:選擇分析-回歸-二元邏輯,打開主面板,檢查因變量的二元變量。這是不可用的。什么?;問題是什么?然后看下面寫的一個(gè)協(xié)變。什么是協(xié)變很奇怪嗎?在二元邏輯回歸中,協(xié)變量可以被認(rèn)為是獨(dú)立變量,或獨(dú)立變量。在協(xié)變量框中選擇你的自變量。
細(xì)心的朋友會(huì)發(fā)現(xiàn),在指向協(xié)變的箭頭下,有一個(gè)標(biāo)有a*b的小按鈕,用來選擇交互項(xiàng)目。
我們知道有時(shí)候兩個(gè)變量的組合會(huì)產(chǎn)生新的影響,比如年齡和結(jié)婚次數(shù),會(huì)對(duì)健康產(chǎn)生新的影響。這時(shí)候我們認(rèn)為兩者之間是有交互作用的。然后,為了模型的準(zhǔn)確性,我們將這種相互作用影響選擇到模型中。
我們?cè)谟疫叺目蛑羞x擇變量A,按住ctrl,選擇變量B,這樣我們就可以同時(shí)選擇兩個(gè)變量,然后點(diǎn)擊a*b的按鈕,這樣協(xié)變量的框中就出現(xiàn)了一個(gè)名字很長的新變量,就是我們交互的變量。
下面是方法的下拉菜單。默認(rèn)為輸入,即強(qiáng)制所有選擇的變量進(jìn)入模型。除了入口法,還有三個(gè)前進(jìn)法和三個(gè)后退法。
一般默認(rèn)輸入就可以了。如果模型中變量的P值不合格,會(huì)用其他來做。
底部的選擇變量用于選擇您的案例。你不我通常不必為此擔(dān)心。
選擇主面板后,單擊分類(右上角)打開分類對(duì)話框。
在此對(duì)話框中,左邊的協(xié)變量框包含您選擇的自變量,而右邊的協(xié)變量框?yàn)榭瞻住?/p>
您應(yīng)該將協(xié)變量中的字符變量和分類變量選擇到分類協(xié)變量中(系統(tǒng)會(huì)自動(dòng)生成虛擬變量以便于分析。關(guān)于啞變量的詳細(xì)信息,請(qǐng)參考上一篇文章)。
這里的字符變量是指標(biāo)有值標(biāo)簽的變量,否則系統(tǒng)可以Idon'我不能僅憑語言來為你分析它們。
在選擇之后,在分類協(xié)變量下面有一個(gè)改變比較的方框。我們知道,spss對(duì)于分類變量需要有一個(gè)參照,每一個(gè)分類都與這個(gè)參照進(jìn)行比較,得到結(jié)果。更改比較的框用于選擇參考。
默認(rèn)的比較是指標(biāo),即每一個(gè)分類都與總體進(jìn)行比較,除了指標(biāo),還有簡單,差異等等。
這個(gè)框架不是很重要,默認(rèn)就好。單擊繼續(xù)。
然后打開保存對(duì)話框,檢查概率,分組成員,包括協(xié)方差矩陣。單擊繼續(xù)打開選項(xiàng)對(duì)話框,檢查分類圖、估計(jì)值的相關(guān)性、迭代歷史、exp(B)的CI(包括模型中的常數(shù))以及每一步的output-in。
如果你的協(xié)變量是連續(xù)的或者小樣本的,還應(yīng)該檢查一下Hosmer-Lemeshow擬合度,這樣會(huì)更好。去吧,確認(rèn)一下。
然后,輸出結(jié)果。將主要輸出六個(gè)表。第一個(gè)表是模型系數(shù)合成。檢驗(yàn)表取決于他的模型的p值是否小于0.05,以及我們的logistic回歸方程是否有意義。第二個(gè)表示模型摘要表。這個(gè)表中有兩個(gè)R2,叫做廣義決定系數(shù),也叫偽R2。該函數(shù)類似于線性回歸中的決定系數(shù),它也表明該方程在多大程度上可以解釋模型。由于計(jì)算方法不同,這兩個(gè)廣義決定系數(shù)的取值往往不同,但差別并不大。下面的分類表顯示了模型的穩(wěn)定性。
此表最后一行中百分比校正下面的三個(gè)數(shù)據(jù)列出了模型正確預(yù)測(cè)的百分比以及實(shí)際值為0或1時(shí)模型的總正確預(yù)測(cè)率。一般認(rèn)為正確預(yù)測(cè)的概率是50%(標(biāo)準(zhǔn)確實(shí)夠低),當(dāng)然正確率越高越好。然后是最重要的表格,方程中的變量表。第一行b下面是每個(gè)變量的系數(shù)。第五行的p值會(huì)告訴你每個(gè)變量是否適合留在方程里。如果某個(gè)變量不合適,就需要再次去掉該變量,進(jìn)行回歸。根據(jù)這個(gè)表,邏輯方程可以寫成:PExp(常數(shù)a1*變量1a2*變量2。。。)/(1Exp(常量a1*變量1a2*變量2。。。))。如果你學(xué)過統(tǒng)計(jì)學(xué),你應(yīng)該熟悉這種形式的方程。提供一個(gè)變量,這個(gè)變量最終會(huì)是一個(gè)0到1之間的數(shù)字,也就是你的模型中設(shè)置了大值的情況出現(xiàn)的概率。例如,如果你想計(jì)算它是否會(huì)被治愈,你設(shè)置0為治愈,1為未治愈。然后你的模型計(jì)算出沒有治愈的概率。如果想直接計(jì)算治愈概率,需要更改設(shè)置,用1表示治愈。此外,最后兩列有一個(gè)EXP(B),它是OR值。哦,這不t表示OR,OR值就是比值比。在線性回歸中,我們用標(biāo)準(zhǔn)化系數(shù)來比較兩個(gè)自變量對(duì)因變量的影響,在logistic回歸中,我們用比值比來比較不同情況對(duì)因變量的影響。比如說。比如我想看看性別對(duì)一種疾病是否好轉(zhuǎn)的影響。假設(shè)0代表女性,1代表男性,0代表沒有變好,1代表變好。發(fā)現(xiàn)這個(gè)變量的OR值是2.9,也就是說男性的提升可能是女性的2.9倍。注意,這里都是基于取值較大的情況。而OR值可以直接給出這個(gè)倍數(shù)。如果0、1、2各代表一種情況,那么2就是1的2.9倍,1就是0的2.9倍,以此類推。或值對(duì)等式?jīng)]有貢獻(xiàn),但有助于直觀地理解模型。使用OR值時(shí),一定要用它的95%置信區(qū)間來判斷。另外還有相關(guān)矩陣表和概率直方圖,不再介紹。多元邏輯回歸:選擇分析-回歸-多元邏輯回歸,打開主面板,因變量大家都知道選什么,因變量下面有參考類別,默認(rèn)第一類別就可以了。然后有兩個(gè)框架,因子和協(xié)變量。很明顯,這兩個(gè)框架都需要你選擇因變量,那么有什么區(qū)別呢?嘿嘿,區(qū)別就在于因素里有無序的分類變量,比如性別,職業(yè),連續(xù)變量(其實(shí)做logistic回歸的時(shí)候絕大部分自變量都是分類變量,連續(xù)變量比較少)。),且協(xié)變量包含等級(jí)數(shù)據(jù),如疾病的嚴(yán)重程度、年齡(以十年為一個(gè)年齡組,如果一個(gè)是一年,則視為連續(xù)變量)等等。在二項(xiàng)式logistic回歸中,系統(tǒng)會(huì)自動(dòng)生成啞變量,但在多元logistic回歸中,需要手動(dòng)設(shè)置。參照上面的解釋,不難知道,設(shè)定的虛擬變量應(yīng)該放在因子的盒子里。然后點(diǎn)擊模型對(duì)話框,哇,多么恐怖的對(duì)話框,我不我不知道這是什么。好吧,讓我們讓我們一點(diǎn)一點(diǎn)來看。我們已經(jīng)說了什么是交互作用,那么就不難理解主要作用是變量本身對(duì)模型的影響。明確了這一點(diǎn),這個(gè)對(duì)話框就沒那么難選了。指定模型一欄有三個(gè)模型,主效應(yīng)指的是只做自變量和因變量的方程,是最常見的一個(gè)。全因素是指包括所有主效應(yīng)和所有因素及其交互效應(yīng)的模型(Idon我不明白為什么只有總因素而沒有總協(xié)變量。這個(gè)問題真的很難,所以不要回答。;不要問我。)第三個(gè)是set/step。這是手動(dòng)設(shè)置交互項(xiàng)和主效果項(xiàng),也可以設(shè)置這個(gè)項(xiàng)是強(qiáng)制進(jìn)入還是逐步進(jìn)入。唐不要為這個(gè)概念而煩惱,是嗎?點(diǎn)擊繼續(xù)打開統(tǒng)計(jì)對(duì)話框,查看辦案匯總、偽R方、步驟匯總、模型擬合信息、單元格可能性、分類表、擬合度、估計(jì)、似然比檢驗(yàn),繼續(xù)。打開條件,全部選中,繼續(xù),打開選項(xiàng),選中用于分級(jí)的必備項(xiàng),然后移除該項(xiàng)。打開保存并選中包含協(xié)方差矩陣。當(dāng)然(終于完成了)。結(jié)果類似于二項(xiàng)式邏輯回歸,只是多了一個(gè)似然比檢驗(yàn),如果P值小于0.05,則認(rèn)為變量有意義。然后我們直接看參數(shù)估計(jì)表。假設(shè)我們的因變量有n類,參數(shù)估計(jì)表會(huì)給出n-1組的截距,變量1和變量2。我們我們用Zm來表示Exp(常數(shù)mam1*變量1am2*變量2。。。),則M級(jí)情況發(fā)生的概率為Zn/1Z2Z3...Zn(如果我們把第一個(gè)類作為參考類,我們就贏了t有任何關(guān)于第一類的參數(shù),那么第一類就默認(rèn)為1,也就是說Z1為1)。有序回歸(累積logistic回歸):選擇菜單分析-回歸-有序打開主面板。因變量、因子、協(xié)變量如何選擇數(shù)量就不重復(fù)了。“選項(xiàng)”對(duì)話框?yàn)槟J(rèn)值。打開輸出對(duì)話框,勾選擬合統(tǒng)計(jì)、匯總統(tǒng)計(jì)、參數(shù)估計(jì)、平行線檢驗(yàn)、估計(jì)響應(yīng)概率、實(shí)際類別概率、OK、位置對(duì)話框,與上述模型對(duì)話框類似,不再贅述。當(dāng)然可以。結(jié)果其中一個(gè)獨(dú)特的表格是平行線檢查表。如果本表的p值小于0.05,則認(rèn)為不同類別的斜率不同。另外,從參數(shù)估計(jì)表中得到的參數(shù)也是不同的。假設(shè)我們的因變量有四個(gè)水平,有兩個(gè)自變量,參數(shù)估計(jì)表會(huì)給出三個(gè)閾值a1,a2,a3(即截距)和兩個(gè)自變量的參數(shù)M,N。計(jì)算方程時(shí),先計(jì)算三個(gè)鏈接值,即link1a1m*x1n*x2,link2a2m*x1n*x2,link3a3m*x1n*x2(只是截距不同)。獲得鏈接值p11/(1exp(link1))、p1p21/(1exp(link2))、p1p2之后。物流與運(yùn)輸。;這里的回歸基本結(jié)束了。大家一定要把公式背下來,搞混了就不好了。希望能幫到你。