學期回顧

這學期是我在小麥正式修課的最後一個學期了(耶斯!!!)研究所念到現在第四年結束,我也修課修了四年,簡直就像是重新念一次大學一樣累人。因為我有當專案助理,所以我一個學期只需要修三學分即可,但修課的最後一學期我還是修滿三門課總共九學分(大概是失心瘋吧…反正不用學費只要繳雜費就好)。這三門課是上一篇有介紹過的美國少數族裔的高等教育機構,另外兩門都是統計:階層線性迴歸還有準實驗設計。

然後在你點「繼續閱讀」之前,我要先說:這篇非常的…呃…nerdy,書呆子,整篇都在說教 orz


美國少數族裔的高等教育機構這門課我就不贅述了,有興趣的人可以看上一篇網誌

階層線性迴歸(hierarchical linear modeling, HLM)是多元迴歸的延伸,主要處理巢狀結構(nested)的數據。巢狀結構就是指其實我們研究的對象(例如學生)其實是群聚在一個更大單位的環境中(例如學校),所以假如我們認為學校會影響學生的課業表現啊之類的,那麼我們就必須把學校的影響也納入考量,同時,學生與學生之間不是獨立的個體,而是互相影響的。

這個從社會科學的角度來看很自然:本來就會互相影響啊!我跟你天天一起上學、玩耍,當然會互相影響,或者是有共通特性囉!但是這個在統計上很麻煩,因為很多統計考驗的假設都認為學生之間是互相獨立的個體、不會互相影響。所以問題來了:我們需要新的統計方法來處理這種共通特性,所以HLM就誕生了。

(那天才跟雅婷討論說網誌不放圖片幾乎就不大會有人看,所以我要想盡辦法放圖片)

假設我們今天探討社經背景與數學分數的關係,通常我們就只會找出一條迴歸方程式、畫一條線出來;頂多如下圖考量男女之間的差異(在這邊性別跟社經背景有交互作用interaction; 以下三張圖片都來自這裡,這也只是範例,我沒有要討論背後的理論):

假如不管其他影響因子的話,在高社經地位時,男生的數學成績會比女生高;低社經地位的學生則相反。
藍色線條是男生,紅色是女生
假如我們考慮不同學校的平均社經背景,那麼就不大一樣。下面這張圖三條線代表三種學生平均社經背景不同的學校:

假設有三群學生,他們的家庭社經背景分數一樣,但這三群學生分散於三間學校,而這三間學校的學生平均社經地位不同,所以綠色那條線代表當你身處高平均社經地位的學校中,即便你的個人社經地位跟其他兩間學校的學生相近,平均而言你的數學成績還是會比其他兩群、就讀平均社經地位較低的學校的人高。
迴歸都是平均數的概念,所以我才一直強調「平均」;綠色學校的平均分數比藍色學校高~

把性別跟三間學校都放在一個模式中,就會像下面這張圖一樣。

雖說在高社經地位時男生的表現比女生好,但假如這些女生就讀的學校的平均社經地位比那些男生高,那麼這些女生的數學成績平均而論還是會比那群男生高的~這就是環境的力量~~~~~

錯綜複雜,所以就讀哪間學校其實也有關係

課堂上用的軟體是HLM(目前是第七版),一開始我還算喜歡,但後來發現限制重重,不盡理想,為了處理學期報告的研究,我還特別找學姐問說要怎麼用Mplus來處理階層問題,但後來覺得Mplus在這方面有點難理解,只好打退堂鼓,擇日再戰!希望改天可以學會………

最近三四十年來對環境的影響力越來越重視,所以也有越來越多人使用這個技術來探討念哪間學校、住哪個城市之類的對學生的影響。這個技術也可以拿來處理縱貫性的資料,也就是針對同一個人施測好幾次,你就可以看到這個人成長的模樣。就像小嬰兒要定期做健康檢查,你可以看到他的身高、體重如何變化。但因為你測量的都是同一個小嬰兒,所以每個月的體重與身高數據並非獨立的,而是都屬於同一個人的,所以強調獨立性的統計技術就不適用。

(這篇越來越學術了,下面的段落一樣學術喔!哈哈!)

另外一堂統計課準實驗設計(Quasi-experimental design, QED)我去年春季曾經想要挑戰過,但因為太難所以退選,今年就躲不掉了,老師是系上新來的老師,來自奧地利的紳士帥哥~準實驗設計的出現是因為隨機實驗設計並不是很好進行與實施,所以為了做因果推論並且貼近隨機實驗設計的機制,準實驗設計就因應而生,目的是要接近「隨機」的機制;什麼的隨機呢?受試者被分到實驗組或對照組的機率相當、是隨機的。

在社會科學的研究裡,要做隨機實驗常常很困難。例如在教育領域要去國中小發問卷,我想大部分的研究者不是隨便抽幾個學校就跑去發吧!大多是找說自己的朋友在哪間學校任教所以請他們幫忙(這個叫做方便樣本),或者校長點頭答應幫忙發問卷(所以也不是隨機),所以隨機有點少見。

就算是實驗室裡頭的研究,有的時候也難保真正隨機。舉例來說,你會貼公告說我們需要受試者喔!意者請洽某某某,動作要快以免向隅!這個情況下,會來報名參加的人可能都有種共通的心理特性:可能缺錢所以需要做一些研究拿到補貼的車馬費,可能熱心公益想說研究生要互相幫忙。

所以這樣子真的隨機嗎?很多時候是個問號。

社會科學的研究還有一種情況是你用政府或者其他機構收集的數據,例如主計處的普查結果,或者台灣的高等教育資料庫收集到的資料。這種資料當然不是在實驗設計的環境下收到的,而且人家都收好了你也沒辦法改變什麼,你總不能去主計處掀桌子吧!假如我們想要用這些資料來做因果推論,那麼我們就需要準實驗設計的概念了。

這門課短短一個學期內介紹了四個主題,以下我就隨便亂翻譯:不連續迴歸設計(regression discontinuity design)、阻斷時間序列(interrupted time series)、特徵分數配對(propensity score matching)、工具變項設計(instrumental variable)等四個。要學準實驗設計,我覺得基本上要對統計有一定基礎了,尤其是多元迴歸(包括無母數迴歸)與實驗設計,不然會很辛苦。

那我們就來看圖來認識這四個主題吧哈哈!

首先是不連續迴歸設計:

橫軸是某個變項,我們用這個變項來分成實驗組與對照組,所以傳統上實驗組會放在右邊,對照組放在左邊,中間那條虛線就是分組的線(例如:考60分及格的放在實驗組,不及格的放在對照組,所以橫軸是考試分數,那條虛線就是60分的線);Y軸是實驗的結果,例如實驗組的有進行數學加強訓練,所以Y軸就是加強訓練後的數學成績。

左下角的P. M. Steiner就是我的老師的名字;圖片來自上課投影片

為什麼會叫做不連續呢?因為一般的迴歸線就是一條直直的,但這邊的線是斷掉的;斷在哪裡呢?就是斷在虛線的地方!所以那兩條直線在虛線處的落差,就是加強訓練的效果,也就是實驗效果;落差夠大有顯著的話代表這個加強訓練的確有效!

所以為何要用準實驗設計的概念?因為我們不是隨機把小朋友分到加強訓練組,而是依照考試分數,但是在虛線附近的小朋友(也就是考在60分上下的小朋友)其實是隨機的,因為在那附近的小朋友可能只是猜錯或者猜對幾題、運氣不好之類的。這是個很強有力的設計,可以讓研究者探討這個加強訓練的課程是否有效;缺點是很多時候只能把結果推論到考60分左右的小朋友身上(除非你在迴歸方程式那邊加工一下才有辦法推論到距離虛線遙遠的地方,也就是考90分或者10分的小朋友)。

我其實很喜歡這張圖,虛線的地方很像懸崖!

(如果你還有興趣的話可以繼續往下看,為了寫這一篇我分了好幾次寫 XD)

阻斷時間序列很適合用來做縱貫性研究。假設我們已經紀錄了出生率的曲線(所以上上下下,可能龍年的時候出生率就爆炸高),假如哪一年政府推出了新的政策,什麼~欸~生一胎補助幾萬元、小朋友尿布奶粉免錢、不用抽籤就可以念公托之類的優惠方案,所以我們要看這個優惠方案是否會造成出生率曲線的變化。

下圖這個案例是美國某家電話公司要針對電話黃頁服務進行收費的前後比較。橫軸是年份,縱軸是使用黃頁功能的電話通數。在1974年以前用黃頁功能的人很多(免費嘛~直接問接線生說訂披薩的電話就不用自己查了多方便!),1974年某天之後開始要收20分的手續費(也就是那條直線),你就看到整個曲線就崩盤了,掉到原本的五分之一左右,所以下降的幅度就是這個新政策對民眾使用電話黃頁頻率的效果。
一樣來自上課投影片
所以不知道台灣的公衛界不知道會不會探討什麼補助三萬元對生育率有沒有影響,我猜應該沒什麼影響。單看那個陡落其實不大夠,你必須分析整體趨勢來判斷說那個「懸崖」是不是有統計的意義,是新的育兒補助的效果,還是本來就會有這樣的變化?

第三個是特徵分數配對,很多時候用在分析大型數據資料庫的時候(例如政府人口普查的數據),探討某個自然實驗的結果(例如選擇公立或私立小學,這不是政府可以強行把人民隨機分成兩種,而是父母自己選擇讓小孩念哪一間),所以這個技術可以探討是怎樣的機制讓父母選擇念公立或私立,從而探討念公立或者私立小學是否造成小朋友的不同,例如學習成效啦、道德發展啦之類的,同時平衡各種選擇機制(例如家裡有錢程度、對小朋友教育的看重程度等)。這個技術很需要邏輯迴歸的基礎。

工具變項則是經濟學愛用的方法,找一個跟分組(分實驗組與對照組)有關的變項來解釋這個分組的機制,但這個變項跟要探討的結果無關。例如你想要探討媽媽的教育程度跟他們的小baby的健康程度之間的關係(例如教育程度高的媽媽比較不會在懷孕期間吸菸或喝酒,所以小baby應該會比較健康),所以你可以找一個跟教育有關、但跟小baby健康無關的變項來解釋為什麼有的媽媽會念到大學畢業有的只有國中畢業(然後才探討學歷跟嬰兒健康的關係)。

所以一個可行的工具變項可能是政策:因為政府廣設大學所以女生念大學的機率變高了;不可行的工具變項可能是女生的家庭經濟狀況(雖然說家裡比較有錢的比較有可能念到高學歷,但比較有錢的也可能買比較好的食物給小嬰兒,或者有錢做各種健康檢查,所以小朋友的健康狀況比較好)。

好大概講完了 XD 社會科學研究有太多的不完美,所以需要很多特別的技術來「補破網」。雖然有很多統計技術可以使用,但老師都會跟你說:「假如你的研究設計一開始就毀了,你也別指望統計可以幫你修正什麼。」所以在做研究之前真的需要縝密的思考與設計,不然就算統計軟體還是會幫你算,出來的數據不是很難看就是沒有意義。

最後的題外話:這門課雖然是我們教心系開的,來修課的很多都是社會系或者大傳系的研究生…他們真愛量化耶…………

留言

  1. 回覆
    1. 有這麼困難嗎@@我覺得我舉的例子還滿生活化的耶 XDDDD

      刪除
  2. 完全看不懂你在寫什麼,當掉!!!(具體來說是我被當掉...)

    回覆刪除
    回覆
    1. 我真的有寫那麼難喔@@好吧我回去檢討 orz

      刪除
  3. 學弟(我也是彰師畢業的,不過你應該不認識我),
    去年我也修了QED,我覺得最難的部分是R,而且還求救無門...不知哪位高人助你一把,請務必引薦,讓我好好請教一番!

    回覆刪除
  4. 哈囉學姐!對我真的不知道你是誰哈哈哈!不過或許有聽過啦假如您也是輔諮系的 ^^"

    R的話,其實,我也只是把老師給的程式碼複製貼上寫作業而已 :p 只是有些作業必須自己寫R code,所以我就是以老師給的code為藍本,自己變一些東西。說實話,我對R也不是很熟悉,不到最後一步是不用R的。老師給的code很詳盡,該跑的都會跑出來,所以至今還沒有遇過很大的問題。我遇到R方面的問題,最後也都是拿去問統計系的人以及直接問老師,不然也沒有其他方法了 orz 我們老師是Peter Steiner,你可以先看看他的paper,有興趣的話可以寫信問他吧我想,他人非常好,是位可愛的奧地利老師

    回覆刪除
  5. 其實我覺得這篇很實用也很有趣ㄟ......
    難道研究生只能跟研究生聊天了嗎 @@

    回覆刪除
    回覆
    1. 果然要研究生才會覺得有趣!!!職業病 >"<

      刪除
  6. 這篇寫得很清楚,謝謝。

    回覆刪除
  7. 請問巢狀迴歸和多元階層迴歸一樣嗎?

    回覆刪除
    回覆
    1. 不知道你所謂的巢狀迴歸是指什麼?有可能是階層線性迴歸hierarchical linear modeling,也有可能是兩個類似的迴歸模型(例如自變數都一樣,只是你把兩個模型在某個變項上的參數固定住,那麼這兩個模型就會是nested model)。

      而一般說的多元階層迴歸其實就是多元迴歸,只是實務上以hierarchical的步驟來分析,所以有「階層」的感覺。這與multilevel modeling(簡稱MLM)的「階層」概念不同。希望有回答到您的問題。

      刪除

張貼留言

歡迎留言!