Friday, September 30, 2005

 

Who is the year of MVP (most valuable physician)

醫師是診治病人團隊的中心,身負著醫療品質、病人安全、甚至是健保費用撙節與防範健保不當刪減醫療費用等的責任。如何遴選出年度最有價值的醫師,是醫院管理者所面臨的課題。
利用健保住院2003年1至8月份申報資料,對某一醫學中心71位醫師6525件一般案件住院病例,歸判出DRGs,再以WINSTEPS電腦軟體進行各費用平均每日申報金額的Rasch部份給分模式之試題分析,以(1)效率及(2)費用核減風險防範(FIT)的二能力構面,做為遴選最有價值(MVP)醫師的依據。研究發現17項日費用(效率能力試題),可以分作二個向度因素。分別再對此二效率向度因素的FIT統計值納入單一向度檢測分析,以估計出各住院病例的FIT能力,將效率及FIT能力取其平均而為年度MVP選拔的評分標準。研究發現該醫院的年度MVP由一般外科的醫師獲得(logit=1.20),各醫療科別間的效率或FIT能力及總得分皆呈顯著性的差異(p<.001)。住院天數與FIT、效率或MVP總分呈負相關;FIT 分數與MVP總分高度相關(Pearsonγ=0.84)而與其他呈負相關,相對於醫療總費用對其他的相關性呈明顯的對比,表示效率與費用呈正比而與住院天數呈反比。FIT愈佳的病歷有費用或住院天數愈低的表徵。Rasch分析提供醫院選拔健保年度MVP醫師及醫療費用或成本分析上一個簡易可行的工具,後續研究可對健保實際核減病例,再參考本研究的FIT敏感指數,以實際驗證其關聯程度。

Friday, September 23, 2005

 

誰是醫院的健保年度優良醫師?

如果醫院要選拔醫院的健保醫師,要如何用Winsteps去完成它?
我將1-8月份的健保申報資料各項費用(2069筆已歸納出來的DRG案件),將費用檢測(infit及outfit介於.5及1.5間),建立了三個單一向度的費用構面,利用Winsteps可以完成2069筆的各項測量logit分數,也可以將醫師的三構面分數予以彙整成為1人三個分數(設定分數愈高愈好,負荷愈重).
因為申報費用高的案子,也要觀察它的被可能核減費用, 我以2069筆三構面的各個各醫師的infit及outfit值為一個測量評分值,四捨五入而成為六試題的0-10多點計分,因此又可評量出一個測量logit分數(設定分數愈低愈好,非預期分數與實際分數愈接近),藉此完成115位臨床醫師的四個分數予以平均之(因為是等距logit分數), 排名後即可認定那醫師最佳, 各科間差異分析,及各DRG或MDC間的差異情形,於各醫院健保費用管理幫助,如何?

Thursday, September 22, 2005

 

試題反應理論(IRT)的樣本獨立與試題獨立

我一直搞不懂試題反應理論(IRT)的樣本獨立與試題獨立之觀念(有異於傳統測驗理論的樣本依賴床與試題依賴), 中正大學王文中教授說:"樣本獨立的意思是說:「如果資料吻合模式(含其他IRT模式)的話,那麼題目的特性(如難度、鑑別力參數等)的估計,不會受到樣本特性(如性別、能力高低)的干擾。」同理,測驗獨立的意思是說「如果資料吻合模式(含其他IRT模式)的話,那麼考生能力或特質的估計,不會受到測驗特性(如很難或很簡單)的干擾。」
從以上得說明,可以發現有項前提必須成立:「如果資料吻合模式」。但我們如何得知此項前提是否成立呢?我們的作法是反其道而行(就像統計學中的假設檢定),以邏輯中的「若p則q」而言,那麼「若非q則非p」。亦即:「如果題目特性的估計,會受到樣本特性的干擾,那麼資料就不吻合模式。」這就是DIF的檢測。如果DIF發生,就表示資料不吻合模式。此外「若q,雖未必p,不過傾向於p」。即DIF沒有發生,我們傾向於認為資料吻合模式。
同理,「如果考生能力的估計,會受到測驗特性(如很難或很簡單)的干擾,那麼資料就不吻合模式」。在實用上,這個檢測比較少進行。不過很容易用winsteps(或其他軟體進行之),例如故意將測驗拆成兩份(如簡單的一份,很難的一份),然後利用這兩份測驗去估計考生能力,如果發現所估計出來的兩份能力估計值差異很大的話,就表示資料就不吻合模式,因此沒有測驗獨立。不過要記住此時要限制考生能力的估計值為0,而不是測驗難度的平均為0,以取得共同的量尺,進行比較。
在這樣的邏輯下,如果有發現DIF,或兩次測驗的能力估計值很相近,那麼我們就暫時接受「資料與模式吻合」的假設。請注意這是暫時接受,並不是確認。畢竟我們無法窮盡所有的DIF分析,所有的測驗組合。亦即我們暫時接受「虛無假設」,而不是證實了虛無假設。
除了這兩種檢測方法外,還有很多方法,如infit & outfit, 如殘差主成分分析。這些檢測的邏輯都是一樣的:「如果不好結果的發生,就表示資料不吻合模式。反之,如果沒有不好的結果發生,就暫時說資料吻合模式。」

Wednesday, September 21, 2005

 

Rasch能否協助做各部門的成本分析

我們常困惑著各單位的成本比較除與自己以前資料比,或是與標準(預算)資料比較外,難道不同單位間就不能互相比較嗎? 為何學生考試可以是不同個體或群體間的比較?因此Rasch也許可以一試,也就是各成本科本是試題,成本單位是個人, 納入考試,可以估計出theta(能力),試題難度,以及infit及outfit等參數,藉此比較,不是可以獲知那單位那科目偏高或是偏低,也就是應答對而答錯,或是應答錯而答錯的個人對應出來的試題來了...你說可行否..一試即知..因為是電腦選出的"合法"異常,常以分析及比較,總比亂分析與不比較要好多了...
範例分析介紹

 

如同110公尺高欄比賽,那一欄跨過與不過而統計出各欄(試題)的難易度



Microsoft的Excel介紹試題反應理論Rasch分析(http://winsteps.blogspot.com/) 由此連結網,可以獲知如何以試題及受試者的答題反應得到其難度及能力,我們要找異常,通常是以主觀的閾值設定為標準,因為標準設定的不同,而有了不同的結果.因此,發現了winsteps部落格介紹此能力及困難度計算過程, 對初學者的了解一定有幫助..好像是迴歸預測,也像是最小平方法,反正是用它來估計應答對而答錯或是應答錯而答錯的異常,因此不是比主觀認定的閾值設定客觀多了.
如同110公尺高欄比賽,那一欄跨過與不過而統計出各欄(試題)的難易度,當名次出來了,第一名,第二名不是所關心的,我們關心"應答對而答錯或是應答錯而答錯的異常",因此,每一人有個標準誤,而不像一般測驗只有一個試卷標準誤...試題反應理論除可估計那位醫師申報好與壞,當然也可以分析出那一個費用(試題)的偏高或偏低了---它是客觀有統計意義的分析..軟體不貴,學起來慢慢成型....
www.eddata.com/resources/publications/EDS_Rasch_Demo.xls
Adding Microsoft's credibility and consequent publicity would give Rasch methodology a boost and increase the size of the Rasch pie. Bigger pie = bigger slices for everyone.

Monday, September 19, 2005

 

Rasch Analysis Workshop-Introduction Course on Health care

Rasch Analysis Workshop-Introduction Course on Health care

This page is powered by Blogger. Isn't yours?