聯合測量理論

聯合測量理論(也稱為聯合測量添加劑聯合測量)是一種一般的,正式的連續數量理論。它是由法國經濟學家杰拉德·德比魯(GérardDebreu,1960)和美國數學心理學家R. Duncan Luce和統計學家John TukeyLuce&Tukey 1964 )獨立發現的。

該理論涉及至少兩個自然屬性AX的情況,非交互性與第三個屬性無關。不需要AXP是數量。通過P之間的特定關係,可以確定PAX是連續數量。因此,在經驗環境中,連接測量的理論可用於量化屬性,在這種情況下,不可能使用並排操作或串聯結合屬性的水平。因此,在邏輯上可以量化心理屬性,例如態度,認知能力和效用。這意味著對心理屬性的科學測量是可能的。也就是說,就像物理量一樣,心理數量的大小可能表示為實際數字和單位幅度的產物。

但是,在心理學中的聯合測量理論的應用受到限制。有人認為,這是由於涉及的正式數學水平高(例如Cliff 1992 ),並且該理論無法說明心理學研究中通常發現的“嘈雜”數據(例如, Perline,Wright&Wainer 1979 )。有人認為, Rasch模型是結合測量理論的隨機變體(Eg, Brogden 1977Embretson&Reise 2000Fischer 1995 ; Keats 1967; Kline 1967 ; Kline 1998 ; Scheiblechner 1999; Scheiblechner 1999 ),但是,這是有爭議的(EG ,EG都存在爭議(EG,EG是有爭議的(EG) ,Karabatsos,2001年; Kyngdon,2008年)。在過去的十年中,已經開發了對結合測量的取消公理進行概率測試的秩序限制方法(例如,Karabatsos,2001; Davis-Stober,2009)。

聯合測量理論與聯合分析有關,這是一種用於估計添加劑效應函數參數的統計示例方法。向受訪者提出了不同的多屬性刺激,並使用不同的方法來衡量其對所提出的刺激的偏好。使用基於替代回歸的工具估算實用程序函數的係數。

歷史概述

在1930年代,英國科學發展協會成立了弗格森委員會,以調查對心理屬性進行科學衡量的可能性。英國物理學家和測量理論家諾曼·羅伯特·坎貝爾(Norman Robert Campbell)是該委員會的有影響力成員。坎貝爾(Campbell)和委員會在其最終報告(Ferguson,1940年)中得出結論,由於心理屬性無法維持串聯操作,因此這種屬性不能連續數量。因此,無法科學地測量它們。這對心理學產生了重要的影響,其中最重要的是哈佛心理學家斯坦利·史密斯·史蒂文斯(Stanley Smith Stevens)在1946年創作的測量理論。史蒂文斯(Stevens)的非科學測量理論在心理學和行為科學方面被廣泛認為是確定性的( Michell 1999

儘管德國數學家奧托·霍爾德(OttoHölder)(1901年)預期了聯合測量理論的特徵,但直到盧斯·託基(Luce&Tukey)的1964年開創性論文出版時,該理論才獲得了第一個完整的展示。 Luce&Tukey的演講是代數,因此被認為比Debreu(1960)的拓撲工作更一般,後者是前者的特殊情況( Luce&Suppes 2002 )。在《數學心理學雜誌》的第一期文章中, Luce&Tukey 1964證明,通過結合測量理論,可以量化無法串聯的屬性。因此,NR Campbell和Ferguson委員會被證明是錯誤的。給定的心理屬性是連續數量,是邏輯上連貫且經驗檢驗的假設。

出現在同一篇期刊下一期中的是Dana Scott (1964)的重要論文,他提出了層次結構的取消條件,以間接測試可解訪性和阿基米德公理,以及David Krantz(1964年),並連接了Luce&Tukey Work的工作。霍爾德(1901)的霍爾德。

工作很快著重於擴展聯合測量理論,以涉及兩個屬性。 Krantz 1968Amos Tversky (1967)開發了被稱為多項式聯合測量的方法, Krantz 1968提供了一個構圖,可以構建三個或更多屬性的聯合測量結構。後來,結合測量理論(在其兩個變量,多項式和n個組件​​形式中)通過出版了第一卷的測量基礎,獲得了徹底而高度技術的處理,克蘭茲,盧斯,特維斯基和哲學家帕特里克在這些基礎上提供了這些方法。 ( Krantz等,1971 )。

克蘭茲(Krantz)等(1971)出版後不久,工作著重於為聯合測量理論開發“誤差理論”。進行了研究,研究了僅支持單個取消和單一和雙重取消的聯合陣列數量( Arbuckle&Larimer 1976McClelland 1977 )。後來的枚舉研究集中在多項式聯合測量上( Karabatsos&Ullrich 2002 ; Ullrich&Wilson 1993 )。這些研究發現,如果已經確定了三個以上的成分屬性,則非常不可能隨機滿足聯合測量理論的公理。

喬爾·米歇爾(Joel Michell,1988)後來發現,雙重取消公理的“無測試”測試是空的。因此,雙重取消的任何實例都是公理的接受或拒絕。米歇爾(Michell)目前還寫了《聯合測量理論》(Michell 1990)的非技術介紹( Michell 1990 ),其中還包含一個基於Scott(1964)工作的高級取消條件的模式。本·理查茲(Ben Richards)(Kyngdon&Richards,2007年)使用Michell's模式,發現三重取消公理的某些實例與單個取消公理相矛盾,這是“不一致的”。此外,他確定了三重取消的許多實例,如果支持雙重取消,這些實例在瑣碎的情況下是正確的。

聯合測量理論的公理不是隨機的。鑑於取消公理對數據施加的序數約束,必須使用限制的推理方法( Iverson&Falmagne 1985 )。喬治·卡拉巴索斯(George Karabatsos)和他的同事(Karabatsos,2001; Karabatsos&Sheu 2004 )開發了一種用於心理測量應用的貝葉斯馬爾可夫鏈蒙特卡洛方法。 Karabatsos&Ullrich 2002展示了該框架如何擴展到多項式聯合結構。 Karabatsos(2005)用他的多項式Dirichlet框架概括了這項工作,這使得能夠對許多數學心理學的許多非故事理論進行概率測試。最近,克林汀·戴維斯 - 斯托伯(Clintin Davis-Stober,2009年)開發了一個經常限制推理的框架,也可以用於測試取消公理。

以色列 - 美國心理學家Daniel KahnemanAmos Tversky提出的前景理論,也許最引人注目的(Kyngdon,2011年)是對聯合測量理論的使用(Kahneman&Tversky,1979年)。前景理論是一種在風險和不確定性下做出決策的理論,它解釋了選擇行為,例如Allais悖論。大衛·克蘭茲(David Krantz)使用聯合測量理論為前景理論寫了正式的證據。 2002年,卡尼曼獲得了前景理論經濟學紀念獎(Birnbaum,2008年)。

測量和定量

測量的經典 /標准定義

物理計量學中,測量的標准定義是估計連續數量的大小與單位幅度之間相同類型之間的比率(de Boer,1994/95; Emerson,2008)。例如,“彼得的走廊為4 m長”,表示對迄今未知長度(走廊的長度)的測量值是單元(這種情況下的儀表)與走廊長度的比率。在該術語的嚴格數學意義上,數字4是一個實數。

對於其他一些數量,不變是屬性差異之間的比率。例如,考慮溫度。在熟悉的日常情況下,使用在華氏或攝氏量表中校準的儀器來測量溫度。這樣用這種儀器實際測量的是溫度差異的幅度。例如,安德斯·塞爾西烏斯(Anders Celsius)將攝氏量表的單位定義為海平面凍結和沸點之間溫度差異的1/100。中午溫度測量20攝氏度僅僅是中午溫度的差異,而冷凍水的溫度除以攝氏片的差異和冷凍水的溫度。

正式表達,科學的測量是:

其中q是數量的大小, r是一個實數,[ q ]是同類單位幅度。

ext

長度是自然串聯操作的數量。也就是說,我們可以在剛性鋼棒的並排時長度結合,以便很容易觀察到長度之間的添加關係。如果我們有四個1 m長的此類桿,則可以將它們端到頭放置以產生4 m的長度。能夠連接的數量稱為廣泛數量,包括質量,時間,電阻和平面角。這些被稱為物理和計量學中的基礎數量。

溫度是沒有串聯操作的數量。我們不能在20°C的另一桶水中倒入40°C的溫度水,並預計有一定數量的水溫度為60°C。因此,溫度是密集的數量。

心理屬性(如溫度)被認為是密集的,因為沒有發現這種屬性的連接。但這並不是說這種屬性是不可量化的。聯合測量理論提供了這樣做的理論手段。

理論

考慮兩個自然屬性Ax 。尚不清楚AX是連續數量,或者兩者都是連續數量。令ABC表示三個獨立的,可識別的a ;令xyz表示x的三個獨立,可識別的水平。第三個屬性P ,由AX的九個有序對組成。也就是說,( ax ),( by ),...,( cz )(見圖1)。 AXP的量化取決於p的關係的關係的行為。這些關係以聯合測量理論為公理。

單一取消或獨立公理

圖一:單個取消公理的圖形表示。可以看出a > b是因為( ax )>( bx ),( ay )>( by )和( az )>( bz )。

單個取消公理如下。當且僅當A中的所有AB中的所有A和B中的所有A和XX ,( AX )>( BX )中的所有X中的每個w中的每個W中的每個W中的每個W中的每個W中的每個w)在x中的每個w中都能滿足單個取消的關係。( aw )> ( bw ) 。類似地,對於xa中的所有xy ,( ax )>( ay )在a的每個d中暗示( dx )>( dy )中的每個d 。這意味著,如果訂購了任何兩個級別, ab ,則該訂單都能保持不變。相對於每個級別的每個級別, X的任意兩個級別的XY都相同。

單一取消是所謂的,因為兩個級別P的單個公共因素取消,以在其餘元素上保留相同的序數關係。例如, A取消不平等( ax )>( ay ),因為它是雙方共有的,而x > y 。 Krantz等人(1971年)最初稱之為這種公理獨立性,因為兩個屬性級別之間的序數關係獨立於其他屬性的所有級別。但是,鑑於獨立一詞會引起與獨立性統計概念的混淆,因此單一取消是可取的術語。圖一個是單個取消實例的圖形表示。

對於屬性AX的量化,單個取消公理的滿意度是必要但不足的。它僅證明AXP的級別是排序的。在非正式的情況下,單個取消不能充分限制量的p級別以量化AX的級別。例如,考慮有序對( ax ),( bx )和( by )。如果單一取消持有,則( ax )>( bx )和( bx )>( by )。因此,通過傳遞性( ax )>( by )。後兩個有序對之間的關​​系,非正式地是左傾角,是由單個取消公理的滿意度決定的,所有“左傾斜對角線”關係的所有關係也是如此

雙取消公理

圖兩個:雙重取消的Luce – Tukey實例,其中隨之而來的不平等(斷線箭頭)並不與兩個先例不平等(實線箭頭)的方向相矛盾,因此支持公理。

單個取消不能確定p上的“右傾角”關係的順序。即使通過傳遞性和單一取消,也確定( ax )>( by ),( ay )和( bx )之間的關係仍然不確定。可能是( bx )>( ay )或( ay )>( bx ),這種歧義不能保持尚未解決。

雙重取消公理涉及p上的一類這種關係,在p上,兩個先決不平等的共同術語取消了產生第三個不平等的情況。考慮圖2表示雙重取消的實例。雙重取消實例的前述不平等是:

鑑於:

當且僅當

當且僅當 , 它遵循:

取消通用術語導致以下結果:

因此,只有在ax是數量時,雙重取消才能獲得。

只有在隨之而來的不平等與先前的不平等相矛盾時,就可以滿足雙重取消。例如,如果隨之而來的不平等是:

或者,或者

然後將違反雙重取消( Michell 1988 ),無法得出結論, AX是數量。

雙重取消涉及p上“右傾斜對角線”關係的行為,因為這些關係在邏輯上並不需要單次取消。 ( Michell 2009 )發現,當AX的水平接近無窮大時,右傾斜關係的數量是p時總關係數量的一半。因此,如果ax是數量,則p的關係數量的一半是由於Ax和一半的序數關係是由於AX上的加性關係引起的( Michell 2009 )。

雙重取消實例的數量取決於ax識別的級別數量。如果有xn級和mn級別,則雙重取消的實例數為n ! × m !。因此,如果n = m = 3,則為3! ×3! = 6×6 = 36個實例,總共取消。但是,如果單一取消是正確的,則除6個實例外,所有這些實例都是如此,如果這6個實例中的任何一個是正確的,那麼所有這些實例都是正確的。一個這樣的例子就是圖2中所示。 ( Michell 1988 )稱這是雙重取消的Luce -Tukey實例。

如果首先對一組數據進行了單次取消的測試,則僅需要測試雙重取消的Luce -Tukey實例。對於xn級和mn級別,luce -tukey雙重取消實例的數量是 。例如,如果n = m = 4,則有16個這樣的情況。如果n = m = 5,則有100。a和x級別數量越大,隨機滿足取消公理的可能性越小( Arbuckle&Larimer 1976 ; McClelland 1977 )和越嚴格的測試。數量的連接測量的應用變為。

可溶性和阿基賽馬公理

圖三:取消三重的實例。

單一和雙重取消公理本身不足以建立連續數量。還必須引入其他條件以確保連續性。這些是可溶性阿基賽馬條件。

解決性意味著對於ABXY的任何三個元素,第四個存在的存在,以便求解方程A X = B Y ,因此是條件的名稱。可溶性本質上是每個級別pa中具有一個元素和x中的元素的要求。解決性揭示了有關AX的水平 - 它們要么像實數一樣緻密,要么像整數一樣間隔( Krantz等,1971 )。

Archimedean條件如下。讓成為一組連續的整數,無論​​是有限的還是無限的,正或負的。當且僅當x中存在xy時, xy中的x和y時,形成標準序列的級別,以及所有整數ii + 1 in i ::

這基本上意味著,如果x大於y ,例如,可以找到A級別的A級別,這使兩個相關的有序對, P的級別相等。

阿基米德條件認為沒有無限最大的P級別的P,因此AX沒有最大的水平。這種情況是古希臘數學家阿基米德(Archimedes)給出的連續性的定義,他們寫道:“進一步的線條,不平等的表面和不平等的固體,就可以使自己添加到本身時,越越越少。超出彼此相當的那些分配的幅度”(在球體和圓柱體上,書I,假設5)。阿基米德(Archimedes)認識到,對於連續數量的任何兩個幅度,一個比另一個較小,較小的次數可以乘以整數,以使其等於更大的幅度。歐幾里得將阿基米德條件表示為元素V的公理,其中歐幾里得列出了他的連續數量和測量理論。

由於它們涉及無限概念,因此在任何有限的經驗情況下,可溶解性和阿基賽公理不適合進行直接測試。但這並不意味著根本不能在經驗上測試這些公理。斯科特(1964)的有限取消條件可用於間接測試這些公理。這種測試的範圍是經驗確定的。例如,如果AX都有三個級別,則在Scott(1964)層次結構內取消公理,間接測試可溶性和Archimedeaness是雙重取消的。在四個級別的情況下,它是三重取消(圖3)。如果滿足此類測試,則可能在AX上構建標準序列。因此,這些屬性可能按照實際數字稠密,也可以按照整數均等( Krantz等,1971 )。換句話說, AX是連續數量。

與測量的科學定義有關

結合測量條件的滿意度意味著AX水平的測量值可以表示為幅度差異之間的比率或比率之間的比率。鑑於大多數行為科學家認為他們的測試和調查“測量”屬性在所謂的“間隔量表”上,因此最常被解釋為後者( Kline 1998 )。也就是說,他們認為測試不能識別絕對零級的心理屬性。

正式地,如果pax形成一個加性聯合結構,則從ax中存在函數,使得x :x: x :x: x :x: y中的ab

如果是否滿足上述表達的另外兩個實際有價值的功能,存在真正有價值的常數滿足:

那是, 是對AX唯一的測量值(即每個是史蒂文斯(Stevens)(1946年)中的間隔比例)。該結果的數學證明是在( Krantz等,1971 ,第261-6頁)中給出的。

這意味著AX的水平是相對於某種單位差的幅度差異。 P的每個級別是AX的級別之間的差異。但是,從文獻中尚不清楚如何在加性聯合上下文中定義單元。 van der Ven 1980提出了一種結合結構的縮放方法,但他也沒有討論該單元。

但是,聯合測量的理論不僅限於差異的量化。如果每個p的級別是A級和x級的乘積,則P是另一個不同的數量,其測量值表示為每單位幅度x大小。例如,一個由質量和x組成,由體積組成,然後p由以每單位體積質量測量的密度組成。在這種情況下,在應用聯合測量之前,似乎必須將一個A和一個X的一個級別識別為暫定單位。

如果每個級別的pA級和x級的總和,則PAX的數量相同。例如, ax是長度,因此必須為p 。因此,這三個必須在同一單元中表示。在這種情況下,似乎必須將AX的水平暫時識別為單位。因此,聯合測量的應用似乎需要對相關自然系統的一些先前的描述理論。

聯合測量的應用

聯合測量理論的經驗應用稀疏( Cliff 1992Michell 2009 )。

已經進行了兩次取消的經驗評估。其中, Levelt,Riemersma&Bunt 1972評估了雙耳響度的心理物理學的公理。他們發現雙重取消公理被拒絕。 Gigerenzer&Strube 1983進行了類似的研究,並進行了複製的Levelt等。 (1972)發現。 Gigerenzer&Strube 1983觀察到,雙重取消的評估涉及相當大的冗餘,使其經驗測試複雜化。因此, Steingrimsson&Luce 2005評估了等效的Thomsen條件公理,從而避免了這種冗餘,並發現了雙耳響度支持的特性。 Luce&Steingrimsson 2011年,總結了該日期的文獻,包括觀察到湯姆森條件的評估也涉及經驗挑戰,他們發現他們發現聯合交換性公理對此進行了修復,它們表明它們等同於Thomsen條件。 Luce&Steingrimsson 2011年發現,雙耳的響度和亮度支持聯合通勤。

米歇爾(Michell)1990將理論應用於瑟斯通(1927)的配對比較理論,多維縮放和庫姆斯(1964)一維發展理論。他只有Coombs(1964)理論才能獲得取消公理的支持。但是,Michell(1990)在測試Thurstone的理論和多維縮放方面採用的統計技術並未考慮取消公理所施加的序數約束( Van der Linden 1994 )。

Johnson 2001 ),Kyngdon(2006),Michell(1994)和( Sherman 1993測試了通過使用Coombs'(1964)理論獲得的刺激性中點訂單的取消公理一維的發展。 COOMB的所有三項研究中的理論均應用於六個陳述的一組。這些作者發現,滿足公理的滿足,但是這些是偏向積極結果的應用。使用六個刺激,滿足雙重取消公理的刺激中點階的可能性為.5874(Michell,1994)。這不是不太可能的事件。 Kyngdon&Richards(2007)採用了八個陳述,發現中點命令拒絕了雙重取消條件。

Perline,Wright&Wainer 1979將聯合測量應用於有罪的假釋問捲和從丹麥部隊收集的情報測試數據。他們發現在假釋問卷數據中對取消公理的侵犯很大,但在智能測試數據中卻沒有。此外,他們記錄了所謂的“無測試”雙重取消實例。正確地將這些解釋為支持雙重取消的實例(Michell,1988), Perline,Wright&Wainer 1979的結果比他們認為的要好。

Stankov&Cregan 1993將聯合測量應用於序列完成任務的性能。它們的聯合陣列( x )的列是由在信件系列完成任務中增加工作記憶位置的數量來確定工作記憶容量的需求。這些行是由動機級別( a )定義的,該級別由可用於完成測試的不同次數組成。他們的數據( P )包括完整時間和串聯正確數量正確。他們發現了對取消公理的支持,但是,他們的研究偏向著聯合陣列的小尺寸(3×3是大小),而統計技術沒有考慮到取消公理所施加的順序限制。

Kyngdon(2011)使用Karabatsos(2001)的訂單限制推理框架來測試閱讀項目響應比例的連接矩陣( P ),其中考生閱讀能力包括結合陣列的行( a )和形成的閱讀項目的難度數組( x )的列。通過RAW總測試評分確定了閱讀能力的水平,並且通過閱讀的Lexile框架確定了閱讀項目難度的水平( Stenner等,2006 )。 Kyngdon發現,僅通過與假定的項目難度測量值不一致的方式來獲得取消公理的滿意度。 Kyngdon還使用多項式聯合測量測試了模擬能力測試響應數據。數據是使用Humphry的擴展參考Rasch模型生成的( Humphry&Andrich 2008 )。他發現了與三個變量中的分佈多項式聯合結構一致的分佈,單和雙重取消的支持( Krantz&Tversky 1971 )。

也可以看看