潛在變量
在統計數據中,潛在變量(來自拉丁語: lateo的當前分詞,“隱藏”)是變量,只能通過其他可觀察到的變量的數學模型間接推斷出來,這些變量可以直接觀察或測量。這種潛在變量模型在許多學科中都使用,包括政治學,人口統計學,工程,醫學,生態學,物理學,機器學習/人工智能,生物信息學,化學計量學,自然語言處理,管理,心理學,心理學和社會科學。
潛在變量可能對應於物理現實的各個方面。這些原則上可以衡量,但可能不是出於實際原因。在這種情況下,通常使用隱藏變量一詞(反映了變量有意義但不可觀察到的事實)。其他潛在變量對應於抽象概念,例如類別,行為或精神狀態或數據結構。在這些情況下,可以使用術語假設變量或假設構造。
潛在變量的使用可以用來降低數據的維度。許多可觀察到的變量可以在模型中匯總以表示基礎概念,從而更容易理解數據。從這個意義上講,它們具有類似於科學理論的功能。同時,潛在變量將現實世界中可觀察到的“亞符號”數據鏈接到建模世界中的符號數據。
例子
心理學
通過因子分析方法創建的潛在變量通常代表“共享”方差,或變量“移動”的程度。沒有相關性的變量不能基於共同因素模型導致潛在構造。
- 使用因子分析推斷出“五大人格特徵”。
- 外向
- 空間能力
- 智慧“評估智慧的兩種主要手段包括與智慧有關的表現和潛在的可變措施。”
- Spearman的G或心理計量學的一般智力因素
經濟學
經濟學領域的潛在變量的例子包括生活質量,業務信心,士氣,幸福和保守主義:這些都是無法直接衡量的變量。但是將這些潛在變量與其他可觀察的變量聯繫起來,可以從可觀察到的變量的測量值推斷出潛在變量的值。生活質量是一個無法直接測量的潛在變量,因此可觀察到的變量用於推斷生活質量。衡量生活質量的可觀察變量包括財富,就業,環境,身心健康,教育,娛樂和休閒時間以及社會歸屬。
藥物
潛在的方法論用於許多醫學分支。自然而然地了解潛在變量方法的一類問題是縱向研究,其中時間尺度(例如參與者的年齡或研究基線以來的時間)與所研究的性狀沒有同步。對於此類研究,與所研究特徵同步的未觀察到的時間尺度可以建模為使用潛在變量的觀察到時間尺度的轉換。其中的例子包括疾病進展建模和生長建模(請參見框)。
推斷潛在變量
存在一系列不同的模型類和方法,這些類別和方法可以利用潛在變量,並在存在潛在變量的情況下推斷。模型包括:
分析和推理方法包括:
貝葉斯算法和方法
貝葉斯統計通常用於推斷潛在變量。
- 潛在的dirichlet分配
- 中國餐廳的過程通常用於提供對潛在類別的對象分配的先前分發。
- 印度自助餐過程通常用於對對象的潛在二進制特徵分配提供先前的分佈。