非線性混合效應模型

非線性混合效應模型構成了一類統計模型,概括了線性混合效應模型。像線性混合效應模型一樣,它們在相同統計單元內有多個測量值或在相關統計單位之間存在依賴性時特別有用。非線性混合效應模型用於許多領域,包括醫學公共衛生藥理學生態學

定義

雖然任何包含固定效果隨機效應的統計模型是非線性混合效應模型的一個示例,但最常用的模型是重複度量的非線性混合效應模型的成員

在哪裡

  • 是組/受試者的數量,
  • 是觀察的數量小組/主題,
  • 是一個特定於組的參數矢量的實用值的可區分函數和協變量矢量 ,,,,
  • 被建模為線性混合效應模型在哪裡是固定效應的向量, 是與群體相關的隨機效應的向量 , 和
  • 是描述加法噪聲的隨機變量。

估計

當模型僅在固定效應中非線性並且隨機效應是高斯時,儘管估計量的漸近性能測試統計量可能與常規的一般線性模型不同,但可以使用非線性最小二乘法進行最大似然估計。在更通用的環境中,存在幾種方法,用於在某些類別的非線性混合效應模型中進行最大樣本估計最大後驗估計- 通常在正態分佈隨機變量的假設下。一種流行的方法是Lindstrom-Bates算法,它依賴於迭代優化非線性問題,在此最佳距離周圍局部線性化模型,然後採用來自線性混合效應模型的常規方法來進行最大的似然估計。期望最大化算法的隨機近似提供了進行最大樣品估計的另一種方法。

申請

示例:疾病進展建模

非線性混合效應模型已用於建模疾病進展。在進行性疾病中,結果變量進展的時間模式可能會遵循患者之間相似的非線性時間形狀。但是,一個人的疾病階段可能不知道或僅從可以測量的內容中得到部分知名。因此,模型中可以包括一個描述個體疾病階段的潛在變量(即患者沿非線性平均曲線的位置)。

示例:建模阿爾茨海默氏病的認知能力下降

使用ProgMod R包進行縱向ADAS-COG評分的疾病進展模型的示例。

阿爾茨海默氏病的特徵是進行性認知惡化。但是,患者的認知能力和儲備率可能很大,因此在一個時間點上的認知測試通常只能用於使個人處於不同疾病階段。現在假設我們有一組縱向認知數據每個人都被歸類為具有正常認知(CN),輕度認知障礙(MCI)或癡呆症(DEM)的個體(時間) 對應於測量 )。這些縱向軌跡可以使用非線性混合效應模型對基於基線分類的疾病狀態差異進行建模:

在哪裡

  • 是模擬認知下降的平均時間凸的功能,其形狀由參數確定 ,,,,
  • 代表觀察時間(例如研究中基線以來的時間),
  • 是虛擬變量,如果個人為1 在基線時有MCI或癡呆症,否則為0,
  • 是模擬MCI和癡呆症組疾病進展差異的參數,相對於認知正常的參數,
  • 是個體疾病階段的差異相對於他/她的基線類別,
  • 是描述加法噪聲的隨機變量。

該模型的示例具有指數均值函數,該模型擬合到阿爾茨海默氏病評估量表認知子量表(ADAS-COG)的縱向測量值中。如圖所示,包括基線分類的固定效應(相對於正常認知的MCI或癡呆症)和個體連續疾病階段的隨機作用對齊認知惡化的軌跡,以揭示認知能力下降的共同模式。

示例:增長分析

伯克利成長研究的男孩的平均身高曲線估計有無扭曲。使用PAVPOP R軟件包將翹曲模型擬合為非線性混合效應模型。

生長現象通常遵循非線性模式(例如邏輯生長指數增長雙曲線生長)。諸如營養缺乏症之類的因素都可能直接影響測得的結果(例如,缺乏營養物質的生物最終會變小),但也可能是時間安排(例如,缺乏營養的生物以較慢的速度生長) 。如果模型無法解釋時間的差異,則估計的人口級曲線可能會由於生物之間缺乏同步而使更細節的細節順利如此。非線性混合效應模型可以同時建模生長結果和時機的個體差異。

示例:建模人類身高

估計人類身高和體重的平均曲線與年齡的函數以及平均周圍自然變化的模型用於創建生長圖。但是,由於遺傳和環境因素,兒童的生長可能會變得不同步。例如,青春期開始時的年齡及其相關的高度會在青少年之間有幾年的變化。因此,橫斷面研究可能會低估青春期高度突出的大小,因為年齡與生物學發育沒有同步。可以使用隨機效應對生物發育的差異進行建模描述了使用所謂的翹曲功能將觀察到的年齡映射到潛在的生物年齡 。具有此結構的簡單非線性混合效應模型由

在哪裡

  • 是代表典型兒童作為年齡函數的高度發展的功能。它的形狀由參數確定 ,,,,
  • 是孩子的年齡對應於高度測量 ,,,,
  • 是將年齡映射到生物學發展的扭曲功能以同步。它的形狀取決於隨機效應 ,,,,
  • 是描述添加劑變化的隨機變量(例如,兒童和測量噪聲之間的高度差異一致)。

有幾種用於擬合此類模型的方法和軟件包。所謂的SITAR模型可以使用扭曲功能(即仿射時間變換)(即生物年齡的添加劑變化和成熟率差異),而所謂的PavPop模型可以擬合具有平穩變化的翹曲功能的模型。後者的一個例子在框中顯示。

示例:種群藥代動力學/藥效學建模

影響攝入物質命運的基本藥代動力學過程。非線性混合效應建模可用於估計這些過程的種群級別效應,同時還對受試者之間的個體變化進行建模。

用於描述暴露響應關係(例如EMAX模型)的PK/PD模型可以作為非線性混合效應模型進行配合。混合模型方法允許建模對觀察到的結果具有非線性效應的效應的人口水平和個體差異,例如,化合物正在代謝或分佈在體內的速率。

示例:COVID-19流行病學建模

40個國家的推斷感染軌跡嚴重影響了Covid-19和Grand(人口)平均直到5月14日

非線性混合效應模型的平台可用於描述受試者的感染軌跡,並了解在主題中共享的一些共同特徵。在流行病學問題中,受試者可以是國家,州或縣等。這在估計流行病的未來趨勢的早期階段可能是特別有用的,在這種疾病的早期階段,幾乎知道有關該疾病的資訊.

示例:在帶有潛在Kriging的新位置的頁岩油井的石油生產曲線預測

通過潛在kriging獲得的石油生產率下降曲線的預測。在德克薩斯州南部的Eagle Ford頁岩水庫(左上方)的324次訓練井和兩個測試井;液壓骨折的水平井的示意圖(左下);通過潛在kriging方法(右)預測測試井的曲線

石油開發項目的最終成功取決於大量的井建成成本。至於非常規的石油和天然氣儲層,由於滲透率非常低,並且流動機制與常規儲層的流動機制截然不同,因此對井建築成本的估計通常包含高水平的不確定性,而石油公司需要對鑽探進行大量投資和井的完成階段。眾所周知,美國近期水平井的總體商業成功率為65%,這意味著3個鑽井的井中只有2個將在商業上取得成功。因此,石油工程師的關鍵任務之一是量化與頁岩儲層中的石油或天然氣產生相關的不確定性,並進一步預測新位置在新位置的新井的近似生產行為,鑑於在實際的特定完成數據之前,進行鑽井以節省大量的井建成。

可以擴展非線性混合效應模型的平台,以考慮空間關聯,通過在模型的第二階段中納入諸如高斯過程之類的地統計過程,如下所示:

在哪裡

  • 是模擬對數尺度油產量的平均時間促進速度的功能,其形狀由參數確定 。該函數是從對數到下降曲線分析中使用的速率下降曲線獲得的功能,
  • 代表從液壓壓裂的完成過程中獲得的協變量和水平方向鑽孔 - 好吧,
  • 代表該空間位置(經度,緯度) - 好吧,
  • 代表具有錯誤差異的高斯白噪聲 (也稱為掘金效應),
  • 代表具有高斯協方差功能高斯過程 ,,,,
  • 代表馬蹄形收縮之前。

在潛在水平上使用的高斯過程回歸(第二階段)最終會為曲線參數產生kriging預測指標決定了平均曲線的形狀在日期級別(第一級)。由於Kriging技術已在潛在水​​平上採用,因此該技術稱為潛在Kriging。右面板顯示了對南德克薩斯州Eagle Ford頁岩儲層中的兩個測試井的潛在Kriging方法的預測結果。

貝葉斯非線性混合效應模型

使用貝葉斯非線性混合效應模型的貝葉斯研究週期:(a)標準研究週期和(b)貝葉斯特定的工作流程。

貝葉斯分層建模的框架經常用於不同的應用中。特別是,貝葉斯非線性混合效應模型最近受到了極大的關注。貝葉斯非線性混合效應模型的基本版本表示為以下三階段:

階段1:個人級別模型

第2階段:人口模型

階段3:先驗

這裡, 表示 - 在時間點的主題 , 和 - 協變量的 - 主題。模型中涉及的參數用希臘字母編寫。 是由已知函數參數化的 - 維矢量 。通常, 是“非線性”功能,描述了個體的時間軌跡。在模型中, 分別描述個體內的變異性和個體之間的變異性。如果不考慮階段3:則該模型將還原為常見的非線性混合效應模型。


貝葉斯非線性混合效應模型應用中的一項核心任務是評估後部密度:


右側的面板使用貝葉斯非線性混合效應模型顯示貝葉斯研究週期。使用貝葉斯非線性混合效應模型的研究週期包括兩個步驟:(a)標準研究週期和(b)貝葉斯特定的工作流程。標準研究週期涉及文獻綜述,定義問題並指定研究問題和假設。貝葉斯特定的工作流包括三個子步驟:(b) - (i)基於背景知識和事先啟發的先前分佈進行正式分佈; (b) - (ii)根據非線性函數確定似然函數 ; (b) - (iii)進行後推斷。由此產生的後推理可用於開始新的研究週期。

也可以看看