插值

數值分析數學字段中,插值是一種估計,是一種基於離散的已知數據點範圍構建(查找)新數據點的方法。

工程科學中,通常具有許多數據點,通過採樣實驗獲得,這代表了自變量數量有限值的函數值。通常需要插入;也就是說,估計該函數對自變量的中間值的值。

一個緊密相關的問題是簡單函數對複雜函數的近似。假設已知一些給定功能的公式,但太複雜了,無法有效評估。可以將來自原始函數的一些數據點插值來產生更簡單的函數,該功能仍然很接近原始功能。最初的增益可能超過插值誤差的損失,並在計算過程中提供更好的性能。

表體上有限點的插值。紅色的點通過僅從紅點推導的藍色插值樣條曲線連接。插值曲線的多項式公式要比原始表附外曲線簡單得多。

例子

該表提供了未知函數的一些值。

表中給出的數據點圖
0 0
1 0 . 8415
2 0 . 9093
3 0 . 1411
4 −0 . 7568
5 −0 . 9589
6 −0 . 2794

插值提供了一種估計中間點功能的方法,例如

我們描述了一些插值方法,在諸如:準確性,成本,所需的數據點數量以及所得插值功能的平滑度之類的屬性上有所不同。

分段恆定插值

分段恆定插值或最近的鄰居插值

最簡單的插值方法是找到最近的數據值,並分配相同的值。在簡單的問題中,這種方法不太可能使用,因為線性插值(見下文)幾乎同樣容易,但是在較高維度的多元插值中,這可能是其速度和簡單性的有利選擇。

線性插值

用線性插值疊加的數據圖

最簡單的方法之一是線性插值(有時稱為LERP)。考慮上述估計F (2.5)的示例。由於2.5在2到3之間的中間位置,因此在F (2)= 0.9093和F (3)= 0.1411之間進行F (2.5)中間是合理的,得出0.5252。

通常,線性插值需要兩個數據點,例如( x ay a )和( x by b ),插值由以下方式給出:

以前的方程式指出,新界線的斜率與與之間的斜率相同

線性插值快速簡便,但不是很精確。另一個缺點是插值在x k點沒有可區分

以下錯誤估計表明,線性插值不是很精確。表示我們要通過g插入的函數,並假設x位於x ax b之間,並且g是連續差異的兩倍。那麼線性插值誤差為

用文字說,誤差與數據點之間距離的平方成正比。其他一些方法中的誤差,包括多項式插值和样條插值(如下所述),與數據點之間的距離的較高功率成正比。這些方法還會產生更光滑的插值。

多項式插值

應用多項式插值的數據圖

多項式插值是線性插值的概括。請注意,線性插值是線性函數。現在,我們用更高程度多項式代替了該插值。

再次考慮上面給出的問題。以下第六級多項式經歷了所有七個點:

替換x = 2.5,我們發現f (2.5)= 〜0.59678。

通常,如果我們有n個數據點,則最多有一個n -1的多項式度過所有數據點。插值誤差與數據指向功率n之間的距離成正比。此外,插值是多項式,因此是無限的。因此,我們看到多項式插值克服了線性插值的大多數問題。

但是,多項式插值也有一些缺點。與線性插值相比,計算插值多項式在計算上是昂貴的(請參閱計算複雜性)。此外,多項式插值可能表現出振盪性偽像,尤其是在終點(請參閱Runge的現象)。

與線性插值不同,多項式插值可以估計樣品範圍內的局部最大值和最小值。例如,上面的插值在x≈1.566fx )≈1.003和x≈4.708fx )≈ -1.003時具有局部最大值。但是,這些最大值和最小值可能會超過函數的理論範圍。例如,始終為正的函數可能具有帶負值的插值,因此其逆值包含錯誤的垂直漸近線

更一般而言,所得曲線的形狀,尤其是對於獨立變量的非常高或低的值,可能與常識背道而馳。也就是說,對生成數據點的實驗系統的了解。可以通過使用樣條插值或限制對Chebyshev多項式的關注來減少這些缺點。

樣條插值

使用樣條插值的數據圖

線性插值使用每個間隔[ X KX K+1 ]的線性函數。樣條插值在每個間隔中使用低度多項式,並選擇多項式零件使它們平滑地融合在一起。所得功能稱為樣條。

例如,天然立方樣條分段立方體,並且連續兩次可區分。此外,其第二個導數在終點為零。上表中表中點的天然立方樣條插值由

在這種情況下,我們得到F (2.5)= 0.5972。

像多項式插值一樣,樣條插值會比線性插值較小,而與多項式插值中使用的高度多項式相比,插值更光滑且更容易評估。但是,基礎功能的全球性質導致不良條件。通過使用緊湊型支持的花鍵完全緩解這種情況,例如在boost.math中實現並在kress中進行了討論。

模擬插值

根據田野的基本離散化,可能需要不同的插值。與其他插值方法相反,該方法估算了目標點的函數,模擬插值評估了目標線,區域或體積上的磁場的積分,具體取決於場的類型(標量,矢量,偽矢量或偽符號)。

模擬插值的一個關鍵特徵是滿足了矢量計算身份,包括Stokes的定理發散定理。結果,模擬插值保守的線,面積和體積積分。例如,在插值電場時,線積分的保護可能是可取的,因為線積分在集成路徑的端點處產生電勢差。模擬插值確保估計電場的線積分的誤差與通過在整合路徑的末端插值電勢獲得的誤差相同,而不管集成路徑的長度如何。

線性雙線性三線性插值也被認為是模擬物,即使是保守的場值(不是場的積分)。除線性插值外,可以將面積加權插值視為開發的第一個模擬插值方法之一。

功能近似

插值是近似函數的常見方法。給定具有一組點的函數可以形成一個函數,以使得(即,在這些點上插值)。通常,插值不必是一個良好的近似值,但是有一個眾所周知的,通常是合理的條件。例如,如果(四次連續區分),則立方樣條插值的誤差由位置和常數綁定。

通過高斯流程

高斯過程是一種強大的非線性插值工具。許多流行的插值工具實際上等同於特定的高斯流程。高斯過程不僅可以用於擬合精確通過給定數據點的插入劑,而且還可以用於回歸。也就是說,用於通過嘈雜的數據擬合曲線。在地統計學社區中,高斯過程回歸也被稱為Kriging

其他形式

其他形式的插值可以通過選擇不同類別的插值來構建。例如,使用padé近似值通過合理函數進行有理插值,而三角插值是使用傅立葉序列通過三角多項式插值的。另一種可能性是使用小波

如果數據點的數量是無限的,或者如果要插值的函數具有緊湊的支持,則可以使用Whittaker -Shannon插值公式

有時,我們不僅知道我們要在某些時候要插值的函數的值,而且知道其衍生物的價值。這導致了Hermite插值問題。

當每個數據點本身是一個函數時,將插值問題視為每個數據點之間的部分對流問題可能會很有用。這個想法導致運輸理論中使用的位移插值問題。

在較高的維度中

比較一些1和二維插值。黑色和紅色/黃色/綠色/藍色點分別對應於插值點和相鄰的樣品。它們在地面上方的高度對應於它們的值。

多元插值是多個變量的函數的插值。方法包括雙線性插值和雙層插值,並在三個維度上進行三線性插值。它們可以應用於網格或分散的數據。模擬插值概括到其中的維空間。

在數字信號處理中

在數字信號處理的域中,術語插值是指將採樣數字信號(例如採樣音頻信號)轉換為較高采樣率( UPSMPLID )的過程頻率限制的脈衝信號)。在此應用程序中,有一個特定的要求,即保留原始信號的諧波內容,而不會在信號原始信號上方產生原始信號的別名諧波內容(即原始信號樣本速率的FS/2高於FS /2) 。關於該主題的早期且相當基本的討論,可以在Rabiner和Crochiere的書籍多流行數字信號處理中找到。

相關概念

術語外推用於在已知數據點範圍內找到數據點。

曲線擬合問題中,插值必須精確地通過數據點的限制是放寬的。只需要盡可能接近數據點(在其他一些約束中)。這需要參數化潛在的內介劑並具有某種方法來測量誤差。在最簡單的情況下,這會導致最小二乘近似。

近似理論研究瞭如何通過某些預定類別的另一個函數找到對給定功能的最佳近似,以及該近似值的良好。顯然,這產生了插值能如何近似未知函數的結合。

概括

如果我們將拓撲空間中的變量視為變量,而函數映射到Banach空間,則該問題將被視為“操作員的插值”。有關操作員插值的經典結果是Riesz – Thorin定理和Marcinkiewicz定理。隨後還有許多其他結果。

也可以看看