統計數據

正態分佈,一個非常普遍的概率密度,因為中心極限定理.
散點圖在描述性統計中使用以顯示不同變量之間觀察到的關係,此處使用虹膜花數據集.

統計數據是涉及收集,組織,分析,解釋和表現的學科數據.[1][2][3]在將統計數據應用於科學,工業或社會問題時,從統計人口或a統計模型被研究。人群可以是各種各樣的人或“居住在一個國家的人”或“組成水晶的每個原子”之類的物體。統計數據涉及數據的各個方面,包括根據設計收集數據調查實驗.[4]

什麼時候人口普查數據無法收集,統計學家通過開發特定的實驗設計和調查來收集數據樣品。代表性抽樣確保推論和結論可以合理地從樣本延伸到整個人群。一個實驗研究涉及對正在研究的系統進行測量,操縱系統,然後使用相同的程序進行其他測量,以確定操縱是否已修改了測量值。相反,觀察性研究不涉及實驗操作。

兩種主要的統計方法在數據分析描述性統計,使用索引如那個意思是或者標準偏差, 和推論統計,從數據中得出結論,這些結論會受到隨機變化的影響(例如,觀察誤差,採樣變化)。[5]描述性統計最常與兩組的屬性有關分配(樣本或人口):集中趨勢(或者地點)試圖表徵分銷的中心或典型價值,而分散(或者變化性)表徵分配成員在多大程度上偏離其中心的程度。推斷數學統計是在概率理論,處理隨機現象的分析。

標準統計程序涉及收集數據關係測試在兩個統計數據集或從理想化模型中繪製的數據集和合成數據之間。提出了兩個數據集之間的統計關係的假設,並將其比較為選擇理想化零假設兩個數據集之間沒有關係。考慮到測試中使用的數據,拒絕或反駁零假設是使用量化零可以證明錯誤的意義的統計檢驗進行的。從零假設進行工作,確認了兩種基本的錯誤形式:類型I錯誤(零假設被錯誤地拒絕給出“假陽性”)和II型錯誤(零假設未能被拒絕,人口之間的實際關係被錯過了“假陰性”)。[6]從獲得足夠的樣本量到指定足夠的無效假設,多個問題已經與該框架相關聯。[5]

生成統計數據的測量過程也遇到錯誤。這些錯誤中有許多被歸類為隨機(噪聲)或系統的(偏見),但是也可能發生其他類型的錯誤(例如,分析師報告不正確的單位時的錯誤)。存在缺失數據或者審查可能導致估計偏差,並開發了特定的技術來解決這些問題。

介紹

統計數據是科學的數學機構,與收集,分析,解釋或解釋以及呈現有關數據[7]或作為分支數學.[8]有些人認為統計是一門獨特的數學科學,而不是數學的分支。儘管許多科學研究都利用數據,但統計數據與面對不確定性的不確定性和決策制定的背景下使用數據有關。[9][10]

在將統計數據應用於問題時,通常是從人口或要研究的過程。人口可能是多種主題,例如“所有居住在一個國家的人”或“組成水晶的每個原子”。理想情況下,統計學家編譯了有關整個人口的數據(一個稱為的操作人口普查)。這可以由政府統計機構組織。描述性統計可用於總結人口數據。數值描述符包括意思是標準偏差為了連續數據(如收入),而頻率和百分比在描述方面更有用分類數據(像教育)。

當人口普查不可行時,選定的人口子集稱為樣本被研究。一旦確定了代表人口的樣本,就會在觀察性或實驗環境。同樣,描述性統計數據可用於總結示例數據。但是,繪製樣品包含一個隨機性。因此,樣品中的數值描述符也容易出現不確定性。要得出關於整個人口的有意義的結論,推論統計需要。它使用樣本數據中的模式來汲取有關隨機性時所代表的人群的推論。這些推論可能採取回答是/否問題的形式(假設檢驗),估計數據的數值特徵(估計),描述協會在數據中(相關性),並在數據中建模關係(例如,使用回歸分析)。推理可以擴展到預測預言,並估計未觀察到的值或與所研究的人群相關。它可以包括外推插值時間序列或者空間數據, 和數據挖掘.

數學統計

數學統計是數學統計。用於此的數學技術包括數學分析線性代數隨機分析微分方程, 和測量理論概率理論.[11][12]

歷史

Gerolamo Cardano,概率數學的先驅。

統計推論的早期著作可以追溯到阿拉伯數學家密碼學家, 在此期間伊斯蘭黃金時代在8到13世紀之間。al-Khalil(717–786)寫了加密信息,其中包含首次使用排列和組合,以列出所有可能的阿拉伯帶有和不帶元音的單詞。[13]在他的書中關於解密的加密消息的手稿,al-Kindi對如何使用的詳細說明進行了詳細說明頻率分析破譯加密消息。 al-Kindi也最早已知統計推斷,而他和後來的阿拉伯密碼學家開發了早期的統計方法解碼加密消息。伊本·阿德蘭(Ibn Adlan)(1187–1268)後來為使用而做出了重要貢獻樣本量在頻率分析中。[13]

歐洲最早關於統計數據的著作可以追溯到1663年,出版對死亡法案的自然和政治觀察經過約翰·格勞特.[14]統計思維的早期應用圍繞各州的需求,以基於人口統計和經濟數據的政策,因此統計詞源。 19世紀初期,統計學學科的範圍擴大了,包括對數據的收集和分析。如今,統計數據已廣泛用於政府,商業以及自然和社會科學。

現代統計數據的數學基礎是在17世紀的發展概率理論經過Gerolamo CardanoBlaise Pascal皮埃爾·德·費馬特(Pierre de Fermat)。數學概率理論來自於研究機會遊戲,儘管概率的概念已經在中世紀法以及諸如哲學家胡安·卡拉梅爾(Juan Caramuel).[15]最小二乘的方法首先由Adrien-Marie Legendre1805年。

卡爾·皮爾森(Karl Pearson),數學統計的創始人。

現代統計領域在19世紀末和20世紀初出現了三個階段。[16]在世紀之交的第一波是由弗朗西斯·加爾頓卡爾·皮爾森(Karl Pearson),他們將統計數據轉變為一種嚴格的數學學科,不僅用於科學,而且在工業和政治方面。加爾頓的貢獻包括介紹標準偏差相關性回歸分析以及這些方法在研究人類特徵種類的研究中的應用 - 高度,體重,睫毛長度。[17]皮爾森(Pearson)開發了皮爾森產品矩相關係數,被定義為產品矩,[18]時刻方法用於將分佈擬合到樣品和皮爾遜分銷,包括其他許多事情。[19]加爾頓和皮爾遜建立了Biometrika作為第一個數學統計雜誌和生物統計學(當時稱為生物測定法),後者建立了世界上第一個大學統計系倫敦大學學院.[20]

羅納德·費舍爾創造了這個詞零假設在此期間夫人品嚐茶實驗,“從未得到證明或確定,但可能在實驗過程中被駁回”。[21][22]

1910年代和20年代的第二波是由威廉·西莉·戈塞特(William Sealy Gosset),並達到了最終的結論羅納德·費舍爾,他們撰寫了為定義世界各地大學學科的教科書。費舍爾最重要的出版物是他的1918年開創性論文親戚在孟德爾繼承的假設上的相關性(這是第一個使用統計術語的人方差),他的經典1925年作品研究工作者的統計方法和他的1935年實驗的設計[23][24][25]他發展嚴格的地方實驗的設計楷模。他起源於足夠輔助統計費舍爾的線性歧視者Fisher信息.[26]在他的1930年書中自然選擇的基因理論,他將統計數據應用於各種生物諸如費舍爾的原則[27](哪個A. W. F. Edwards被稱為“可能是最著名的論點進化生物學“) 和費舍里亞人的逃亡[28][29][30][31][32][33]一個概念性選擇關於在進化.

最後的浪潮主要看到了早期發展的完善和擴展,這是從合作工作中產生的埃貢·皮爾森(Egon Pearson)Jerzy Neyman在1930年代。他們介紹了“II型“ 錯誤,測試的力量置信區間。 Jerzy Neyman在1934年表明,分層隨機抽樣通常是比目的(配額)採樣更好的估計方法。[34]

如今,統計方法已應用於涉及決策的所有領域,以根據統計方法的不確定性從整合的數據中進行準確的推論,並在面對不確定的情況下做出決策。現代的使用電腦已經加快了大規模的統計計算,並且還使手動執行不切實際的新方法成為可能。統計數據仍然是積極研究的領域,例如如何分析問題大數據.[35]

統計數據

數據採集

採樣

當無法收集完整的人口普查數據時,統計學家通過開發特定的數據來收集樣本數據實驗設計調查樣品。統計本身還提供了預測和預測的工具統計模型.

要使用樣本作為整個人群的指南,重要的是它真正代表整體人口。代表採樣確保推論和結論可以安全地從樣本擴展到整個人群。一個主要問題在於確定所選樣品實際上是代表性的程度。統計信息提供了估計和糾正樣本和數據收集程序中的任何偏差的方法。還有一些實驗設計方法可以在研究開始時減少這些問題,從而增強其辨別人群真相的能力。

抽樣理論是數學學科概率理論。概率用於數學統計研究採樣分佈樣本統計而且,更一般地,統計程序。當所考慮的系統或人群滿足該方法的假設時,任何統計方法的使用都是有效的。經典概率理論和抽樣理論之間的觀點差異大致是,概率理論從總人口的給定參數開始到推斷與樣品有關的概率。然而,統計推斷朝相反的方向移動電感推斷從樣本到較大或總人群的參數。

實驗和觀察研究

統計研究項目的一個共同目標是調查因果關係,特別是要得出關於預測因子值變化的影響或因變量上的自變量。因果統計研究有兩種主要類型:實驗研究觀察性研究。在兩種類型的研究中,都觀察到獨立變量(或變量)對因變量行為的差異的影響。兩種類型之間的差異在於研究的實際進行。每個都可以非常有效。一項實驗研究涉及對正在研究的系統進行測量,操縱系統,然後使用相同的程序進行其他測量,以確定操縱是否已修改了測量值。相反,觀察性研究不涉及實驗操作。取而代之的是收集數據,並研究了預測因子和響應之間的相關性。數據分析工具最適合來自隨機研究,它們也適用於其他類型的數據自然實驗觀察性研究[36] - 對於哪個統計學家將使用修改後的,更結構化的估計方法(例如,差異估計的差異儀器變量,除其他許多)生產一致的估計器.

實驗

統計實驗的基本步驟是:

  1. 計劃研究,包括查找研究的重複數量,使用以下信息:有關大小的初步估計治療效果替代假設,以及估計的實驗變異性。考慮實驗學科的選擇和研究倫理是必要的。統計學家建議實驗將(至少)與標準治療或對照進行比較,以允許對治療效果差異的公正估計。
  2. 實驗的設計, 使用阻止減少影響混雜變量, 和隨機分配對受試者的治療公正的估計治療效果和實驗誤差。在此階段,實驗者和統計學家寫了實驗方案這將指導實驗的性能,並指定主要分析實驗數據。
  3. 執行實驗之後實驗方案分析數據遵循實驗方案。
  4. 進一步檢查次要分析中的數據集,以提出新的假設以供將來研究。
  5. 記錄並介紹研究結果。

關於人類行為的實驗有特殊問題。有名的霍桑研究檢查了對霍桑工廠的工作環境的變化西部電力公司。研究人員有興趣確定增加的照明是否會提高流水線工作人員。研究人員首先測量了工廠的生產率,然後修改了工廠區域中的照明,並檢查了照明的變化是否影響了生產率。事實證明,生產率確實提高了(在實驗條件下)。但是,今天的研究因實驗程序中的錯誤而受到嚴重批評,特別是因為缺乏控制組失明。這霍桑效應指的是發現結果(在這種情況下,工人的生產力)由於觀察本身而發生了變化。霍桑研究中的人變得更有生產力,不是因為照明發生了變化,而是因為觀察到了照明。[37]

觀察性研究

觀察性研究的一個例子是探索吸煙與肺癌之間的關聯的一個例子。這類研究通常使用調查來收集有關感興趣領域的觀察結果,然後進行統計分析。在這種情況下,研究人員將通過一個人來收集吸煙者和非吸煙者的觀察隊列研究,然後尋找每組肺癌病例的數量。[38]一個病例對照研究是另一種觀察性研究,其中有和沒有感興趣結果的人(例如肺癌)參與並收集其暴露歷史。

數據類型

已經進行了各種嘗試製作的分類法測量水平。心理生理學家斯坦利·史密斯·史蒂文斯(Stanley Smith Stevens)定義的名義,序數,間隔和比例量表。標稱測量值在值之間沒有有意義的等級順序,並且允許任何一對一的(注射)轉換。連續值之間的序數測量值不精確,但對這些值具有有意義的順序,並允許任何保留訂單的轉換。間隔測量在定義的測量之間具有有意義的距離,但是零值是任意的(如在情況下,經度溫度測量攝氏或者華氏),並允許任何線性轉換。比率測量值既有有意義的零值,也具有定義的不同測量值之間的距離,並允許進行任何重新變換。

因為僅符合標稱或順序測量的變量不能合理地進行數值測量,有時它們會被分組為分類變量,而比率和間隔測量結果將定量變量,這可以是離散的或者連續的,由於它們的數字性質。這樣的區別通常可以與數據類型在計算機科學中,在該二分法中,可以用布爾數據類型,任意分配的多態分類變量整數在裡面積分數據類型,以及與實際數據類型涉及浮點計算。但是,計算機科學數據類型對統計數據類型的映射取決於正在實施後者的哪個分類。

已經提出了其他分類。例如,Mosseller and Tukey(1977)[39]傑出的成績,等級,計數分數,計數,數量和平衡。內爾德(1990)[40]描述了連續計數,連續比率,計數比和分類數據模式。 (另請參見:Chrisman(1998),[41]范登·伯格(Van Den Berg)(1991)。[42])

關於從不同類型的測量程序獲得的數據,將不同類型的統計方法應用於變量轉換和研究問題的精確解釋的問題使得是否適合於從不同類型的測量程序獲得的數據。 “數據及其描述的關係僅反映了以下事實:某些類型的統計陳述可能具有某些轉換下不變的真實價值。 。”[43]:82

方法

描述性統計

一個描述性統計(在裡面伯爵名詞感覺)是摘要統計定量描述或總結了集合的特徵信息[44]儘管描述性統計在裡面物質名詞感覺是使用和分析這些統計數據的過程。描述性統計與推論統計(或歸納統計),在該描述性統計中旨在總結樣本,而不是使用數據來了解人口認為數據的樣本被認為代表。

推論統計

統計推斷是使用的過程數據分析推斷基礎的屬性概率分佈.[45]推論統計分析侵犯了A的性質人口,例如,通過測試假設並得出估計。假定觀察到的數據集為採樣來自較大的人口。推論統計數據可以與描述性統計。描述性統計數據完全與觀察到的數據的屬性有關,它並不基於以下假設:數據來自較大的人群。

推論統計學的術語和理論

統計,估計量和關鍵量

考慮獨立分佈(IID)隨機變量給定概率分佈: 標準統計推斷估計理論定義a隨機抽樣作為隨機矢量列向量這些IID變量。[46]人口被檢查的概率分佈可能未知參數來描述。

統計量是一個隨機變量,是隨機樣本的函數,但是不是未知參數的函數。但是,統計量的概率分佈可能具有未知參數。現在考慮未知參數的函數:估計器是用於估計此功能的統計量。常用的估計器包括樣本平均值,公正樣本差異樣品協方差.

一個隨機樣本和未知參數的函數的隨機變量,但其概率分佈不依賴未知參數稱為a關鍵量或樞軸。廣泛使用的樞軸包括Z得分, 這卡方統計和學生的T值.

在給定參數的兩個估計器之間,一個估計值較低平方誤差據說更多高效的。此外,據說一個估計器是公正如果它是期望值等於真值如果未知參數的預期值收斂於限制對於此參數的真實值。

估計器的其他理想屬性包括:umvue對於要估計的參數的所有可能值的差異最低的估計器(通常是比效率更容易驗證的屬性)和一致的估計器哪個收斂概率對於此參數的真實值。

這仍然留下了一個問題,即如何在給定情況下獲取估計器並進行計算,已經提出了幾種方法:時刻方法, 這最大似然方法,最小二乘方法和最新的方法估計方程.

零假設和替代假設

統計信息的解釋通常涉及開發零假設通常(但不一定)變量之間不存在任何關係,或者隨著時間的流逝沒有發生任何變化。[47][48]

新手的最佳例證是刑事審判遇到的困境。零假設,h0,斷言被告是無辜的,而另一種假設,h1,斷言被告有罪。起訴是由於懷疑有罪的。 h0(現狀)與H相反1除非h1“超出合理懷疑”的證據支持。但是,“不拒絕H0“在這種情況下,並不意味著純真,而只是證據不足以定罪。因此,陪審團不一定是接受H0未能拒絕H0。雖然一個人不能“證明”零假設,但可以測試它與一個真實的距離電源測試,測試II型錯誤.

什麼統計學家打電話替代假設只是一個與零假設.

錯誤

從一個工作零假設,認識到兩個廣泛的錯誤類別:

  • 類型I錯誤零假設被錯誤地拒絕,給出“假陽性”。
  • II型錯誤如果零假設未能拒絕,並且錯過了人群之間的實際差異,則給出了“假陰性”。

標準偏差指樣本中的個體觀察結果與中心值不同,例如樣本或人口平均值,而標準錯誤是指樣本平均值和人口平均值之間差異的估計值。

一個統計錯誤觀察值與其不同的數量是期望值。一個剩餘的觀察值與給定樣品(也稱為預測)上假定的預期值的估計值不同。

平方誤差用於獲得有效的估計器,一種廣泛使用的估計器類。根均方誤差僅僅是平方誤差的平方根。

至少正方形合適:以藍色的藍色線形成紅色的點。

許多統計方法試圖最大程度地減少剩餘的正方金總和,這些被稱為“最小二乘的方法“與絕對偏差至少。後者的重量與小錯誤和大錯誤相等,而前者給出了更大的重量。平方的殘留總和也是可區分,提供方便的財產回歸。適用於線性回歸叫做普通最小二乘方法和最小二乘非線性回歸叫做非線性最小二乘。同樣在線性回歸模型中,模型的非確定性部分稱為誤差項,干擾或更簡單的噪聲。線性回歸和非線性回歸均在多項式最小二乘,這還描述了因變量(y軸)的預測中的方差,這是自變量(x軸)的函數以及與估計(擬合)曲線的偏差(誤差,噪聲,噪聲,干擾)。

生成統計數據的測量過程也遇到錯誤。這些錯誤中有許多被歸類為隨機的(噪音)或系統(偏見),但是其他類型的錯誤(例如錯誤,例如分析師報告不正確的單位)也可能很重要。存在缺失數據或者審查可能會導致有偏見的估計已經開發了解決這些問題的具體技術。[49]

間隔估計
置信區間:紅線是均值的真實值,在此示例中,藍線是100個實現的隨機置信區間。

大多數研究僅樣品人群的一部分,因此結果並不能完全代表整個人群。從樣本獲得的任何估計僅近似於人口價值。置信區間允許統計學家表達樣本估計與整個人群中的真實價值相匹配的程度。通常,它們表示為95%的置信區間。正式地,值的95%置信區間是一個範圍,如果在相同條件下重複採樣和分析(產生不同的數據集),則該間隔將包括所有可能情況的95%的真實(人口)值。這樣做不是暗示真實值在置信區間中的概率為95%。來自經常出現觀點,這樣的主張甚至沒有意義,因為真實價值不是一個隨機變量。真實值是或不在給定間隔內。但是,確實,在對任何數據進行採樣並給出瞭如何構建置信區間的計劃之前,尚未計算的間隔將涵蓋真實值的概率為95%:在這一點上,間隔的限制尚未觀察到隨機變量。一種確實產生一個可以解釋為具有包含真實價值的給定概率的間隔的方法是使用一個可靠的間隔貝葉斯統計:這種方法取決於不同的方式解釋“概率”的含義,那就是貝葉斯的概率.

原則上,置信區間可以對稱或不對稱。間隔可能是不對稱的,因為它作為參數(左側間隔或右側間隔)的上限或上限工作,但也可能是不對稱的,因為兩側間隔是在估計周圍違反對稱性的。有時,置信區間的界限是漸近地達到的,這些界限用於近似真實的邊界。

意義

統計數據很少給出簡單的是/否類型的答案,以分析該問題。解釋通常取決於適用於數字的統計意義的水平,通常是指準確拒絕零假設的價值的概率(有時稱為該假設p值)。

在此圖中,黑線是概率分佈測試統計, 這關鍵區域是觀察到的數據點右側的一組值(測試統計量的觀察值)和p值由綠色區域代表。

標準方法[46]是針對替代假設檢驗零假設。一個關鍵區域是導致反駁零假設的估計值的集合。因此統計學意義),II型誤差的概率是估計器不屬於關鍵區域的概率,因為替代假設是正確的。這統計能力測試的概率是,當零假設為錯誤時,它正確拒絕零假設。

指統計意義並不一定意味著總體結果在現實世界中具有重要意義。例如,在對藥物的大型研究中,可以證明該藥物具有具有統計學意義但非常小的有益作用,因此該藥物不太可能有明顯的幫助。

雖然原則上可接受的水平統計學意義可能有辯論,顯著性水平是允許測試拒絕零假設的最大P值。在邏輯上,該測試等同於說p值是概率,假設零假設是正確的,它至少觀察結果至少與該結果一樣極端測試統計。因此,顯著性水平越小,犯下I型誤差的概率就越低。

一些問題通常與此框架有關(請參閱批評假設檢驗):

  • 高度統計學意義的差異仍然沒有實際意義,但是可以正確制定測試來解決這個問題。一種回應涉及不超出報告顯著性水平包括p-價值報告是拒絕還是接受假設時。但是,p值並未表示尺寸或觀察到的效果的重要性,似乎也誇大了大型研究中差異的重要性。一種更好,越來越普遍的方法是報告置信區間。儘管它們是根據與假設檢驗相同的計算產生的p - 值,他們描述了效果的大小和周圍的不確定性。
  • 轉置條件的謬誤,又稱檢察官的謬論:批評之所以出現,是因為假設檢驗方法迫使一個假設(該假設零假設)要受到青睞,由於被評估的是鑑於觀察到的結果,因此觀察到的結果的概率是無效假設的概率。該方法的替代方法由貝葉斯推斷,儘管它需要建立事先概率.[50]
  • 拒絕零假設並不能自動證明替代假設。
  • 作為一切推論統計它依賴樣本量,因此胖尾巴p值可能嚴重計算。[需要澄清]
例子

一些眾所周知的統計測試程序是:

探索性數據分析

探索性數據分析(EDA)是一種方法分析數據集總結其主要特徵,通常使用視覺方法。一個統計模型可以使用或不使用,但主要是EDA是為了查看數據可以告訴我們的內容超出正式的建模或假設測試任務。

濫用

濫用統計可以在描述和解釋中造成細微但嚴重的錯誤 - 即使經驗豐富的專業人員也會犯錯誤,因此,他們可能會導致毀滅性的決策錯誤,從而微妙。例如,社會政策,醫學實踐和橋樑等結構的可靠性都依賴於適當使用統計數據。

即使正確應用了統計技術,對於缺乏專業知識的人來說,結果也很難解釋。這統計學意義數據的趨勢(衡量樣本中隨機變化可能導致的趨勢的程度)可能會或可能與其重要性的直觀意義一致。人們需要正確處理日常生活中信息的一組基本統計技能(和懷疑主義)被稱為統計素養.

人們普遍認為,統計知識是有意的。濫用通過找到僅解釋有利於演示者的數據的方法。[51]對統計數據的不信任和誤解與報價有關,”有三種謊言:謊言,該死的謊言和統計數據“。濫用統計可能既是無意的又是故意的,這本書如何與統計[51]經過達雷爾·霍夫(Darrell Huff),概述了一系列考慮因素。為了闡明對統計數據的使用和濫用,對特定領域中使用的統計技術進行了評論(例如Warne,Lazo,Ramos和Ritter(2012))。[52]

避免濫用統計的方法包括使用正確的圖並避免偏見.[53]結論是過度概括並聲稱自己的代表性超出了自己的代表性,通常是故意或無意識地忽視抽樣偏見的代表。[54]條形圖可以說是最容易使用和理解的圖表,可以手工製作或使用簡單的計算機程序製作。[53]不幸的是,大多數人不尋找偏見或錯誤,因此沒有註意到。因此,人們通常可能會相信某件事是正確的,即使它不好代表.[54]為了使數據從統計數據可信和準確,所採集的樣本必須代表整體。[55]霍夫認為,“樣本的可靠性可以被[偏見]破壞……讓自己懷疑一定程度的懷疑。”[56]

為了幫助理解統計數據,Huff提出了每種情況下要提出的一系列問題:[51]

  • 誰這麼說? (他/她有斧頭要研磨嗎?)
  • 他/她怎麼知道? (他/她有資源了解事實嗎?)
  • 少了什麼東西? (他/她給我們一張完整的照片嗎?)
  • 有人改變了主題嗎? (他/她是否為我們提供了正確的問題的正確答案?)
  • 是否有意義? (他/她的結論是否合乎邏輯,並且與我們已經知道的內容一致?)
混雜變量問題:Xy可能是相關的,不是因為它們之間存在因果關係,而是因為兩者都取決於第三個變量z.z被稱為混雜因素。

誤解:相關性

概念相關性對於可能引起的潛在混亂而引起的特別值得注意。統計分析數據集通常表明,所考慮的人群的兩個變量(屬性)往往會變化,好像它們是連接的一樣。例如,對年收入的研究也研究了死亡的年齡,可能會發現窮人往往比富裕的人更短。據說這兩個變量是相關的。但是,它們可能是彼此的原因。相關現象可能是由三分之一的未經考慮的現象引起的,稱為潛伏變量或混雜變量。因此,無法立即推斷兩個變量之間的因果關係。

申請

應用統計,理論統計和數學統計

應用統計,有時稱為統計科學,[57]包括描述性統計數據和推論統計的應用。[58][59]理論統計涉及對方法的理由的邏輯論點統計推斷,以及包容數學統計。數學統計不僅包括操縱概率分佈得出與估計和推理方法相關的結果所必需的,也需要計算統計實驗的設計.

統計顧問可以幫助沒有與其特定問題相關的內部專業知識的組織和公司。

機器學習和數據挖掘

機器學習模型是統計和概率模型,可通過使用計算算法來捕獲數據中的模式。

學術界的統計數據

統計數據適用於各種各樣的學科, 包含自然社會科學,政府和業務。業務統計應用在計量經濟學審計以及生產和運營,包括服務改進和市場研究。[60]一項對熱帶生物學的兩種期刊的研究發現,12個最頻繁的統計檢驗是:方差分析(方差分析),卡方測試學生的T測試線性回歸皮爾遜的相關係數Mann-Whitney U測試Kruskal-Wallis測試香農的多樣性指數Tukey的測試聚類分析斯皮爾曼的等級相關測試主成分分析.[61]

典型的統計課程涵蓋了描述性統計,概率,二項式和正常分佈,測試假設和置信區間,線性回歸和相關性。[62]本科生的現代基本統計課程專注於正確的測試選擇,結果解釋和使用免費統計軟件.[61]

統計計算

從20世紀下半葉開始,計算能力的迅速和持續增長對統計科學實踐產生了重大影響。早期的統計模型幾乎總是來自線性模型,但功能強大的計算機,再加上合適的數值算法,引起人們對非線性模型(如神經網絡)以及新類型的創建廣義線性模型多級模型.

增加的計算能力也導致了基於計算密集型方法的普及重採樣, 如置換測試引導程序,而諸如吉布斯採樣利用貝葉斯模型更可行。計算機革命對統計數據的未來有影響,重點是“實驗”和“經驗”統計。大量的一般和特殊用途統計軟件現在可用。能夠複雜統計計算的可用軟件的示例包括MathematicaSASSPSS, 和r.

業務統計

在業務中,“統計數據”是廣泛使用的管理-決策支持工具。它特別適用於財務管理市場營銷管理, 和生產服務運營管理.[63][64]統計數據也大量使用管理會計審計。紀律管理科學正式在業務中正式使用統計數據和其他數學。 ((計量經濟學是將統計方法應用於經濟數據為了將經驗內容提供給經濟關係

典型的“業務統計”課程旨在商業專業和封面[65]描述性統計(收藏,描述,分析和數據摘要),概率(通常是二項式正常分佈),假設和置信區間的檢驗,線性回歸和相關性; (後續)課程可能包括預測時間序列決策樹多元線性回歸,以及其他主題商業分析更普遍。也可以看看商業數學§大學一級.專業認證計劃, 如那個CFA,通常包括統計中的主題。

適用於數學或藝術的統計數據

傳統上,統計數據與大多數科學中“需要學習”的半標準化方法進行了繪製推論。這種傳統隨著在非本質上下文中的統計數據而改變。曾經被認為是一個乾燥的主題,在許多領域被視為一種學位,現在被熱情地看待。[根據誰?]最初受到某些數學純粹主義者的嘲笑,現在被認為是某些領域的基本方法。

  • 數字理論散點圖通過分佈函數生成的數據可以通過統計信息中用於揭示潛在模式的熟悉工具來轉換,這可能會導致假設。
  • 統計學的預測方法預測結合混沌理論分形幾何形狀可用於創建視頻作品。[66]
  • 過程藝術傑克遜·波洛克(Jackson Pollock)依靠藝術實驗,在這種實驗上,自然界中的基本分佈被藝術揭示了。[67]隨著計算機的出現,統計方法被應用於形式化分佈驅動的自然過程以製造和分析移動視頻藝術。
  • 統計方法可以用在表演藝術,就像基於紙牌技巧一樣馬爾可夫進程這只能在某些時候起作用,可以使用統計方法來預測其場合。
  • 統計數據可用於創建藝術,例如統計或隨機音樂發明Iannis Xenakis,音樂特定於表演。儘管這種類型的藝術性並不總是像預期的那樣出現,但它確實以統計數據可預測和可調的方式行事。

專業學科

統計技術用於廣泛類型的科學和社會研究,包括:生物統計學計算生物學計算社會學網絡生物學社會科學社會學社會研究。某些查詢使用的領域非常廣泛地應用統計數據,以至於專業術語。這些學科包括:

此外,還有一些特定類型的統計分析也開發了自己的專業術語和方法:

統計數據也構成了業務和製造業中的關鍵基礎工具。它用於了解測量系統的可變性,控製過程(如統計過程控制或SPC),用於總結數據並做出數據驅動的決策。在這些角色中,它是一個關鍵工具,也許是唯一的可靠工具。

也可以看看

基礎和統計的主要領域

參考

  1. ^“統計數據”。牛津參考。牛津大學出版社。 2008年1月。ISBN978-0-19-954145-4.存檔從2020-09-03的原始。檢索2019-08-14.
  2. ^Romijn,Jan-Willem(2014)。“統計哲學”.斯坦福大學哲學百科全書.存檔從2021-10-19的原件。檢索2016-11-03.
  3. ^“劍橋詞典”.存檔從2020-11-22的原始。檢索2019-08-14.
  4. ^道奇,Y。(2006)牛津統計術語詞典, 牛津大學出版社。ISBN0-19-920613-9
  5. ^一個b隆德研究有限公司“描述性和推論統計”。 statistics.laerd.com。存檔從2020-10-26的原始。檢索2014-03-23.
  6. ^“ I型和II型假設測試錯誤之間有什麼區別?”.關於網站教育.存檔從2017-02-27的原始。檢索2015-11-27.
  7. ^Moses,Lincoln E.(1986)用統計來思考和解釋,艾迪生 - 韋斯利,ISBN978-0-201-15619-5。 pp。1-3
  8. ^海斯,威廉·李(1973)社會科學的統計數據,Holt,Rinehart和Winston,P.XII,ISBN978-0-03-077945-9
  9. ^摩爾,大衛(1992)。“教統計作為一個受人尊敬的主題”。在F. Gordon; S. Gordon(編輯)。二十一世紀的統計數據。華盛頓特區:美國數學協會。 pp。14–25.ISBN978-0-88385-078-7.
  10. ^機會,貝絲·L。; Rossman,Allan J.(2005)。“前言”(PDF).研究統計概念,應用和方法。達克斯伯里出版社。ISBN978-0-495-05064-3.存檔(PDF)從2020-11-22的原始。檢索2009-12-06.
  11. ^Lakshmikantham,d。; Kannan,V。(2002)。隨機分析和應用手冊。紐約:M。Dekker。ISBN0824706609.
  12. ^Schervish,Mark J.(1995)。統計理論(Corr。2ndPrint。ed。)。紐約:施普林格。ISBN0387945466.
  13. ^一個bBroemeling,Lyle D.(2011年11月1日)。 “關於阿拉伯密碼學的早期統計推論的描述”。美國統計學家.65(4):255–257。doi10.1198/tas.2011.10191.S2CID123537702.
  14. ^Willcox,Walter(1938)“統計的創始人”。評論國際統計研究所5(4):321–328。Jstor1400906
  15. ^J. Franklin,《猜想的科學:帕斯卡之前的證據和概率》,約翰·霍普金斯大學PR 2002
  16. ^海倫·瑪麗·沃克(Helen Mary Walker)(1975)。統計方法史的研究。 Arno Press。ISBN9780405066283.存檔從2020-07-27的原始。檢索2015-06-27.
  17. ^Galton,F(1877)。“遺傳的典型定律”.自然.15(388):492–553。Bibcode1877年15..492。.doi10.1038/015492A0.
  18. ^Stigler,S.M。 (1989)。“弗朗西斯·加爾頓(Francis Galton)關於相關性發明的描述”.統計科學.4(2):73–79。doi10.1214/SS/1177012580.
  19. ^Pearson,K。(1900)。“在相關變量系統的情況下,給定偏差系統的標準是,可以合理地應該從隨機抽樣中引起它”.哲學雜誌。系列5。50(302):157–175。doi10.1080/1478640009463897.存檔從2020-08-18的原始。檢索2019-06-27.
  20. ^“卡爾·皮爾森(Karl Pearson)(1857–1936)”。統計科學系 - 倫敦大學學院。存檔原本的在2008-09-25。
  21. ^費舍爾| 1971 | loc =第二章。實驗原理,通過心理體物理實驗說明,第8節。
  22. ^OED Quote:1935R.A.費舍爾,實驗的設計ii。 19,“我們可以將此假設稱為'零假設',而在實驗過程中,從未證明或確定零假設,但可能被駁回。”
  23. ^JF Box(1980年2月)。 “ R.A. Fisher和實驗設計,1922 - 1926年”。美國統計學家.34(1):1–7。doi10.2307/2682986.Jstor2682986.
  24. ^Yates,F(1964年6月)。 “羅納德·費舍爾爵士和實驗設計”。生物識別技術.20(2):307–321。doi10.2307/2528399.Jstor2528399.
  25. ^斯坦利,朱利安·C(1966)。費舍爾的“實驗設計”對30年後的教育研究的影響”。美國教育研究雜誌.3(3):223–229。doi10.3102/00028312003003223.Jstor1161806.S2CID145725524.
  26. ^Agresti,Alan; David B. Hichcock(2005)。“分類數據分析的貝葉斯推斷”(PDF).統計方法和應用.14(3):298。doi10.1007/s10260-005-0121-y.S2CID18896230.存檔(PDF)從2013-12-19的原始。檢索2013-12-19.
  27. ^愛德華茲,A.W.F。 (1998)。 “自然選擇與性別比:費舍爾的來源”。美國博物學家.151(6):564–569。doi10.1086/286141.PMID18811377.S2CID40540426.
  28. ^費舍爾,R.A。 (1915)性偏愛的演變。優生學評論(7)184:192
  29. ^費舍爾,R.A。 (1930)自然選擇的基因理論.ISBN0-19-850440-3
  30. ^愛德華茲,A.W.F。 (2000年)觀點:有關遺傳學的軼事,歷史和批判性評論。美國遺傳學學會(154)1419:1426
  31. ^Andersson,Malte(1994)。性選擇。普林斯頓大學出版社。ISBN0-691-00057-3.存檔從2019-12-25的原始。檢索2019-09-19.
  32. ^Andersson,M。和Simmons,L.W。 (2006)性選擇和伴侶選擇。趨勢,生態和進化(21)296:302
  33. ^Gayon,J。(2010)性選擇:另一個達爾文進程。 Comptes Rendus Biologies(333)134:144
  34. ^Neyman,J(1934)。 “在代表性方法的兩個不同方面:分層採樣的方法和目的選擇方法”。皇家統計學會雜誌.97(4):557–625。doi10.2307/2342192.Jstor2342192.
  35. ^“複雜世界中的科學 - 大數據:機會還是威脅?”.聖達菲研究所.存檔從2016-05-30的原始。檢索2014-10-13.
  36. ^D.A. Freedman(2005)統計模型:理論和實踐,劍橋大學出版社。ISBN978-0-521-67105-7
  37. ^McCarney R,Warner J,Iliffe S,Van Haselen R,Griffin M,Fisher P(2007)。“霍桑效應:一項隨機,對照試驗”.BMC Med Res方法.7(1):30。doi10.1186/1471-2288-7-30.PMC1936999.PMID17608932.
  38. ^羅斯曼(Rothman),肯尼斯(Kenneth J);格陵蘭,桑德;睫毛,蒂莫西(Timothy)編輯。 (2008)。 “ 7”。現代流行病學(第三版)。 Lippincott Williams&Wilkins。 p。100.ISBN9780781755641.
  39. ^Mosteller,F。Tukey,J.W(1977)。數據分析和回歸。波士頓:艾迪生 - 韋斯利。
  40. ^Nelder,J.A。(1990)。計算機化統計信息的分析和解釋所需的知識。在專家系統和人工智能:有關數據的信息的需求。圖書館協會報告,倫敦,3月23日至27日。
  41. ^Chrisman,Nicholas R(1998)。 “重新思考製圖的測量水平”。製圖和地理信息科學.25(4):231–242。doi10.1559/152304098782383043.
  42. ^Van Den Berg,G。(1991)。選擇分析方法。萊頓:DSWO出版社
  43. ^手,D.J。 (2004)。測量理論與實踐:通過量化世界。倫敦:阿諾德。
  44. ^Mann,PremS。(1995)。入門統計(第二版)。威利。ISBN0-471-31009-3.
  45. ^Upton,G。,Cook,I。(2008)牛津統計詞典,OUP。ISBN978-0-19-954145-4。
  46. ^一個bPiazza Elio,ProbabilitàEStatistica,Esculapio 2007
  47. ^埃弗里特(Everitt),布萊恩(Brian)(1998)。劍橋統計詞典。英國劍橋紐約:劍橋大學出版社。ISBN0521593468.
  48. ^“ Cohen(1994)地球是圓形的(p <.05)”。 yourstatsguru.com。存檔從2015-09-05的原始。檢索2015-07-20.
  49. ^魯賓,唐納德·B。 Little,Roderick J.A.,統計分析缺少數據,紐約:Wiley 2002
  50. ^Ioannidis,J.P.A。(2005)。“為什麼大多數已發表的研究結果都是錯誤的”.PLOS醫學.2(8):E124。doi10.1371/journal.pmed.0020124.PMC1182327.PMID16060722.
  51. ^一個bc霍夫,達雷爾(1954)如何與統計,WW Norton&Company,Inc。紐約。ISBN0-393-31072-8
  52. ^Warne,R。Lazo; Ramos,T。; Ritter,N。(2012)。 “有天賦的教育期刊中使用的統計方法,2006 - 2010年”。有天賦的孩子季刊.56(3):134–149。doi10.1177/0016986212444122.S2CID144168910.
  53. ^一個b羅伯特·D·德倫南(Drennan)(2008)。 “考古學統計學”。在Pearsall,Deborah M.(編輯)。考古學百科全書。 Elsevier Inc. pp。2093–2100。ISBN978-0-12-373962-9.
  54. ^一個b杰羅姆·科恩(Cohen)(1938年12月)。 “濫用統計數據”。美國統計協會雜誌。 Jstor。33(204):657–674。doi10.1080/01621459.1938.10502344.
  55. ^J.E. Freund(1988)。 “現代基本統計”。信條參考.
  56. ^霍夫,達雷爾;歐文·蓋斯(Irving Geis)(1954)。如何與統計。紐約:諾頓。樣本的可靠性可以被[偏見]破壞...讓自己懷疑一定程度的懷疑。
  57. ^Nelder,John A.(1999)。“從統計到統計科學”.皇家統計學會雜誌。 D系列(統計學家).48(2):257–269。doi10.1111/1467-9884.00187.ISSN0039-0526.Jstor2681191.存檔從2022-01-15的原始。檢索2022-01-15.
  58. ^Nikoletseas,M.M。 (2014)“統計:概念和示例”。ISBN978-1500815684
  59. ^Anderson,D.R。; Sweeney,D.J。;威廉姆斯,T.A。 (1994)統計簡介:概念和應用程序,第5–9頁。西部集團。ISBN978-0-314-03309-3
  60. ^“商業與經濟統計雜誌”.商業與經濟統計雜誌。泰勒和弗朗西斯。存檔從2020年7月27日的原始。檢索3月16日2020.
  61. ^一個bNataliaLoaizaVelásquez,MaríaSabelGonzálezLutz&JuliánMonge-Nájera(2011)。“熱帶生物學家應該學習哪些統計數據?”(PDF).RevistaBiología熱帶.59:983–992。存檔(PDF)從2020-10-19的原始。檢索2020-04-26.
  62. ^Pekoz,Erol(2009)。經理統計指南。 EROL PEKOZ。ISBN9780979570438.
  63. ^“目標和範圍”.商業與經濟統計雜誌。泰勒和弗朗西斯。存檔從2021年6月23日的原始。檢索3月16日2020.
  64. ^“商業與經濟統計雜誌”.商業與經濟統計雜誌。泰勒和弗朗西斯。存檔從2020年7月27日的原始。檢索3月16日2020.
  65. ^有許多文本可用,反映了商業世界中該學科的範圍和範圍:
    • Sharpe,N。(2014)。業務統計,皮爾遜。ISBN978-0134705217
    • Wegner,T。(2010)。應用業務統計:方法和基於Excel的應用程序,朱塔學術。ISBN0702172863
    開放教科書是:
  66. ^Cline,Graysen(2019)。使用R的非參數統計方法。 Edtech。ISBN978-1-83947-325-8.OCLC1132348139.存檔從2022-05-15的原始。檢索2021-09-16.
  67. ^貝爾納多帕拉西奧斯;羅薩里奧(Rosario),阿方索(Alfonso); Wilhelmus,Monica M。; Zetina,Sandra; Zenit,Roberto(2019-10-30)。“ Pollock避免了用他的滴水技術繪畫的流體動力學不穩定性”.PLOS ONE.14(10):E0223706。Bibcode2019 Ploso..1423706p.doi10.1371/journal.pone.0223706.ISSN1932-6203.PMC6821064.PMID31665191.

進一步閱讀

外部鏈接