實驗

實驗是一種程序來支持或反駁假設,或確定以前未經試驗的事物的功效或可能性。實驗通過證明操縱特定因素時會發生什麼結果來提供有關因果關係的見解。實驗的目標和規模差異很大,但始終依賴於可重複的過程和結果的邏輯分析。也存在自然實驗研究。
一個孩子可以進行基本的實驗,以了解事物如何落在地面上,而科學家團隊可能需要多年的系統調查來提高他們對現象的理解。實驗和其他類型的動手活動對於科學課堂中的學生學習非常重要。實驗可以提高考試成績,並幫助學生對所學習的材料更加參與和感興趣,尤其是隨著時間的推移使用時。實驗可以從個人和非正式的自然比較(例如品嚐一系列巧克力來找到喜歡的人)到高度控制的(例如,需要許多科學家監督複雜設備的測試,希望發現有關亞原子顆粒的信息)。自然科學和人類科學之間的實驗使用差異很大。
實驗通常包括對控件,這些控件旨在最大程度地減少單個自變量以外的變量的效果。這通常是通過控制測量和其他測量結果之間的比較來提高結果的可靠性。科學控制是科學方法的一部分。理想情況下,控制實驗中的所有變量(由控制測量值解釋),並且沒有任何變量不受控制。在這樣的實驗中,如果所有控件按預期工作,則可以得出結論,實驗是按預期工作的,結果是由於測試變量的效果所致。
概述
在科學方法中,實驗是一種仲裁競爭模型或假設的經驗程序。研究人員還使用實驗來檢驗現有理論或新假設來支持或反駁它們。
一個實驗通常檢驗假設,這是對特定過程或現象的工作原理的期望。但是,一個實驗也可能旨在回答一個“假設”問題,而沒有對實驗所揭示的特定期望或確認先前結果。如果仔細地進行了實驗,則結果通常支持或反駁假設。根據一些科學哲學,一個實驗永遠無法“證明”假設,它只能增加支持。另一方面,提供反例的實驗可以反駁理論或假設,但是可以通過適當的臨時修改以犧牲簡單性為代價來挽救理論。
一個實驗還必須控制可能的混雜因素- 任何會導致實驗準確性或重複性的因素或解釋結果的能力。通常通過科學控制和/或在隨機實驗中通過隨機分配來消除混雜。
在工程和物理科學中,實驗是科學方法的主要組成部分。它們用於測試有關特定條件下物理過程如何工作的理論和假設(例如,特定的工程過程是否可以產生所需的化合物)。通常,這些領域的實驗集中於相同程序的複製,以期在每個複制中產生相同的結果。隨機分配並不常見。
在醫學和社會科學方面,實驗研究的流行率在各學科之間差異很大。但是,當使用時,實驗通常遵循臨床試驗的形式,其中實驗單位(通常是人類)被隨機分配到評估一個或多個結果的治療或對照條件。與物理科學中的規範相反,重點通常放在平均治療效果上(治療組和對照組之間的結果差異)或實驗產生的其他測試統計量。一項研究通常不涉及實驗的複制,但是可以通過系統的審查和薈萃分析來匯總單獨的研究。
在科學的每個分支中,實驗實踐都有各種差異。例如,農業研究經常使用隨機實驗(例如,測試不同肥料的比較有效性),而實驗經濟學通常涉及對理論人類行為的實驗測試,而不依賴於將個體隨機分配用於治療和控制條件的實驗。
歷史
在阿拉伯數學家和學者Ibn Al-Haytham的作品中,可以看到現代意義上實驗的第一個有條理的方法之一。他在光學領域進行了實驗 - 回到了托勒密工作中的光學和數學問題- 通過控制他的實驗,這是由於自我批判性,對實驗可見結果的依賴以及對術語的關鍵性的依賴而進行的。早期結果。他是最早使用歸納實驗方法來實現結果的學者之一。他在他的《光學》中描述了從實驗意義上描述了知識和研究的新方法:
“我們應該重新調查其原則和前提,以檢查存在的事物以及對可見物體條件的調查開始我們的調查。我們應該區分細節的特性,並通過歸納收集什麼當視覺發生時與眼睛有關,以及以感覺的方式發現的東西是統一,不變,明顯的,並且不懷疑。在此之後,我們應該逐漸和有序地登上我們的詢問和推理,批評前提,並謹慎行事並謹慎行事關於結論,我們的目標是我們所有的目標是受到檢查和審查的目的,就是要採用正義,不要遵循偏見,並照顧我們判斷的一切,並批評我們尋求真理,而不是被意見搖擺。我們可能以這種方式最終實現了一個事實,即逐漸,逐步仔細地達到確定性的盡頭;在批評和謹慎的同時,我們可能會抓住一個真相,即消除分歧並解決令人懷疑的事情。儘管如此,我們並不能擺脫人類本質的人類濁度。但是我們必須盡力而為。從上帝那裡,我們得到了所有事物的支持。”
根據他的解釋,必須嚴格控制的測試執行,具有因人本質而導致的主觀性和易感性的敏感性。此外,必須對早期學者的結果和成果進行批判性觀點:
因此,研究科學家著作的人的職責,如果學習真理是他的目標,將自己成為他所讀的所有內容的敵人,並將自己的思想應用於其內容的核心和邊緣,請攻擊它從各個方面。當他對其進行批判性檢查時,他還應該懷疑自己,以便避免陷入偏見或寬大處理中。
因此,對於客觀實驗,需要將早期結果與實驗結果進行比較 - 可見的結果更為重要。最後,這可能意味著實驗研究人員必須找到足夠的勇氣來丟棄傳統觀點或結果,特別是如果這些結果不是實驗性的,而是邏輯/心理派生的結果。在這一批判性考慮的過程中,該人本人不應忘記,他傾向於通過“偏見”和“寬大處理”來發表主觀意見,因此必須對自己的建立假設的方式至關重要。
弗朗西斯·培根(Francis Bacon,1561– 1626年)是一位活躍於17世紀的英國哲學家和科學家,成為英語文藝復興時期實驗科學的有影響力的支持者。他不同意通過扣除來回答科學問題的方法 - 類似於伊本·艾爾·海瑟姆(Ibn al-Haytham) ,並將其描述如下:“首先根據他的意願確定了這個問題,然後男人求助於經驗,並彎腰與他的安置相符,帶領她像遊行隊伍一樣俘虜。”培根想要一種依靠可重複觀測或實驗的方法。值得注意的是,他首先訂購了我們今天了解的科學方法。
仍然有簡單的經驗;如果採取的話,那就是事故,如果尋求實驗,則稱為事故。真正的體驗方法首先點亮了蠟燭[假設],然後通過蠟燭顯示了[安排和劃界實驗]的方式;從適當訂購和消化而不是笨拙或不穩定的經驗開始,從它來推論公理(理論),並再次從已建立的公理再次進行新的新實驗。
在隨後的幾個世紀中,在不同領域應用科學方法的人們取得了重要的進步和發現。例如,伽利略·伽利略(Galileo Galilei )(1564–1642)精確測量了時間,並進行了實驗,以對落下身體的速度進行準確的測量和結論。法國化學家Antoine Lavoisier (1743–1794)使用實驗描述了新領域,例如燃燒和生物化學,並發展了質量保護理論(物質)。路易斯·巴斯德(Louis Pasteur,1822- 1895年)使用科學方法反駁了自發產生的普遍理論並發展了疾病的細菌理論。由於控制潛在混淆變量的重要性,因此在可能的情況下首選使用精心設計的實驗室實驗。
在20世紀初期,實驗的設計和分析取得了很大的進步,統計學家(如羅納德·費舍爾(Ronald Fisher)(1890- 1962年)等統計學家,傑里·尼曼( Jerzy Neyman )(1894-1981),奧斯卡·肯普托(Oscar Kempthorne )瑪麗·考克斯(Mary Cox)(1900-1978)和威廉·吉梅爾·科克倫(William Gemmell Cochran )(1909– 1980)等。
類型
根據不同研究領域的專業規範和標準,可以根據許多維度對實驗進行分類。
在某些學科(例如心理學或政治學)中,“真實實驗”是一種社會研究的方法,其中有兩種變量。獨立變量由實驗人員操縱,並測量因變量。真實實驗的含義特徵在於,它隨機分配受試者以中和實驗者偏見,並確保在實驗的大量迭代中,以控制所有混雜因素。
根據學科,可以進行實驗以實現不同但不是相互排斥的目標:測試理論,搜索和記錄現象,發展理論或建議決策者。這些目標也與有效性問題不同。
受控實驗
一個受控的實驗通常比較從實驗樣品獲得的結果與對照樣品獲得的結果,這些結果實際上與實驗樣本相同,除了其效果正在測試的一個方面(自變量)。一個很好的例子是藥物試驗。接受該藥物的樣本或組將是實驗組(治療組);並且接受安慰劑或常規治療的一種將是控制。在許多實驗室實驗中,最好有幾個重複樣本進行測試,並且既有陽性對照又具有陰性對照。重複樣品的結果通常可以平均,或者一個重複的結果顯然與其他樣品的結果不一致,則可以將其丟棄,因為它是實驗誤差的結果(測試過程的某些步驟可能是錯誤的該樣本省略了) 。大多數情況下,測試是重複或一式三份進行的。陽性對照是類似於實際實驗測試的程序,但從以前的經驗中知道可以給予陽性結果。已知負面對照會產生負面結果。陽性對照證實了實驗的基本條件能夠產生陽性結果,即使實際的實驗樣品都沒有產生陽性結果。陰性對照證明了當測試未產生可測量的陽性結果時獲得的基線結果。最常見的是負面對照的值被視為從測試樣本結果中減去的“背景”值。有時,陽性對照會導致標準曲線的象限。
經常在教學實驗室中使用的例子是一種受控的蛋白質測定。可以為學生提供一個含有未知數(學生)蛋白質的流體樣本。他們的工作是正確執行受控實驗,在該實驗中,他們確定流體樣品中蛋白質的濃度(通常稱為“未知樣品”)。教學實驗室將配備具有已知蛋白質濃度的蛋白質標準溶液。學生可以製作幾個陽性對照樣品,其中包含蛋白質標準的各種稀釋液。陰性對照樣品將包含用於蛋白質測定的所有試劑,但沒有蛋白質。在此示例中,所有樣本均以一式兩份執行。該測定是一種比色測定法,其中分光光度計可以通過檢測通過蛋白質分子和添加染料的分子相互作用形成的有色複合物來測量樣品中的蛋白質量。在圖中,可以將稀釋測試樣品的結果與標準曲線的結果(圖中的藍線)進行比較,以估計未知樣品中蛋白質的量。
當難以精確控制實驗中的所有條件時,可以執行受控實驗。在這種情況下,實驗首先創建了兩個或多個樣本組,這些樣本組在概率上等效,這意味著特徵的測量應在組之間相似,並且如果給出相同的處理,組應以相同的方式做出反應。這種等效性是由統計方法確定的,這些方法考慮了個體之間的變化量和每個組中的個體數量。在微生物學和化學等領域中,個人與組大小之間的變化很少,在數百萬中很容易,這些統計方法通常被繞過,並且僅將溶液分為相等的部分,以產生相同的樣本組。
一旦形成了等效組,實驗者將嘗試對其進行相同的治療,除了他或她希望隔離的一個變量。人類的實驗需要特殊保障措施,以防止安慰劑效應等外部變量。這樣的實驗通常是雙盲的,這意味著志願者和研究人員都不知道對照組或實驗組中的哪些人在收集所有數據之後。這樣可以確保對志願者的任何影響都是由於治療本身而引起的,並且不是對他正在接受治療的知識的回應。
在人類的實驗中,研究人員可能會給受試者(人)對受試者做出反應的刺激。實驗的目的是通過測試方法測量對刺激的反應。
在實驗的設計中,應用了兩個或多個“治療”,以估計治療的平均反應之間的差異。例如,烘烤麵包的實驗可以估計與定量變量相關的響應的差異,例如水與麵粉的比率以及定性變量(例如酵母菌菌株)。實驗是科學方法的一步,該方法可以幫助人們在兩個或多個競爭解釋之間做出決定或假設。這些假設提出了解釋現像或預測作用結果的原因。一個例子可能是“如果我釋放這個球,它將落在地板上”:然後可以通過進行放開球並觀察結果的實驗來測試該建議。正式地,將假設與其相反或無效的假設進行了比較(“如果我釋放這個球,它將不會落在地板上”)。無效的假設是,通過正在研究的推理沒有該現象的解釋或預測能力。一旦定義了假設,就可以進行實驗,並分析結果以確認,駁斥或定義假設的準確性。
還可以設計實驗以估計附近未處理單元的溢出效應。
自然實驗
“實驗”一詞通常意味著受控的實驗,但有時受控的實驗極難,不可能,不道德或非法。在這種情況下,研究人員訴諸於自然實驗或準實驗。自然實驗僅依賴於研究系統變量的觀察,而不是僅僅操縱一個或幾個變量,就像受控實驗中發生的那樣。在可能的程度上,他們試圖以一種可以確定所有變量的貢獻,並且某些變量變化的影響保持近似恆定,從而可以識別其他變量的效果。可能的程度取決於觀察到的數據中觀察到的解釋變量之間的相關性。當這些變量不太相關時,自然實驗可以接近受控實驗的功能。但是,通常,這些變量之間存在一些相關性,從而降低了自然實驗相對於如果進行受控實驗的結論,那麼自然實驗的可靠性。同樣,由於自然實驗通常發生在不受控制的環境中,因此未檢測到的源的變量既不能測量也不恒定,並且這些變量可能會在研究的變量中產生虛幻的相關性。
在幾個科學學科中進行了許多研究,包括經濟學,人類地理學,考古學,社會學,文化人類學,地質學,古生物學,生態學,氣象學和天文學,都依賴於準體驗。例如,在天文學中,當測試假設“恆星崩潰的氫雲”時,顯然是不可能的,以開始使用巨大的氫雲,然後執行等待數十億年才能形成恆星的實驗。但是,通過觀察各種崩潰狀態中的各種氫雲以及假設的其他含義(例如,恆星光中存在各種光譜排放),我們可以收集我們所需的數據來支持該假設。這種實驗的一個早期例子是17世紀的第一個驗證,即光不會瞬間到達,而是具有可測量的速度。當木星離地球更遠時,與木星更靠近地球時,觀察木星衛星的出現略有延遲。這種現像被用來證明衛星出現時間的差異與可測量的速度一致。
現場實驗
現場實驗的命名是為了將它們與實驗室實驗區分開來,該實驗通過在實驗室的人工和高度控制的環境中檢驗假設來實現科學控制。現場實驗經常用於社會科學,尤其是在教育和健康干預的經濟分析中,其優勢是在自然環境中而不是在人為的實驗室環境中觀察到結果。因此,現場實驗有時比實驗室實驗具有更高的外部有效性。但是,像自然實驗一樣,現場實驗會遭受污染的可能性:可以在實驗室中更精確和確定性控制實驗條件。然而,某些現象(例如,選舉中的選民投票率)在實驗室中無法輕易研究。
觀察性研究

當觀察性研究不切實際,不道德,成本障礙(或其他效率低下)以將物理或社交系統適合實驗室環境,完全控制混雜因素或應用隨機分配。當混雜因素受到限製或已知足以分析數據時,也可以使用它(儘管當社會現象正在接受檢查時,這可能很少)。為了使觀察科學有效,實驗者必須了解並說明混雜因素。在這些情況下,觀察性研究具有價值,因為它們經常提出可以通過隨機實驗或收集新數據來測試的假設。
但是,從根本上講,觀察性研究不是實驗。根據定義,觀察性研究缺乏培根實驗所需的操縱。此外,觀察性研究(例如,在生物或社會系統中)通常涉及難以量化或控制的變量。觀察性研究受到限制,因為它們缺乏隨機實驗的統計特性。在一個隨機實驗中,實驗協議中指定的隨機化方法指導統計分析,這通常也由實驗方案指定。沒有反映客觀隨機化的統計模型,統計分析就依賴於主觀模型。主觀模型的推論在理論和實踐中是不可靠的。實際上,在幾種情況下,經過精心進行的觀察性研究始終如一地給出錯誤的結果,即觀察性研究的結果不一致,並且與實驗結果不同。例如,對結腸癌的流行病學研究始終顯示出與西蘭花消耗的有益相關性,而實驗沒有任何益處。
涉及人類受試者的觀察性研究的一個特殊問題是,在治療(或暴露)之間進行公平比較的巨大困難,因為這些研究容易偏見,並且接受不同治療方法(暴露)的群體可能會根據其協變量(年齡,年齡,年齡)的差異很大。身高,體重,藥物,運動,營養狀況,種族,家庭病史等)。相反,隨機化意味著對於每個協變量,每組的平均值預計相同。對於任何隨機試驗,當然可以預期與平均值的某些變化,但是隨機分組可確保實驗組的平均值接近,這是由於中心限制定理和馬爾可夫的不平等。由於隨機化不足或樣本量不足,治療組(或暴露組)之間的協變量的系統變化使得很難將治療(暴露)的影響(暴露)與其他協變量的影響分開,其中大多數尚未測量。用於分析此類數據的數學模型必須考慮每個不同的協變量(如果測量),並且如果協變量既不隨機,也不包括在模型中,則結果是沒有意義的。
為了避免導致實驗差不多的條件,進行醫學試驗的醫生(例如美國食品和藥物管理局批准)對可以識別的協變量進行了量化和隨機化。研究人員試圖使用匹配方法(例如傾向得分匹配)來減少觀察性研究的偏見,這些方法需要大量的受試者和有關協變量的廣泛信息。但是,不再建議將傾向分數匹配作為一種技術,因為它會增加而不是減少偏差。在可能的情況下,還可以量化結果(骨密度,血液中某些細胞或物質的數量,體力或耐力等),而不是基於受試者或專業觀察者的意見。這樣,觀察性研究的設計就可以使結果更加客觀,因此更具說服力。
倫理
通過將自變量的分佈置於研究人員的控制下,一個實驗(尤其是在涉及人類受試者的情況下)引起了潛在的道德考慮因素,例如平衡益處和危害,相當分佈的干預措施(例如,治療疾病的治療方法, ),並獲得知情同意。例如,在心理學或醫療保健中,為患者提供不合格的治療是不道德的。因此,道德審查委員會應該停止臨床試驗和其他實驗,除非據信新的治療方法可以提供與當前最佳實踐一樣好的好處。對不合格或有害治療的影響進行隨機實驗,例如攝入砷對人類健康的影響,通常是不道德的(通常是非法的)。為了了解這種暴露的影響,科學家有時會使用觀察性研究來了解這些因素的影響。
即使實驗研究不直接涉及人類受試者,它仍然可能引起道德問題。例如,曼哈頓項目進行的核彈實驗暗示著使用核反應來傷害人類,即使實驗並不直接涉及任何人類受試者。