預測分析
預測分析是一種應用機器學習的業務分析形式,以生成某些業務應用程序的預測模型。因此,它涵蓋了從預測建模和機器學習中的各種統計技術,它們分析了當前和歷史事實,以對未來或未知事件進行預測。它代表了機器學習應用的主要子集;在某些情況下,它是機器學習的代名詞。
在業務中,預測模型利用歷史和交易數據中發現的模式來識別風險和機會。模型捕獲了許多因素之間的關係,以評估與特定條件相關的風險或潛力,並指導候選交易的決策。
這些技術方法的定義功能效應是,預測分析為每個人(客戶,員工,醫療保健患者,產品SKU,車輛,組件,機器或其他組織單位)提供了預測分數(概率),以確定,告知,告知或影響組織流程,這些過程與大量個人有關,例如在營銷,信用風險評估,欺詐檢測,製造業,醫療保健和政府運營中,包括執法。
定義
預測分析是一組商業智能(BI)技術,可揭示大量數據中的關係和模式,可用於預測行為和事件。與其他BI技術不同,預測分析是前瞻性的,它利用過去的事件來預測未來。預測分析統計技術包括數據建模,機器學習, AI ,深度學習算法和數據挖掘。通常,興趣的事件通常是將來,但是預測分析可以應用於任何類型的未知類型,無論是過去,現在還是將來。例如,確定犯罪發生後的嫌疑人,或者是信用卡欺詐。預測分析的核心依賴於捕獲解釋變量與過去發生的預測變量之間的關係,並利用它們來預測未知結果。但是,重要的是要注意,結果的準確性和可用性將在很大程度上取決於數據分析水平和假設的質量。
預測分析通常定義為在更詳細的粒度水平上預測,即為每個組織元素生成預測分數(概率)。這將其與預測區分開。例如,“預測分析 - 從經驗(數據)中學習的技術來預測個人的未來行為,以推動更好的決策”。在未來的工業系統中,預測分析的價值將是預測和防止潛在問題實現接近零的分解,並進一步整合到規定性分析中以進行決策優化。
分析技術
用於進行預測分析的方法和技術可以廣泛地分為回歸技術和機器學習技術。
機器學習
機器學習可以定義為機器學習的能力,然後模仿需要智力的人類行為。這是通過人工智能,算法和模型來實現的。
自動回收的集成移動平均線(ARIMA)
Arima模型是時間序列模型的常見示例。這些模型使用自動性,這意味著該模型可以配備回歸軟件,該軟件將使用機器學習來完成大多數回歸分析和平滑。已知Arima模型沒有整體趨勢,而是在平均幅度穩定的平均值上有變化,從而導致統計上相似的時間模式。通過此,分析變量並過濾數據,以更好地理解和預測未來值。
Arima方法的一個示例是指數平滑模型。指數平滑考慮了舊數據集與較新的數據集之間的重要性差異,因為最新數據在預測未來值方面更準確和有價值。為了實現這一目標,將指數用於使較新的數據集在計算中的重量大於較舊的集合。
時間序列模型
時間序列模型是使用時間序列的機器學習子集,以便使用過去的值了解和預測數據。時間序列是變量值的序列,例如在商業應用中的年份或四分之一的時間內。為此,必須將數據平滑,或者必須刪除數據的隨機方差,以揭示數據中的趨勢。有多種方法可以實現這一目標。
移動平均值
單個移動平均方法利用越來越小的過去數據集來減少與單個平均值相關的誤差,從而使其平均值要比佔用整個數據集的平均值更準確。
中心移動平均方法利用單個移動平均方法中的數據,通過獲取中位數數據集的平均值。但是,由於使用偶數數據集很難計算出中值數據集,因此此方法在奇數數據集中比偶數效果更好。
預測建模
預測建模是一種用於預測未來行為的統計技術。它利用預測模型來分析給定樣品中特定單元與單元的一個或多個特徵之間的關係。這些模型的目的是評估另一個樣本中的單元顯示相同模式的可能性。預測模型解決方案可以視為一種數據挖掘技術。這些模型可以分析歷史數據和當前數據並生成模型,以預測潛在的未來結果。
通常,無論使用的方法如何創建預測模型的過程都涉及相同的步驟。首先,有必要確定項目目標和期望的結果並將其轉化為預測分析目標和任務。然後,分析源數據以確定最合適的數據和模型構建方法(模型僅與用於構建它們的適用數據一樣有用)。選擇並轉換數據以創建模型。創建和測試模型以評估它們是否有效,並能夠實現項目目標和指標。將模型的結果應用於適當的業務流程(確定數據中的模式並不一定意味著企業將了解如何利用或利用它)。之後,管理和維護模型以標準化和提高性能(模型管理的需求將增加,以滿足新的合規性法規)。
回歸分析
通常,回歸分析使用結構數據以及自變量的過去值以及它們與因變量之間的關係以形成預測。
線性回歸
在線性回歸中,繪製圖是用在y軸上繪製的因變量的先前值和正在分析在x軸上繪製的自變量的值的。然後,回歸線由代表變量和因變量之間的關係構建,該統計程序可用於預測僅基於自變量的因變量的值。使用回歸線,該程序還顯示了該行的斜率截距方程,其中包括回歸的誤差項的添加,其中誤差項的值越高,回歸模型的精確度就較小。為了降低誤差項的值,將其他獨立變量引入模型,並對這些自變量進行了類似的分析。此外,可以使用多個線性回歸(MLP)來解決涉及多個自變量的關係,從而提供更全面的建模方法。
申請
分析審查和審核的有條件期望
審計的一個重要方麵包括分析審查。在分析綜述中,確定了正在研究的帳戶餘額的合理性。審計師通過預測建模來完成此過程,以形成預測,稱為使用自迴旋積分移動平均值(ARIMA)方法和一般回歸分析方法,特別是通過用於分析審查(Star)方法的統計技術來審核的餘額的條件期望。
用於分析審查的Arima方法對過去的審計餘額進行了時間序列分析,以創建有條件的期望。然後將這些條件期望與審計帳戶中報告的實際餘額進行比較,以確定報告餘額與期望的距離。如果報告的餘額接近期望,則不會進一步審核帳戶。如果所報告的餘額與預期大不相同,則可能會發生材料會計錯誤並進行進一步的審核。
回歸分析方法以類似的方式部署,但所使用的回歸模型假設僅提供一個獨立變量。有助於審核帳戶餘額的自變量的重要性是使用過去的帳戶餘額以及當前的結構數據確定的。物質性是獨立變量與因變量的關係中的重要性。在這種情況下,因變量是帳戶餘額。通過此,最重要的自變量用於創建條件期望,與Arima方法類似,然後將條件期望與報告的帳戶餘額進行了比較,並根據兩個餘額的親密關係做出決定。
恆星方法使用回歸分析進行操作,並屬於兩種方法。第一個是星每月平衡方法,所做的有條件期望和所使用的回歸分析都與一個月的審核有關。另一種方法是“星年年平衡”方法,該方法通過基於有條件的期望和回歸分析在一年的審核中進行更大範圍。除了被審核的時間差異外,兩種方法都可以通過比較預期和報告的餘額來確定要進一步調查的帳戶來運行相同的操作。
此外,將分析程序納入審計標準強調了審計師修改這些方法以適應特定數據集的越來越多的必要性,這反映了經濟檢查的不斷變化的性質。
商業價值
當我們進入一個技術進步的世界中,在這些世界中創建越來越多的數據並以數字方式存儲時,企業正在尋找利用這一機會的方法,並利用此信息來幫助產生利潤。可以使用預測分析,並能夠為包括資產管理公司,保險公司,通信公司和許多其他公司在內的廣泛企業提供許多好處。在IDC進行的一項研究中,Dan Vasset和Henry D. Morris解釋了資產管理公司如何使用預測分析來開發更好的營銷活動。他們從大規模營銷方法轉到以客戶為中心的方法,在這種方法中,他們沒有向每個客戶發送相同的報價,而是根據客戶個性化每個優惠。預測分析用於預測可能客戶接受個性化優惠的可能性。由於營銷活動和預測分析,該公司的接受率飆升,是接受個性化報價的人數的三倍。
預測分析的技術進步已提高了對公司的價值。一種技術進步是更強大的計算機,並且使用這種預測分析已經能夠更快地在大型數據集上創建預測。隨著計算能力的增加,還會有更多的數據和應用程序,這意味著與預測分析一起使用的更多輸入。另一個技術進步包括一個更具用戶友好的界面,使員工有效地利用軟件和應用程序所需的較小的入境障礙和較少的培訓。由於這些進步,更多的公司正在採用預測分析,並看到員工效率和有效性以及利潤的好處。
現金流預測
Arima單變量和多元模型可用於預測公司的未來現金流量,其方程和計算基於過去的某些因素的價值,這些因素有助於現金流量。使用時間序列分析,可以分析和推斷這些因素的值,以預測公司的未來現金流量。對於單變量模型,現金流的過去值是預測中使用的唯一因素。同時,多元模型使用與應計數據有關的多種因素,例如折舊前的運營收入。
預測現金流的另一個模型是在1998年開發的,被稱為Dechow,Kothari和Watts模型或DKW(1998)。 DKW(1998)使用回歸分析來確定多個變量和現金流之間的關係。通過這種方法,該模型發現現金流的變化和應計是負相關的,特別是通過當前的收入,並且使用這種關係可以預測下一個時期的現金流量。 DKW(1998)模型通過應計和現金流量與應付賬款和應收賬款以及庫存的關係得出這種關係。
兒童保護
一些兒童福利機構已經開始使用預測分析來標記高風險案例。例如,在佛羅里達州希爾斯伯勒縣,兒童福利機構使用預測建模工具可以阻止目標人群與虐待相關的兒童死亡。
預測法律決定的結果
AI計劃可以預測法律決策的結果。這些計劃可以用作該行業專業的輔助工具。
投資組合,產品或經濟水平預測
分析的重點通常不是消費者,而是產品,投資組合,公司,工業甚至經濟。例如,零售商可能有興趣預測庫存管理目的的商店級別需求。否則美聯儲委員會可能有興趣預測明年的失業率。這些類型的問題可以通過使用時間序列技術來解決預測分析(見下文)。它們也可以通過機器學習方法來解決,這些方法將原始時間序列轉化為特徵向量空間,在該空間中,學習算法找到具有預測能力的模式。
承保
許多企業由於其不同的服務而必須考慮風險敞口,並確定承擔風險所需的費用。預測分析可以通過預測疾病,違約,破產等的機會來幫助承保這些數量。預測分析可以通過使用應用程序級別數據預測客戶的未來風險行為來簡化客戶獲取的過程。信用評分形式的預測分析減少了貸款批准所需的時間,尤其是在抵押貸款市場中。適當的預測分析可以導致適當的定價決策,這可以幫助減輕未來的違約風險。預測分析可用於減輕道德危害並防止事故發生。
警務
警察機構現在正在利用積極的策略進行預防犯罪。預測分析利用統計工具來預測犯罪模式,為警察機構提供了動員資源和降低犯罪水平的新方法。通過對犯罪數據的預測分析,警察可以更好地分配有限的資源和人力,以防止更多的犯罪發生。可以使用定向巡邏或解決問題的巡邏來保護犯罪熱點,犯罪點的犯罪密度遠高於城市的平均水平。
運動的
幾家公司已經專門研究團隊和個人專業體育領域的預測分析。儘管預測人類行為會導致許多因素在做出預測後可能會發生變化的許多因素,包括傷害,主持儀式,教練決策,天氣等,但使用預測分析來投射長期趨勢和績效是有用的。大部分領域都是由Billy Beane在本世紀初的Moneyball概念開始的,現在大多數職業運動隊都採用了自己的分析部門。