<ol id="ebnk9"></ol>
    1. 基于AE-LSTM,改進模型的高齡人口死亡率預測

      發布時間:2025-06-25 20:16:22   來源:心得體會    點擊:   
      字號:

      楊剛 易艷萍 孫超

      (湖南工商大學理學院,長沙,410205)

      根據1956 年聯合國《人口老齡化及其社會經濟后果》確定的劃分標準,當一個國家或地區65歲及以上老年人口數量占總人口比例超過7%時,則意味著這個國家或地區進入老齡化. 1982 年維也納老齡問題世界大會,確定60 歲及以上老年人口占總人口比例超過10%,意味著這個國家或地區進入嚴重老齡化. 按照這個國際標準,我國早在1999 年就已經進入老齡化社會. 2020 年第七次全國人口普查結果顯示,我國60 歲及以上人口達到26402 萬人,占總人口的18.70%,說明我國人口老齡化程度很高. 國務院預計2035 年前后,我國老年人口占比將超過30%,意味著我國將進入重度老齡化階段,這將對經濟運行全領域、社會建設各環節、社會文化多方面產生深遠影響.

      在2020 年10 月十九屆五中全會《中共中央關于制定國民經濟和社會發展第十四個五年規劃和二〇三五年遠景目標的建議》綱領性文件中,我國提出要實施積極應對人口老齡化的國家戰略.而在應對人口老齡化帶來的多重挑戰中,最為艱巨的是老齡化社會面臨的長壽風險. 當人口未來的平均實際壽命高于預期壽命時,就會產生長壽風險,它將給政府的養老金保險,商業年金的負債評估和償付能力管理以及國家老齡事業和產業的發展帶來一定的挑戰[1]. 因此,對人口死亡率尤其是高齡人口死亡率的預測分析具有十分重要的理論價值和現實意義.

      常用的死亡率預測模型分為靜態死亡率預測模型和動態死亡率預測模型[2]. 靜態死亡率模型是基于死亡率歷史數據和生命表模擬歷史死亡率的變化,對歷史死亡率進行擬合. 該方法只考慮了死亡率和年齡之間的關系,無法刻畫死亡率隨時間的動態變化,因此難以進行死亡率外推預測. 隨后,國內外學者相繼在靜態死亡率模型的基礎上考慮了時間、出生年和日歷年等因素,建立了以Lee-Carter 模型為代表的動態死亡率預測模型. 由于動態死亡率預測模型可廣泛應用于長壽風險度量、壽險產品定價與長壽風險管理等領域,因此現在大多數學者都采用動態死亡率預測模型對人口死亡率進行預測.

      動態死亡率預測模型很好地解決了靜態死亡率模型無法刻畫死亡率隨時間動態改善的缺陷,但其往往基于人口死亡率線性動態變化的假設,通過在Lee-Carter 模型的基礎上增加影響人口死亡率的因素,或者減少模型的參數來進行推廣和改進,因此動態死亡率預測模型只能刻畫影響因素與人口死亡率之間的線性關系,對人口死亡率的非線性結構研究還存在一定的限制條件. 而在機器學習算法中,核函數以及激活函數的非線性可以實現數據的非線性映射,從而讓機器學習算法具備優秀的數據非線性學習能力. 目前已有應用機器學習算法進行人口死亡率建模和預測的相關工作,并取得了不錯的效果.

      機器學習主要通過間接方式、直接方式兩種途徑應用于人口死亡率預測. 間接方式是以動態死亡率預測模型為基礎,利用機器學習算法提升人口死亡率的擬合效果和預測效果. Deprez 等(2017)[3]首先使用Lee-Carter 和RH 模型擬合瑞士人口死亡率數據,然后使用回歸樹算法提升兩個隨機死亡率模型的擬合度,并對各年齡段死因進行分析. Susanna 和Virginia(2019)[4]在回歸樹的基礎上,增加了隨機森林和梯度提升算法,發現隨機森林算法能夠更有效地提升人口死亡率的擬合度. 汪志偉(2021)[5]將長短記憶神經網絡(LSTM)算法與其它擬合精度算法進行比較,研究表明LSTM 算法擬合效果提升更大. 在此類研究中,機器學習算法雖然能夠在隨機死亡率模型的基礎上提升人口死亡率擬合效果,但對人口死亡率的研究依然局限于死亡率線性動態的假設.

      而直接方式是利用機器學習算法建立死亡率預測模型對人口死亡率數據直接進行擬合預測.Hainaut(2018a)[6],張連增等(2020)[7]用非線性時變函數替代隨機死亡率Lee-Carter 模型中線性交互部分,提出了神經網絡死亡率模型,并通過帶漂移項的隨機游走模型進行預測,發現神經網絡死亡率模型性能優于Lee-Carter 模型. 陳寧(2019)[8]通過在輸入的人口死亡率數據中加入噪聲建立降噪自編碼器,對我國人口死亡率數據進行擬合預測,研究發現降噪自編碼器的預測結果整體上優于Lee-Carter 模型. 機器學習算法主要通過提高人口死亡率的擬合優度提升人口死亡率模型預測的整體性能,但對時間因子進行預測依然停留在傳統的時間序列模型.

      綜上所述,目前針對人口死亡率的預測模型仍可以進一步優化. 首先,人口死亡率非線性結構的刻畫仍需進一步深化. 目前國內外對人口死亡率神經網絡算法研究相對欠缺,且大多數神經網絡算法基于自編碼器進行研究. 機器學習算法發展迅猛,一些新興的算法目前還沒有應用于人口死亡率預測的研究領域. 其次,在神經網絡構建中,神經元個數、網絡深度、激活函數以及目標函數等這些超參數的選擇決定了神經網絡對人口死亡率的擬合效果,而超參數選擇的主觀性和隨意性,容易導致研究結論過于片面. 針對人口死亡率神經網絡的超參數選擇目前還沒有形成相對成熟的方法.

      由于人口死亡率數據屬于多元時間序列,人口死亡率預測為多變量時間序列預測. 受許奕杰等(2020)[9]工作的啟發,本文建立一個AE-LSTM 改進模型,利用自編碼器(AE)模型自我學習的特性,在AE-LSTM 模型的基礎上增加AE 模型的解碼過程,使得該模型能夠實現從單一變量預測到多元時間序列預測的轉換. 相對于全人口死亡率模型,高齡人口死亡率預測的研究對我國積極應對人口老齡化風險具有更加重要的戰略意義,因此,本文選取我國大陸1994-2018 年60-89 歲高齡人口總體死亡率作為樣本數據進行實證分析.

      2.1 CBD 模型

      CBD 模型又稱雙因素死亡率模型,在Lee-Carter 模型中,不同年齡之間的死亡率完全相關,因此Currie 等(2006)[10]提出了CBD 模型彌補這一缺陷,其表達形式為:

      其中,φi為回歸參數,Li表示i階滯后算子,Δdkt表示對kt作d次一階差分,p為自相關項數,α是漂移項,θi為滑動平均參數,q為滑動平均項數,μt表示均值為零、方差確定的白噪聲過程.

      2.2 AE-LSTM 改進模型

      2.2.1 AE-LSTM 模型

      Rumelhart 等(1986)[12]提出自動編碼器的概念,并將其用于高維復雜數據處理. AE 模型是以輸入信息為學習目標,旨在將輸入信息復制到輸出,其常用于高維數據的非線性降維和特征學習.AE 模型主要分為編碼和解碼兩個部分,各層神經元通過權重和激活函數連接. 編碼過程就是通過兩次非線性轉換將原數據的維數減少. 解碼過程則是通過兩次非線性轉換將低維數據映射到原高維數據,實現降維數據到原數據的還原. AE 模型的提出促進了人工神經網絡的發展.

      循環神經網絡(RNN)是一類用來處理時間序列的機器學習算法. Hochreiter 等(1997)[13]對一般RNN 進行改進,提出了LSTM 模型. LSTM 模型的基本單元為記憶模塊,相對于一般RNN 只有簡單的tanh 層的重復模塊,LSTM 包含了四個神經網絡層,包括細胞狀態、忘記門、輸入門和輸出門. LSTM 模型的提出解決了一般RNN 存在的長期依賴問題,它可以處理和預測事件序列中時間間隔和延遲比較長的重要事件,將遠距離的上下文信息運用到當前時刻.

      AE-LSTM 模型是一個混合神經網絡,由上述兩部分組成. 第一部分為AE 模型的編碼部分,其主要作用是對原始數據進行特征提取. 第二部分為LSTM 模型,其主要作用是對AE 模型提取的特征數據進行時間序列預測,并通過在LSTM 網絡最后一層加入SoftMax 層,實現分類數據的預測,AE-LSTM 模型的結構如圖1 所示.

      圖1 AE-LSTM 模型結構示意圖

      設Xi(t) 表示第i個屬性在時間t時的取值, 則樣本矩陣可以表示為:X(t) =(X1(t),X2(t),··· ,Xn(t))T. AE-LSTM 模型通過以下步驟實現.

      第一步: 將原始數據X(t)輸入AE 模型進行訓練,利用編碼過程計算得到編碼數據:

      其中,fdec(·)為解碼函數,fenc(·)為編碼函數, ?X(t)表示AE 模型對原始數據的擬合結果.

      第二步: 將編碼數據輸入到LSTM 模型中得到因變量輸出值?y(t):

      其中,fLST M(·) 為LSTM 函數, 最終通過比較模型輸出值?y(t) 和實際值y(t) 之間的差距, 評價AE-LSTM 模型的性能.

      2.2.2 AE-LSTM 改進模型

      在上述的AE-LSTM 模型中,主要利用AE 模型對多維自變量降維,LSTM 模型實現對單一因變量的精準預測. 由于在本研究中死亡率數據屬于多元時間序列,自變量和因變量的數據集相同,對人口死亡率的預測不再是對單一因變量預測,而是對多變量預測. 因此,本文提出一個AE-LSTM改進模型,在原AE-LSTM 模型的基礎上,增加AE 模型的解碼過程,在完成單一時間序列預測的基礎下,實現多變量預測. 改進后的AE-LSTM 模型具體結構如圖2 所示:

      圖2 AE-LSTM 改進模型結構示意圖

      本文的輸入變量X(t)表示對數死亡率,具體形式為:

      其中,lnmx,t表示在第t年x歲的人群的對數死亡率. AE-LSTM 改進模型的實現步驟如下:

      第一步: 與式(2.1)相同,首先輸入歸一化處理之后的對數死亡率數據對AE 模型進行訓練,通過編碼過程得到潛在時間因子K(t).

      第二步: 假設上一步驟得到的潛在時間因子K(t)滯留時間步長為q,將其輸入LSTM 模型中進行擬合預測,得到預測值?K(t):

      第三步: 將LSTM 的預測值?K(t)輸入到第一步AE 模型訓練得到的解碼過程,得到人口死亡率的預測值?X(t):

      上述改進的AE-LSTM 改進人口死亡率模型主要具有以下優點:

      ①AE 部分是一個輸入和學習目標相同的神經網絡,這種學習特性使得該模型能夠應用于多元時間序列數據預測,即通過解碼器對時間序列模型得到的預測值進行解碼可以實現未來的人口死亡率預測;

      ②LSTM 部分能夠處理時間序列數據的長記憶性,可以對潛在時間因子進行更加精準地擬合和外推;

      ③AE-LSTM 改進模型中非線性激活函數以及神經網絡的多層設計可以替代傳統隨機動態死亡率預測模型中的線性交互部分,捕捉到人口死亡率中的非線性部分,同時又解除隨機動態死亡率預測模型中對系數的約束,能夠更多地學習到人口死亡率的變化.

      2.3 數據描述

      2.3.1 數據來源

      本文選取中國大陸1994-2018 年60-89 歲高齡人口分年齡總體死亡率數據進行實證分析,選取日本1947-2018 年60-89 歲高齡人口分年齡死亡率數據對本文提出的模型進行魯棒性檢驗. 其中中國大陸人口死亡率數據來源于《中國人口統計年鑒》和《中國人口和就業統計年鑒》. 中國大陸的死亡率數據是由人口抽樣得到,其中2000 年和2010 年為普查數據,2005 年和2015 年為1%人口抽樣調查,其余各年為1‰人口抽樣調查. 日本死亡率數據來源于人類死亡率數據庫HMD(Human Mortality Database)1人類死亡數據庫由美國加州大學伯克利分校人口系和德國羅斯托克普朗克人口研究所于2002 年共同建立, 網址https://www.mortality.org.

      2.3.2 數據處理

      針對中國大陸1996 年85-89 歲人群的死亡率缺失數據,本文運用鄰近線性插值法對暴露人數和死亡率人數缺失值進行數據補充,間接獲取死亡率數據. 考慮到數據的可比性,本文通過對非普查年份的暴露人數和死亡人數進行線性變換,暴露人數的線性變換公式為:

      本文對中國大陸死亡率數據和日本死亡率數據進行對數化處理. 為了提高模型的預測精度和收斂速度,對數死亡率需要進一步歸一化處理,將每一年的對數死亡率線性轉換至0-1. 對于每一年t,其歸一化公式為:

      2.3.3 描述性分析

      本文給出了經過數據處理之后的中國大陸1994-2018 年60-89 歲高齡人口風險暴露人數、死亡人數和死亡率分布情況,如圖3 所示.

      圖3(a)給出了各個年齡在不同年份中風險暴露人數的分布情況. 可以發現,隨著年齡的增加,風險暴露人數越來越少,符合社會人類生存規律. 對于同一年齡的風險暴露人數雖然隨著時間的變化會出現不同程度的波動,但總體趨勢還是在不斷地增加. 圖3(b)給出了死亡人數的分布情況. 可以發現,在75 歲左右死亡人數出現高峰,60 歲到75 歲之前,死亡人數隨著年齡的增加而增加,75歲之后,死亡人數隨著年齡的增加而下降,主要原因為75 歲以后風險暴露人數的減少,使得死亡人數減少. 從時間維度看,不同年齡的死亡人數隨著時間的推移呈現波動式增加的趨勢. 圖3(c)展示了死亡率的分布規律. 可以看到,60-75 歲死亡率波動較小,75-89 歲死亡率波動較大,其波動主要是因為風險暴露人數的數量少以及一些不可抗拒的環境因素發生等影響,如2003 年SARS 盛行導致人口死亡率出現小高峰. 圖3(d)分別給出了60 歲、70 歲和80 歲老年人死亡率隨時間推移的變化趨勢. 從圖中可以看出,三個年齡死亡率都呈現下降的趨勢,其中年齡越高,死亡率下降的速度越快,波動性也越大,從中也可以看出對高年齡段死亡率的預測是建立死亡率預測模型的重點.

      圖3 中國大陸1994-2018 年60-89 歲人口數據分布

      3.1 AE 模型與CBD 模型擬合效果對比分析

      本文樣本數據量相對較少,對死亡率模型的建立具有一定的挑戰性. 對于神經網絡,網絡節點的增加可以增加神經網絡的擬合效果. 就AE 模型而言,網絡太深使得特征壓縮過多,會損失更多的原始信息,且容易出現過度擬合現象,因此本文借鑒張連增等(2020)[7]的研究成果,建立五層自編碼神經網絡對中國高齡死亡率數據進行擬合. 由于每一年存在30 個死亡率數據,所以輸入層神經元個數為30,輸出層神經元個數也為30. 設隱藏層一和隱藏層三的神經元個數都為15;
      為與CBD 模型進行對比,隱藏層二的神經元個數設為2. 該AE 模型中連接五層神經元之間的激活函數分別設定為tanh 函數、linear 函數、tanh 函數和sigmoid 函數.

      選取1994-2014 年60-89 歲分年齡死亡率數據作為訓練集對五層AE 模型進行訓練, 利用2015-2018 年60-89 歲分年齡死亡率數據作為測試集檢驗模型的穩定性. 本文借鑒棧式自編碼器訓練權重的方法,首先通過對單個三層AE 模型預訓練獲取各層網絡的初始權重,再對整個五層AE 模型微調得到最終最優模型. 步驟如下.

      第一步: 訓練第一個自編碼器. 首先建立輸入層和輸出層神經元個數都為30,隱藏層神經元個數為20 的三層自編碼器. 將對數死亡率輸入該模型進行訓練,通過觀察訓練集和測試集的模型損失曲線,最終確定當樣本數據對模型訓練次數epoch=5000 時,訓練集和測試集的擬合效果最佳,同時將得到的各層之間權重作為輸入層到隱藏層一和隱藏層四到隱藏層五之間的初始權重;

      第二步: 訓練第二個自編碼器. 將步驟一的降維結果輸入到輸入層和輸出層神經元個數都為20,隱藏層神經元個數為2 的三層自編碼器,對其訓練5000 次,得到隱藏層二到隱藏層三和隱藏層三到隱藏層四之間的初始權重.

      第三步: 微調. 利用前兩個步驟得到的初始權重代入五層AE 模型訓練500 次,得到最終訓練完成的五層AE 模型.

      此次訓練均將均方誤差(MSE) 作為評價模型損失的關鍵指標. 所用的優化算法是結合AdaGrad 和RMSProp 方法最佳屬性的Adam 算法,通過python3.7 軟件,在TensorFlow2.1 平臺實現. 圖4 為微調過程中訓練集和測試集的模型損失隨訓練次數增加的變化. 可以看到,訓練集和測試集的損失下降幅度幾乎相同且接近于0. 訓練集的損失接近于0,說明該自編碼器都能很好地學習到我國高齡人口死亡率的數據特征. 測試集的損失接近于0,說明該模型具有很強的魯棒性和泛化性,能夠對死亡率進行預測.

      圖4 AE 模型損失

      CBD 模型是目前應用范圍最廣的高齡人口死亡率模型. 本文根據高齡人口死亡率訓練集數據建立相應的CBD 模型,并用最大似然估計法對模型參數進行估計. 圖5 和圖6 分別展示了AE 模型和CBD 模型對1994-2014 年60 歲、70 歲和80 歲死亡率數據的擬合效果. 兩個模型都可以很好擬合低年齡段的死亡率變化趨勢. 隨著年齡的升高,死亡率波動越來越頻繁,擬合效果越來越不理想. 對比兩個模型的擬合效果發現AE 模型相對于CBD 模型能夠反應死亡率隨時間的波動,CBD模型則能夠較好地反應死亡率的平均趨勢.

      圖5 CBD 模型擬合圖

      圖6 AE 模型擬合圖

      表1 展示了對兩個模型判斷擬合效果的絕對評價指標MSE 和相對評價指標平均百分比誤差(MAPE)的比較結果. 可以看出,兩個模型都具有較好的擬合效果,但無論從MSE 還是MAPE 的結果都可以發現,AE 模型的兩個評價指標都小于CBD 模型對應的評價指標,說明AE 模型的擬合效果相對較優.

      表1 CBD 模型和AE 模型擬合指標

      3.2 LSTM 模型與ARIMA 模型預測效果對比分析

      在前人的研究中,大多數學者使用隨機游走過程對時間因子進行擬合和外推,以達到對未來死亡率進行預測的目的. 在機器學習算法中,循環神經網絡也常用于處理時間序列數據. 本文建立LSTM 模型對時間因子進行擬合和預測.

      本文使用三層LSTM 模型對死亡率進行預測,其中隱藏神經元個數分別為20,50,30. 第一層的輸出作為第二層神經網絡的輸入,第二層神經網絡的輸出作為第三層網絡的輸入,各層激活函數分別使用linear 函數、sigmoid 函數以及tanh 函數,模型損失使用MSE 衡量,優化算法使用Adam算法.

      通過AE 模型的編碼過程可以得到兩個潛在時間因子的訓練集和測試集. 在利用LSTM 模型分別對時間因子進行預測之前,先對訓練集數據進行整理. 由于整體數據量較少,因此,本文設定時間因子滯留時間步長q= 2,即利用前兩個數據來預測第三個數據的數值,其K1(t)劃分結構如表2 所示,K2(t)劃分結構與K1(t)相同.

      表2 時間因子樣本劃分

      為得到LSTM 模型的初始權重,本文先對LSTM 模型進行預訓練,選出預訓練損失最小的權重作為模型的初始權重,最后對LSTM 模型進行微調得到最終最優模型,其步驟如下.

      第一步: 確定預訓練參數epoch. 這里,epoch 為全部樣本數據對模型進行完整訓練的次數. 因為LSTM 模型計算復雜度較高,耗時較長,對其進行預訓練時,應在保證模型效果的同時盡量減小epoch 的數值. 將時間因子輸入LSTM 模型,通過觀察訓練集的模型損失曲線,發現訓練次數epoch=10 時,損失曲線最終趨于0 且逐漸平穩,能夠較好地保證LSTM 模型的擬合效果.

      第二步: 獲取最優初始權重. 將時間因子K1(t)輸入對LSTM 模型訓練重復500 次,epoch 設定為步驟一得到的數值10,選取模型損失最小的權重作為LSTM 模型的初始權重.

      第三步: 微調. 基于對神經網絡訓練充足,同時避免過擬合現象的原則,確定利用步驟二得到的權重對LSTM 訓練100 次,得到最終LSTM 模型.

      對于時間因子K2(t)的LSTM 模型采用相同的步驟訓練得到. 最終K1(t)和K2(t)模型損失程度隨模型訓練次數變化如圖7 和圖8 所示. 可以看到整體模型的損失越來越小,且接近于0,說明模型能夠很好地擬合數據.

      圖7 K1-LSTM 模型損失

      圖8 K2-LSTM 模型損失

      本文使用傳統的ARIMA 模型對相同的訓練集和測試集進行擬合和預測, 使用R 軟件對兩個時間因子分別建立隨機游走模型,利用MSE 和MAPE 評價兩個模型的擬合和預測情況. 對比結果如表3 所示. 可以看到,無論是K1(t)還是K2(t),LSTM 模型各個擬合效果指標都低于傳統的ARIMA 模型相應的指標,說明LSTM 模型的擬合精度高于ARIMA 模型. 從預測的結果來看,LSTM 模型的預測誤差依然比ARIMA 模型更小,預測結果更加準確. 從整體情況來看,LSTM 模型優于ARIMA 模型.

      表3 ARIMA 模型和LSTM 模型指標對比

      3.3 AE-LSTM 改進模型與CBD 模型預測效果對比分析

      利用訓練后五層AE 模型的解碼器對LSTM 模型輸出的K1(t)和K2(t)預測值進行解碼,得到我國大陸高齡人口死亡率的預測值. 同時本文基于傳統CBD 模型和ARIMA 模型對我國大陸高齡人口死亡率進行預測,選取MSE 和MAPE 評價指標對比AE-LSTM 改進模型與CBD 模型的預測效果.

      表4 為CBD 模型和AE-LSTM 改進模型預測效果評價指標對比. 可以看到,AE-LSTM 改進模型的均方誤差為0.000023,小于CBD 模型的均方誤差0.000184,且AE-LSTM 改進模型的平均百分比誤差與CBD 模型相比下降幅度更大,下降了65%,說明AE-LSTM 改進模型的預測效果優于CBD 模型.

      表4 CBD 模型和AE-LSTM 改進模型預測效果對比

      圖9 展示了2015-2018 年AE-LSTM 改進模型和CBD 模型的預測效果. 可以很明顯地看到, CBD 模型預測曲線較為平滑, 無法捕捉到死亡率的波動, 并高估了高齡人口的死亡率;

      而AE-LSTM 改進模型可以捕捉死亡率隨時間變化的波動, 且更加精準地預測未來死亡率的數值.因此: AE-LSTM 改進模型較傳統的人口死亡率CBD 模型預測精度有顯著提高,說明本文建立的AE-LSTM 改進模型具有實際意義.

      圖9 CBD 模型和AE-LSTM 改進模型預測效果對比圖

      3.4 AE-LSTM 改進模型魯棒性檢驗

      本文選取日本1947-2018 年60-89 歲高齡人口分年齡死亡率數據對AE-LSTM 改進模型進行魯棒性檢驗,并與CBD 模型的魯棒性進行對比. 將1947-2009 年60-89 歲高齡人口死亡率數據作為訓練集,2010-2018 年60-89 歲高齡人口死亡率數據作為測試集對兩個模型進行訓練,其中評價指標差值是基于日本死亡率數據集得到的評價指標與基于中國大陸死亡率數據集的評價指標之差.

      表5 為AE-LSTM 改進模型和CBD 模型魯棒性檢驗的對比結果. 可以看出,無論是擬合效果還是預測效果,AE-LSTM 改進模型的MSE 和MAPE 兩個評價指標都要低于CBD 模型相應的評價指標,表明AE-LSTM 改進模型在日本高齡人口死亡率數據的基礎上擬合效果和預測效果依然優于CBD 模型. 與中國大陸人口死亡率的擬合效果和預測效果相比,AE-LSTM 改進模型的評價指標差值皆為負數,說明該模型對日本高齡人口死亡率數據擬合預測效果更好,而CBD 模型的評價指標差值都為正數,說明CBD 模型對日本高齡人口死亡率的適應能力相對較差. 對比兩個模型的評價指標差值的絕對值,發現AE-LSTM 改進模型的相對CBD 模型絕對值相對較低,擬合和預測效果更加穩定. 通過魯棒性檢驗結果可以看出,AE-LSTM 改進模型能夠學習到不同地區的數據特點,并進行更加精準的人口死亡率預測,且預測效果更加穩定.

      表5 AE-LSTM 改進模型和CBD 模型魯棒性檢驗對比結果

      本文基于人口死亡率數據的多元時間序列結構,建立了一個AE-LSTM 改進模型,對高齡人口死亡率進行擬合和預測. 通過實證分析發現,AE-LSTM 改進模型對死亡率的擬合和預測精度比傳統CBD 模型更高,且魯棒性更強. 在人口老齡化背景下,從國家戰略層面上來看,本研究可以為政府制定養老金體系改革相關政策提供一定的決策參考. 從保險公司運營層面來看,本研究有助于保險公司有效度量和管理長壽風險,推動整個保險行業可持續發展.

      在后期研究中,我們可以進一步完善人口死亡率預測模型. 首先可以嘗試采用其他類型的機器學習算法探究人口死亡率的非線性結構;
      其次可以嘗試增加收入、就業、地區等人口壽命影響因素,提升對人口死亡率的預測效果.

      猜你喜歡高齡死亡率人口《世界人口日》青春期健康(2022年13期)2022-07-18人口轉型為何在加速 精讀英語文摘(2022年4期)2022-06-05走路可以降低死亡率中老年保健(2021年4期)2021-08-22春季養雞這樣降低死亡率今日農業(2021年5期)2021-05-22新冠肺炎的死亡率為何難確定?科學之謎(2020年6期)2020-08-11急性爛鰓、套腸、敗血癥…一旦治療不及時,死亡率或高達90%,叉尾鮰真的值得養嗎?當代水產(2019年8期)2019-10-12人口最少的國家小天使·一年級語數英綜合(2018年3期)2018-06-221723 萬人,我國人口數據下滑引關注領導決策信息(2018年10期)2018-05-22高齡老年混合型神經梅毒1例西南軍醫(2016年4期)2016-01-23超高齡瘙癢癥1例西南軍醫(2016年2期)2016-01-23
      国产另类无码专区|日本教师强伦姧在线观|看纯日姘一级毛片|91久久夜色精品国产按摩|337p日本欧洲亚洲大胆精

      <ol id="ebnk9"></ol>