Nature重磅:AI擊敗最先進(jìn)全球洪水預(yù)警系統(tǒng),提前7天預(yù)測(cè)河流洪水,每年挽救數(shù)千人生命
原創(chuàng) 學(xué)術(shù)頭條 學(xué)術(shù)頭條
洪水是最常見(jiàn)的自然災(zāi)害類型,全球有近 15 億人(約占世界人口的 19%)直接面臨嚴(yán)重洪水事件的巨大風(fēng)險(xiǎn)。洪水還造成巨大的物質(zhì)損失,每年造成全球經(jīng)濟(jì)損失約 500 億美元。
近年來(lái),人類造成的氣候變化進(jìn)一步增加了一些地區(qū)的洪水頻率。然而,目前的預(yù)報(bào)方法主要依賴沿河而建的觀測(cè)站,其在全球的分布并不均勻,這就導(dǎo)致未經(jīng)測(cè)量的河流更難預(yù)報(bào),其負(fù)面影響主要體現(xiàn)在發(fā)展中國(guó)家。升級(jí)預(yù)警系統(tǒng),使這些人群能夠獲得準(zhǔn)確、及時(shí)的信息,每年可以挽救數(shù)千人的生命。
那么,如何在全球范圍內(nèi)進(jìn)行可靠的洪水預(yù)報(bào)?人工智能(AI)模型或許大有可為。
如今,來(lái)自 Google Research 洪水預(yù)測(cè)團(tuán)隊(duì)的 Grey Nearing 及其同事開(kāi)發(fā)的人工智能模型,通過(guò)利用現(xiàn)有的 5680 個(gè)測(cè)量?jī)x進(jìn)行訓(xùn)練,可預(yù)測(cè)未測(cè)量流域在 7 天預(yù)測(cè)期內(nèi)的日徑流。
隨后,他們將該人工智能模型與全球領(lǐng)先的短期和長(zhǎng)期洪水預(yù)測(cè)軟件——全球洪水預(yù)警系統(tǒng)(GloFAS)進(jìn)行了對(duì)比測(cè)試。結(jié)果顯示,該模型同日預(yù)測(cè)準(zhǔn)確率與當(dāng)前系統(tǒng)相當(dāng)甚至更高。
此外,該模型在預(yù)測(cè)重現(xiàn)窗口(return window)期為五年的極端天氣事件時(shí),其準(zhǔn)確性與 GloFAS 預(yù)測(cè)重現(xiàn)窗口期為一年的事件時(shí)的準(zhǔn)確性相當(dāng)或更高。
相關(guān)研究論文以“Global prediction of extreme floods in ungauged watersheds”為題,已發(fā)表在權(quán)威科學(xué)期刊 Nature 上。
研究團(tuán)隊(duì)表示,該模型能對(duì)未測(cè)流盆地的小規(guī)模和極端洪水事件做出預(yù)警,且預(yù)警期比之前的方法都更長(zhǎng),并可提高發(fā)展中地區(qū)獲得可靠洪水預(yù)報(bào)的機(jī)會(huì)。
提前7天,AI是如何做到的?
那么,這一人工智能模型如何能給出可靠的洪水預(yù)報(bào)呢?
據(jù)論文描述,該研究使用了一種叫做長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)的人工智能模型來(lái)進(jìn)行河流流量的預(yù)測(cè)。這個(gè)模型的設(shè)計(jì)有點(diǎn)像我們的大腦,它可以從一系列的氣象數(shù)據(jù)中學(xué)習(xí)并預(yù)測(cè)未來(lái)的河流流量,分為編碼器和解碼器兩部分。
圖|基于 LSTM 的河流預(yù)報(bào)模型架構(gòu)。兩個(gè) LSTM 依次應(yīng)用,一個(gè)接收歷史天氣數(shù)據(jù),另一個(gè)接收預(yù)測(cè)天氣數(shù)據(jù)。模型輸出為每個(gè)預(yù)報(bào)時(shí)間步的流量概率分布參數(shù)。
首先,編碼器負(fù)責(zé)從上一段時(shí)間內(nèi)的氣象數(shù)據(jù)中提取信息,它從過(guò)去的天氣情況中理解河流流量的變化情況。它將歷史氣象數(shù)據(jù)轉(zhuǎn)化為可供解碼器使用的信息形式的作用。通過(guò)學(xué)習(xí)氣象數(shù)據(jù)中的特征和時(shí)間模式,模型對(duì)過(guò)去氣象情況形成抽象理解,為后續(xù)的流量預(yù)測(cè)提供了關(guān)鍵性的輸入。
編碼器則通過(guò)接收一系列氣象數(shù)據(jù)(比如降水量、溫度、輻射等)作為輸入,學(xué)習(xí)如何提取這些數(shù)據(jù)中的關(guān)鍵特征信息。這些特征信息可能包括季節(jié)性變化、氣象事件(如暴雨、高溫等)以及它們對(duì)河流流量的影響。
同時(shí),編碼器能夠捕獲氣象數(shù)據(jù)之間的時(shí)間依賴關(guān)系。這意味著它不僅僅考慮當(dāng)前時(shí)刻的氣象情況,還考慮了之前一段時(shí)間內(nèi)的氣象變化趨勢(shì)。通過(guò)對(duì)歷史數(shù)據(jù)的學(xué)習(xí),編碼器能夠理解氣象數(shù)據(jù)的時(shí)間序列模式,并將其納入到模型中。
在編碼器中,LSTM 網(wǎng)絡(luò)被用來(lái)處理時(shí)間序列數(shù)據(jù)。LSTM 具有內(nèi)部記憶單元,可以記住過(guò)去的信息,并根據(jù)當(dāng)前的輸入來(lái)更新內(nèi)部狀態(tài)。這使得編碼器能夠在處理長(zhǎng)期依賴關(guān)系時(shí)表現(xiàn)優(yōu)異,并在建模過(guò)程中保留重要的歷史信息。
最終,編碼器將歷史氣象數(shù)據(jù)轉(zhuǎn)化為一個(gè)潛在的表示形式,這個(gè)表示形式包含了對(duì)過(guò)去氣象情況的理解和總結(jié)。這個(gè)表示形式是編碼器的輸出,并傳遞給解碼器,用于未來(lái)流量的預(yù)測(cè)。
然后,解碼器部分使用這些信息來(lái)預(yù)測(cè)未來(lái)幾天的河流流量。它考慮了當(dāng)前的氣象預(yù)報(bào),以及過(guò)去的天氣對(duì)未來(lái)流量的影響。這樣,就可以得到未來(lái)一周的流量預(yù)測(cè)。
解碼器在模型中負(fù)責(zé)將歷史氣象信息和未來(lái)預(yù)測(cè)結(jié)合起來(lái),生成對(duì)未來(lái)河流流量的預(yù)測(cè),并輸出相應(yīng)的流量概率分布。
解碼器首先接收來(lái)自編碼器的潛在表示形式,這個(gè)表示形式包含了歷史氣象數(shù)據(jù)的抽象理解。解碼器利用這些信息來(lái)理解過(guò)去的氣象條件對(duì)河流流量的影響,并建立起歷史數(shù)據(jù)與未來(lái)預(yù)測(cè)之間的聯(lián)系。
解碼器同時(shí)接收未來(lái)的氣象預(yù)測(cè)數(shù)據(jù)作為輸入。這些預(yù)測(cè)數(shù)據(jù)通常包括了未來(lái)幾天的降水量、溫度等氣象指標(biāo)。解碼器將歷史信息和未來(lái)預(yù)測(cè)結(jié)合起來(lái),通過(guò)學(xué)習(xí)它們之間的關(guān)系來(lái)預(yù)測(cè)未來(lái)的河流流量。
在理解了歷史氣象條件和未來(lái)預(yù)測(cè)之后,解碼器通過(guò)一個(gè)獨(dú)立的 LSTM 網(wǎng)絡(luò)來(lái)生成對(duì)未來(lái)河流流量的預(yù)測(cè)。這個(gè)網(wǎng)絡(luò)可以理解為一個(gè)時(shí)間序列的生成器,根據(jù)過(guò)去的信息和未來(lái)的預(yù)測(cè)來(lái)生成流量序列。
解碼器不僅僅預(yù)測(cè)未來(lái)的河流流量值,還輸出一個(gè)概率分布。具體來(lái)說(shuō),模型使用一個(gè)單邊拉普拉斯分布來(lái)描述流量的不確定性,預(yù)測(cè)每個(gè)時(shí)間步的流量值時(shí),輸出一個(gè)單邊拉普拉斯分布的參數(shù),而不是一個(gè)確定的值。這使得模型能夠考慮到流量預(yù)測(cè)的不確定性,為決策提供了更多的信息。
最終的流量預(yù)測(cè)結(jié)果是通過(guò)集成多個(gè)解碼器模型的輸出得到的。模型使用了三個(gè)獨(dú)立訓(xùn)練的解碼器 LSTM 網(wǎng)絡(luò),然后將它們的預(yù)測(cè)結(jié)果取中值,從而減少預(yù)測(cè)的方差并提高預(yù)測(cè)的穩(wěn)定性。
真實(shí)效果怎么樣?
研究人員收集了大量的氣象數(shù)據(jù)和河流流量數(shù)據(jù),來(lái)訓(xùn)練這一模型。這些數(shù)據(jù)來(lái)自于不同的數(shù)據(jù)源,包括氣象預(yù)報(bào)、歷史記錄和地理信息。通過(guò)將數(shù)據(jù)標(biāo)準(zhǔn)化處理,模型得以正確理解它們。
然后,數(shù)據(jù)分成兩種類型:訓(xùn)練集和測(cè)試集。訓(xùn)練集用于訓(xùn)練模型,而測(cè)試集則用于評(píng)估模型的性能。研究人員使用了一種“交叉驗(yàn)證”的方法,以確保模型在不同的時(shí)間和地點(diǎn)都能夠有效地工作。
最后,研究團(tuán)隊(duì)評(píng)估了模型的性能,并與現(xiàn)有的流量預(yù)測(cè)模型進(jìn)行了比較。
研究團(tuán)隊(duì)采用了常見(jiàn)的誤差指標(biāo)來(lái)量化模型預(yù)測(cè)值與實(shí)際觀測(cè)值之間的差異。由于模型預(yù)測(cè)的不只是未來(lái)流量的具體數(shù)值,而且還給出了流量預(yù)測(cè)的不確定性,因此他們使用了概率積分變換(PIT)圖來(lái)評(píng)估預(yù)測(cè)分布的準(zhǔn)確性。
研究團(tuán)隊(duì)還通過(guò)與其他流量預(yù)測(cè)模型的對(duì)比來(lái)評(píng)估所提出模型的性能。這包括了傳統(tǒng)的物理模型和其他機(jī)器學(xué)習(xí)模型。通過(guò)比較不同模型的誤差指標(biāo),可以直觀地展示所提模型在準(zhǔn)確性和可靠性上的優(yōu)勢(shì)。
另外,研究團(tuán)隊(duì)還采用了特定的流域或河流作為案例研究,應(yīng)用模型于實(shí)際情境中,并詳細(xì)分析模型在不同季節(jié)、不同氣候條件下的預(yù)測(cè)性能。這有助于評(píng)估模型在實(shí)際應(yīng)用中的可行性和穩(wěn)定性。
除了量化指標(biāo),研究團(tuán)隊(duì)也還對(duì)模型預(yù)測(cè)的不確定性進(jìn)行了深入分析。這包括評(píng)估不同來(lái)源的不確定性(如輸入數(shù)據(jù)的不確定性、模型結(jié)構(gòu)的不確定性等)對(duì)預(yù)測(cè)結(jié)果的影響,以及模型如何在存在不確定性的情況下仍然提供有用的預(yù)測(cè)。
結(jié)果顯示,模型展現(xiàn)了較高的精確度和召回率,尤其是對(duì)于短期回報(bào)周期的事件。這意味著模型能夠準(zhǔn)確地識(shí)別出洪水事件,并且錯(cuò)過(guò)的事件較少。
結(jié)合精確度和召回率,模型在不同回報(bào)周期的事件上獲得了較高的 F1 score,表明了其在準(zhǔn)確性和全面性之間取得了良好的平衡。
此外,通過(guò)雙側(cè) Wilcoxon 符號(hào)秩檢驗(yàn),模型的預(yù)測(cè)結(jié)果在統(tǒng)計(jì)上顯著優(yōu)于基準(zhǔn)模型。這證明了模型在洪水預(yù)測(cè)方面的有效性。
Cohen's d 指標(biāo)顯示,模型性能改進(jìn)的效果是顯著的,這進(jìn)一步驗(yàn)證了模型相對(duì)于傳統(tǒng)方法的優(yōu)勢(shì)。
在 Nash–Sutcliffe 效率和 Kling-Gupta 效率等水文指標(biāo)上,模型同樣顯示了良好的預(yù)測(cè)精度和對(duì)水文過(guò)程變化的敏感性。
不足與展望
然而,該研究也存在一些局限性。
例如,實(shí)驗(yàn)采用的樣本可能較小,限制了研究結(jié)果的普遍適用性和統(tǒng)計(jì)功效。研究所用的數(shù)據(jù)集的多樣性存在不足,這可能影響模型的泛化能力。采用的模型復(fù)雜度較高,可能導(dǎo)致計(jì)算成本增加并限制了其可解釋性和便捷性。
另外,研究聚焦于特定任務(wù)或領(lǐng)域,可能限制了方法的廣泛應(yīng)用;這個(gè)方法缺乏長(zhǎng)期影響的評(píng)估,使得對(duì)模型隨時(shí)間變化的表現(xiàn)理解不足,評(píng)估標(biāo)準(zhǔn)可能無(wú)法全面反映模型性能;且對(duì)現(xiàn)有技術(shù)的改進(jìn)程度可能相對(duì)有限。
對(duì)此,研究團(tuán)隊(duì)表示,未來(lái)的工作需要進(jìn)一步將洪水預(yù)報(bào)的覆蓋范圍擴(kuò)大到全球更多地點(diǎn),以及其他類型的洪水相關(guān)事件和災(zāi)害,包括山洪和城市洪水。人工智能技術(shù)也將繼續(xù)發(fā)揮關(guān)鍵作用,幫助推動(dòng)科學(xué)研究,促進(jìn)氣候行動(dòng)。
參考鏈接:
https://www.nature.com/articles/s41586-024-07145-1
https://blog.google/technology/ai/google-ai-global-flood-forecasting/
Nature重磅:AI擊敗最先進(jìn)全球洪水預(yù)警系統(tǒng),提前7天預(yù)測(cè)河流洪水,每年挽救數(shù)千人生命
洪水是最常見(jiàn)的自然災(zāi)害類型,全球有近 15 億人(約占世界人口的 19%)直接面臨嚴(yán)重洪水事件的巨大風(fēng)險(xiǎn)。洪水還造成巨大的物質(zhì)損失,每年造成全球經(jīng)濟(jì)損失約 500 億美元。
近年來(lái),人類造成的氣候變化進(jìn)一步增加了一些地區(qū)的洪水頻率。然而,目前的預(yù)報(bào)方法主要依賴沿河而建的觀測(cè)站,其在全球的分布并不均勻,這就導(dǎo)致未經(jīng)測(cè)量的河流更難預(yù)報(bào),其負(fù)面影響主要體現(xiàn)在發(fā)展中國(guó)家。升級(jí)預(yù)警系統(tǒng),使這些人群能夠獲得準(zhǔn)確、及時(shí)的信息,每年可以挽救數(shù)千人的生命。
那么,如何在全球范圍內(nèi)進(jìn)行可靠的洪水預(yù)報(bào)?人工智能(AI)模型或許大有可為。
如今,來(lái)自 Google Research 洪水預(yù)測(cè)團(tuán)隊(duì)的 Grey Nearing 及其同事開(kāi)發(fā)的人工智能模型,通過(guò)利用現(xiàn)有的 5680 個(gè)測(cè)量?jī)x進(jìn)行訓(xùn)練,可預(yù)測(cè)未測(cè)量流域在 7 天預(yù)測(cè)期內(nèi)的日徑流。
隨后,他們將該人工智能模型與全球領(lǐng)先的短期和長(zhǎng)期洪水預(yù)測(cè)軟件——全球洪水預(yù)警系統(tǒng)(GloFAS)進(jìn)行了對(duì)比測(cè)試。結(jié)果顯示,該模型同日預(yù)測(cè)準(zhǔn)確率與當(dāng)前系統(tǒng)相當(dāng)甚至更高。
此外,該模型在預(yù)測(cè)重現(xiàn)窗口(return window)期為五年的極端天氣事件時(shí),其準(zhǔn)確性與 GloFAS 預(yù)測(cè)重現(xiàn)窗口期為一年的事件時(shí)的準(zhǔn)確性相當(dāng)或更高。
相關(guān)研究論文以“Global prediction of extreme floods in ungauged watersheds”為題,已發(fā)表在權(quán)威科學(xué)期刊 Nature 上。
研究團(tuán)隊(duì)表示,該模型能對(duì)未測(cè)流盆地的小規(guī)模和極端洪水事件做出預(yù)警,且預(yù)警期比之前的方法都更長(zhǎng),并可提高發(fā)展中地區(qū)獲得可靠洪水預(yù)報(bào)的機(jī)會(huì)。
提前7天,AI是如何做到的?
那么,這一人工智能模型如何能給出可靠的洪水預(yù)報(bào)呢?
據(jù)論文描述,該研究使用了一種叫做長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)的人工智能模型來(lái)進(jìn)行河流流量的預(yù)測(cè)。這個(gè)模型的設(shè)計(jì)有點(diǎn)像我們的大腦,它可以從一系列的氣象數(shù)據(jù)中學(xué)習(xí)并預(yù)測(cè)未來(lái)的河流流量,分為編碼器和解碼器兩部分。
圖|基于 LSTM 的河流預(yù)報(bào)模型架構(gòu)。兩個(gè) LSTM 依次應(yīng)用,一個(gè)接收歷史天氣數(shù)據(jù),另一個(gè)接收預(yù)測(cè)天氣數(shù)據(jù)。模型輸出為每個(gè)預(yù)報(bào)時(shí)間步的流量概率分布參數(shù)。
首先,編碼器負(fù)責(zé)從上一段時(shí)間內(nèi)的氣象數(shù)據(jù)中提取信息,它從過(guò)去的天氣情況中理解河流流量的變化情況。它將歷史氣象數(shù)據(jù)轉(zhuǎn)化為可供解碼器使用的信息形式的作用。通過(guò)學(xué)習(xí)氣象數(shù)據(jù)中的特征和時(shí)間模式,模型對(duì)過(guò)去氣象情況形成抽象理解,為后續(xù)的流量預(yù)測(cè)提供了關(guān)鍵性的輸入。
編碼器則通過(guò)接收一系列氣象數(shù)據(jù)(比如降水量、溫度、輻射等)作為輸入,學(xué)習(xí)如何提取這些數(shù)據(jù)中的關(guān)鍵特征信息。這些特征信息可能包括季節(jié)性變化、氣象事件(如暴雨、高溫等)以及它們對(duì)河流流量的影響。
同時(shí),編碼器能夠捕獲氣象數(shù)據(jù)之間的時(shí)間依賴關(guān)系。這意味著它不僅僅考慮當(dāng)前時(shí)刻的氣象情況,還考慮了之前一段時(shí)間內(nèi)的氣象變化趨勢(shì)。通過(guò)對(duì)歷史數(shù)據(jù)的學(xué)習(xí),編碼器能夠理解氣象數(shù)據(jù)的時(shí)間序列模式,并將其納入到模型中。
在編碼器中,LSTM 網(wǎng)絡(luò)被用來(lái)處理時(shí)間序列數(shù)據(jù)。LSTM 具有內(nèi)部記憶單元,可以記住過(guò)去的信息,并根據(jù)當(dāng)前的輸入來(lái)更新內(nèi)部狀態(tài)。這使得編碼器能夠在處理長(zhǎng)期依賴關(guān)系時(shí)表現(xiàn)優(yōu)異,并在建模過(guò)程中保留重要的歷史信息。
最終,編碼器將歷史氣象數(shù)據(jù)轉(zhuǎn)化為一個(gè)潛在的表示形式,這個(gè)表示形式包含了對(duì)過(guò)去氣象情況的理解和總結(jié)。這個(gè)表示形式是編碼器的輸出,并傳遞給解碼器,用于未來(lái)流量的預(yù)測(cè)。
然后,解碼器部分使用這些信息來(lái)預(yù)測(cè)未來(lái)幾天的河流流量。它考慮了當(dāng)前的氣象預(yù)報(bào),以及過(guò)去的天氣對(duì)未來(lái)流量的影響。這樣,就可以得到未來(lái)一周的流量預(yù)測(cè)。
解碼器在模型中負(fù)責(zé)將歷史氣象信息和未來(lái)預(yù)測(cè)結(jié)合起來(lái),生成對(duì)未來(lái)河流流量的預(yù)測(cè),并輸出相應(yīng)的流量概率分布。
解碼器首先接收來(lái)自編碼器的潛在表示形式,這個(gè)表示形式包含了歷史氣象數(shù)據(jù)的抽象理解。解碼器利用這些信息來(lái)理解過(guò)去的氣象條件對(duì)河流流量的影響,并建立起歷史數(shù)據(jù)與未來(lái)預(yù)測(cè)之間的聯(lián)系。
解碼器同時(shí)接收未來(lái)的氣象預(yù)測(cè)數(shù)據(jù)作為輸入。這些預(yù)測(cè)數(shù)據(jù)通常包括了未來(lái)幾天的降水量、溫度等氣象指標(biāo)。解碼器將歷史信息和未來(lái)預(yù)測(cè)結(jié)合起來(lái),通過(guò)學(xué)習(xí)它們之間的關(guān)系來(lái)預(yù)測(cè)未來(lái)的河流流量。
在理解了歷史氣象條件和未來(lái)預(yù)測(cè)之后,解碼器通過(guò)一個(gè)獨(dú)立的 LSTM 網(wǎng)絡(luò)來(lái)生成對(duì)未來(lái)河流流量的預(yù)測(cè)。這個(gè)網(wǎng)絡(luò)可以理解為一個(gè)時(shí)間序列的生成器,根據(jù)過(guò)去的信息和未來(lái)的預(yù)測(cè)來(lái)生成流量序列。
解碼器不僅僅預(yù)測(cè)未來(lái)的河流流量值,還輸出一個(gè)概率分布。具體來(lái)說(shuō),模型使用一個(gè)單邊拉普拉斯分布來(lái)描述流量的不確定性,預(yù)測(cè)每個(gè)時(shí)間步的流量值時(shí),輸出一個(gè)單邊拉普拉斯分布的參數(shù),而不是一個(gè)確定的值。這使得模型能夠考慮到流量預(yù)測(cè)的不確定性,為決策提供了更多的信息。
最終的流量預(yù)測(cè)結(jié)果是通過(guò)集成多個(gè)解碼器模型的輸出得到的。模型使用了三個(gè)獨(dú)立訓(xùn)練的解碼器 LSTM 網(wǎng)絡(luò),然后將它們的預(yù)測(cè)結(jié)果取中值,從而減少預(yù)測(cè)的方差并提高預(yù)測(cè)的穩(wěn)定性。
真實(shí)效果怎么樣?
研究人員收集了大量的氣象數(shù)據(jù)和河流流量數(shù)據(jù),來(lái)訓(xùn)練這一模型。這些數(shù)據(jù)來(lái)自于不同的數(shù)據(jù)源,包括氣象預(yù)報(bào)、歷史記錄和地理信息。通過(guò)將數(shù)據(jù)標(biāo)準(zhǔn)化處理,模型得以正確理解它們。
然后,數(shù)據(jù)分成兩種類型:訓(xùn)練集和測(cè)試集。訓(xùn)練集用于訓(xùn)練模型,而測(cè)試集則用于評(píng)估模型的性能。研究人員使用了一種“交叉驗(yàn)證”的方法,以確保模型在不同的時(shí)間和地點(diǎn)都能夠有效地工作。
最后,研究團(tuán)隊(duì)評(píng)估了模型的性能,并與現(xiàn)有的流量預(yù)測(cè)模型進(jìn)行了比較。
研究團(tuán)隊(duì)采用了常見(jiàn)的誤差指標(biāo)來(lái)量化模型預(yù)測(cè)值與實(shí)際觀測(cè)值之間的差異。由于模型預(yù)測(cè)的不只是未來(lái)流量的具體數(shù)值,而且還給出了流量預(yù)測(cè)的不確定性,因此他們使用了概率積分變換(PIT)圖來(lái)評(píng)估預(yù)測(cè)分布的準(zhǔn)確性。
研究團(tuán)隊(duì)還通過(guò)與其他流量預(yù)測(cè)模型的對(duì)比來(lái)評(píng)估所提出模型的性能。這包括了傳統(tǒng)的物理模型和其他機(jī)器學(xué)習(xí)模型。通過(guò)比較不同模型的誤差指標(biāo),可以直觀地展示所提模型在準(zhǔn)確性和可靠性上的優(yōu)勢(shì)。
另外,研究團(tuán)隊(duì)還采用了特定的流域或河流作為案例研究,應(yīng)用模型于實(shí)際情境中,并詳細(xì)分析模型在不同季節(jié)、不同氣候條件下的預(yù)測(cè)性能。這有助于評(píng)估模型在實(shí)際應(yīng)用中的可行性和穩(wěn)定性。
除了量化指標(biāo),研究團(tuán)隊(duì)也還對(duì)模型預(yù)測(cè)的不確定性進(jìn)行了深入分析。這包括評(píng)估不同來(lái)源的不確定性(如輸入數(shù)據(jù)的不確定性、模型結(jié)構(gòu)的不確定性等)對(duì)預(yù)測(cè)結(jié)果的影響,以及模型如何在存在不確定性的情況下仍然提供有用的預(yù)測(cè)。
結(jié)果顯示,模型展現(xiàn)了較高的精確度和召回率,尤其是對(duì)于短期回報(bào)周期的事件。這意味著模型能夠準(zhǔn)確地識(shí)別出洪水事件,并且錯(cuò)過(guò)的事件較少。
結(jié)合精確度和召回率,模型在不同回報(bào)周期的事件上獲得了較高的 F1 score,表明了其在準(zhǔn)確性和全面性之間取得了良好的平衡。
此外,通過(guò)雙側(cè) Wilcoxon 符號(hào)秩檢驗(yàn),模型的預(yù)測(cè)結(jié)果在統(tǒng)計(jì)上顯著優(yōu)于基準(zhǔn)模型。這證明了模型在洪水預(yù)測(cè)方面的有效性。
Cohen's d 指標(biāo)顯示,模型性能改進(jìn)的效果是顯著的,這進(jìn)一步驗(yàn)證了模型相對(duì)于傳統(tǒng)方法的優(yōu)勢(shì)。
在 Nash–Sutcliffe 效率和 Kling-Gupta 效率等水文指標(biāo)上,模型同樣顯示了良好的預(yù)測(cè)精度和對(duì)水文過(guò)程變化的敏感性。
不足與展望
然而,該研究也存在一些局限性。
例如,實(shí)驗(yàn)采用的樣本可能較小,限制了研究結(jié)果的普遍適用性和統(tǒng)計(jì)功效。研究所用的數(shù)據(jù)集的多樣性存在不足,這可能影響模型的泛化能力。采用的模型復(fù)雜度較高,可能導(dǎo)致計(jì)算成本增加并限制了其可解釋性和便捷性。
另外,研究聚焦于特定任務(wù)或領(lǐng)域,可能限制了方法的廣泛應(yīng)用;這個(gè)方法缺乏長(zhǎng)期影響的評(píng)估,使得對(duì)模型隨時(shí)間變化的表現(xiàn)理解不足,評(píng)估標(biāo)準(zhǔn)可能無(wú)法全面反映模型性能;且對(duì)現(xiàn)有技術(shù)的改進(jìn)程度可能相對(duì)有限。
對(duì)此,研究團(tuán)隊(duì)表示,未來(lái)的工作需要進(jìn)一步將洪水預(yù)報(bào)的覆蓋范圍擴(kuò)大到全球更多地點(diǎn),以及其他類型的洪水相關(guān)事件和災(zāi)害,包括山洪和城市洪水。人工智能技術(shù)也將繼續(xù)發(fā)揮關(guān)鍵作用,幫助推動(dòng)科學(xué)研究,促進(jìn)氣候行動(dòng)。
參考鏈接:
https://www.nature.com/articles/s41586-024-07145-1
https://blog.google/technology/ai/google-ai-global-flood-forecasting/
|點(diǎn)擊關(guān)注我 👇 記得標(biāo)星|