金沙娱乐场官方网-澳门金沙会官网-金沙集团股价实情信息最新

科研動(dòng)態(tài)

別再使用黑箱模型--可解釋人工智能在鉆速預(yù)測(cè)的應(yīng)用

中文題目:別再使用黑箱模型--可解釋人工智能在鉆速預(yù)測(cè)的應(yīng)用

論文題目: Stop Using Black-box Models: Application of Explainable Artificial Intelligence for Rate of Penetration Prediction

錄用期刊/會(huì)議:SPE Journal (中科院大類(lèi)3區(qū))

原文DOIhttps://doi.org/10.2118/223622-PA

原文鏈接:https://onepetro.org/SJ/article-abstract/doi/10.2118/223622-PA/580238/Stop-Using-Black-Box-Models-Application-of?redirectedFrom=fulltext

錄用/見(jiàn)刊時(shí)間:October 23 2024

作者列表

1)孟   翰 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 智能科學(xué)與技術(shù)系教師

2)林伯韜 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 智能科學(xué)與技術(shù)系教師

3)金 衍 中國(guó)石油大學(xué)(北京)石油工程學(xué)院 油氣井工程系教師

文章簡(jiǎn)介:

機(jī)械鉆速預(yù)測(cè)對(duì)提高鉆井效率、降低鉆井成本至關(guān)重要。現(xiàn)有人工智能模型雖然在預(yù)測(cè)精度上表現(xiàn)出色,但其黑盒特性限制了實(shí)際應(yīng)用。本文引入了一種基于神經(jīng)網(wǎng)絡(luò)的可解釋鉆速預(yù)測(cè)模型,不僅保持了高預(yù)測(cè)精度,還能清晰展示鉆井參數(shù)對(duì)預(yù)測(cè)結(jié)果的影響機(jī)制,旨在促進(jìn)可解釋人工智能在油氣領(lǐng)域的應(yīng)用。

摘要:

準(zhǔn)確預(yù)測(cè)鉆速對(duì)提高鉆井效率和降低鉆井成本至關(guān)重要。目前的人工智能模型雖然能夠準(zhǔn)確預(yù)測(cè)鉆速,但其黑箱模型的本質(zhì),導(dǎo)致其決策過(guò)程難以理解,在實(shí)際應(yīng)用中受到限制。本研究引入的可解釋神經(jīng)網(wǎng)絡(luò)模型不僅能準(zhǔn)確預(yù)測(cè)鉆速,還能清晰展示各項(xiàng)鉆井參數(shù)是如何影響預(yù)測(cè)結(jié)果的。通過(guò)公開(kāi)數(shù)據(jù)集的對(duì)比實(shí)驗(yàn),該模型展現(xiàn)出優(yōu)異的預(yù)測(cè)性能,不僅預(yù)測(cè)精度高,并且能夠提供清晰的決策依據(jù)。

背景與動(dòng)機(jī):

機(jī)械鉆速的預(yù)測(cè)直接關(guān)系到鉆井效率優(yōu)化和總體成本控制。目前ROP預(yù)測(cè)模型主要分為三類(lèi):物理模型、數(shù)據(jù)驅(qū)動(dòng)模型和混合模型。物理模型雖然具有良好的解釋性,但由于其建立在實(shí)驗(yàn)室條件下,難以準(zhǔn)確刻畫(huà)實(shí)際鉆井過(guò)程中的復(fù)雜非線(xiàn)性關(guān)系。數(shù)據(jù)驅(qū)動(dòng)模型特別是深度學(xué)習(xí)模型雖然預(yù)測(cè)精度較高,但其黑盒特性阻礙了在高風(fēng)險(xiǎn)的石油工業(yè)中的實(shí)際應(yīng)用。混合模型試圖結(jié)合兩者優(yōu)勢(shì),但其假設(shè)的物理規(guī)律在不同地層條件下的普適性存疑,且其數(shù)據(jù)驅(qū)動(dòng)部分仍存在解釋性問(wèn)題。因此,開(kāi)發(fā)一種既能保持?jǐn)?shù)據(jù)驅(qū)動(dòng)模型靈活性又具備清晰解釋能力的ROP預(yù)測(cè)模型具有重要意義。本研究提出將可解釋人工智能引入ROP預(yù)測(cè)中,旨在打開(kāi)石油工程領(lǐng)域AI應(yīng)用的新途徑。

設(shè)計(jì)與實(shí)現(xiàn):

方法設(shè)計(jì):

1. 模型架構(gòu)設(shè)計(jì):本文采用基于廣義加性模型的NBM(Neural Basis Model),其核心創(chuàng)新在于通過(guò)共享神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)基函數(shù)。模型結(jié)構(gòu)主要包含三個(gè)關(guān)鍵組件:

l基函數(shù)學(xué)習(xí)網(wǎng)絡(luò):采用共享神經(jīng)網(wǎng)絡(luò)處理輸入特征,學(xué)習(xí)一組基函數(shù)來(lái)捕捉特征間的關(guān)聯(lián)性

l特征映射層:通過(guò)特定權(quán)重組合基函數(shù),構(gòu)建每個(gè)輸入特征的貢獻(xiàn)函數(shù)

l線(xiàn)性組合層:將各特征貢獻(xiàn)進(jìn)行線(xiàn)性組合得到最終預(yù)測(cè)結(jié)果

image.png

圖1 NBM 網(wǎng)絡(luò)結(jié)構(gòu)

主要?jiǎng)?chuàng)新點(diǎn)包括如下三點(diǎn):

l共享網(wǎng)絡(luò)設(shè)計(jì)提高了對(duì)特征間相關(guān)性的捕捉能力

l基函數(shù)的學(xué)習(xí)機(jī)制提供了穩(wěn)定的模型解釋性

l并行訓(xùn)練架構(gòu)顯著提升了計(jì)算效率

數(shù)據(jù)集合與預(yù)處理方法:

數(shù)據(jù)集描述:

本研究基于Tunkiel等人處理和清洗的挪威Volve油田的公開(kāi)鉆井?dāng)?shù)據(jù)集,一共有7口井?dāng)?shù)據(jù)。共包含198,928個(gè)數(shù)據(jù)點(diǎn),每個(gè)數(shù)據(jù)點(diǎn)包含12個(gè)特征:測(cè)量深度(MD)、鉆壓(WoB)、立管壓力(ASP)、地面扭矩(AST)、轉(zhuǎn)速(ARS)、泥漿流量(MFI)、泥漿密度(MDI)、鉆頭直徑(D)、平均吊重(AH)、井深(HD)、伽馬值(Gamma)和機(jī)械鉆速(ROP)。

image.png

圖2 數(shù)據(jù)集特征分布和相關(guān)性分析

數(shù)據(jù)集劃分:

本研究設(shè)計(jì)了連續(xù)學(xué)習(xí)全井預(yù)測(cè)兩種訓(xùn)練場(chǎng)景,以模擬實(shí)際鉆井作業(yè)中的不同應(yīng)用需求。

連續(xù)學(xué)習(xí)旨在模擬單井鉆進(jìn)過(guò)程中的實(shí)時(shí)優(yōu)化,初始使用前90米數(shù)據(jù)(前30米訓(xùn)練,中間30米驗(yàn)證,最后30米測(cè)試)建立基礎(chǔ)模型,并隨著鉆井深度每增加30米(約一個(gè)鉆桿長(zhǎng)度)就更新一次模型,這種設(shè)計(jì)特別適用于指導(dǎo)同一口井后續(xù)井段的鉆進(jìn)參數(shù)優(yōu)化。

全井預(yù)測(cè)則模擬利用已鉆井的經(jīng)驗(yàn)來(lái)指導(dǎo)新井鉆進(jìn)的情況,從7口井中選擇1口作為測(cè)試井,1口作為驗(yàn)證井,其余井的數(shù)據(jù)用于訓(xùn)練,采用滾動(dòng)選擇方法確定驗(yàn)證井和測(cè)試井,這種設(shè)計(jì)適用于油田開(kāi)發(fā)后期利用已積累的鉆井經(jīng)驗(yàn)指導(dǎo)新井的鉆進(jìn)策略。

image.png

圖3 (a)連續(xù)學(xué)習(xí) 和(b)全井預(yù)測(cè)的數(shù)據(jù)集劃分

可解釋ROP預(yù)測(cè):

可解釋模型的一個(gè)重要優(yōu)勢(shì)在于其能夠?yàn)轭A(yù)測(cè)結(jié)果提供清晰的解釋?zhuān)@種解釋能力體現(xiàn)在對(duì)預(yù)測(cè)結(jié)果的可視化上。圖4展示了使用Well-1鉆井?dāng)?shù)據(jù)訓(xùn)練的模型結(jié)果。圖中紅線(xiàn)表示每個(gè)輸入特征所對(duì)應(yīng)的學(xué)習(xí)函數(shù)。藍(lán)點(diǎn)代表一個(gè)具體輸入樣本的參數(shù):測(cè)量深度1187.98米,鉆壓13.42 kkgf,立管壓力10967.83 kPa,地面扭矩9.56 KN.m,轉(zhuǎn)速194.19 rpm,泥漿流量1927.46 L/min,泥漿密度1.20 g/cm3,鉆頭直徑215.90 mm,吊重86.43 kkgf,伽馬值25.37 gAPI。圖中標(biāo)注了各學(xué)習(xí)子函數(shù)與其對(duì)應(yīng)系數(shù)相乘后的值。模型對(duì)該輸入的最終預(yù)測(cè)值由這些值的相加得出得出,具體為41.285 m/h(包含學(xué)習(xí)到的常數(shù)項(xiàng)f?=0.245)。

image.png

圖4 模型預(yù)測(cè)可視化

關(guān)于連續(xù)學(xué)習(xí)和全井段預(yù)測(cè)的討論

研究結(jié)果表明,NBM模型在連續(xù)學(xué)習(xí)場(chǎng)景下的預(yù)測(cè)性能顯著優(yōu)于全井預(yù)測(cè)場(chǎng)景,這個(gè)現(xiàn)象值得深入探討。這種性能差異主要反映了數(shù)據(jù)驅(qū)動(dòng)模型在知識(shí)遷移方面的局限性。在連續(xù)學(xué)習(xí)場(chǎng)景中,由于是在同一口井的數(shù)據(jù)上進(jìn)行訓(xùn)練和預(yù)測(cè),模型能夠有效捕捉到該井特定的鉆井參數(shù)與機(jī)械鉆速之間的關(guān)系模式。這些關(guān)系模式在同一口井的不同深度區(qū)間表現(xiàn)出較好的一致性,這與地層的連續(xù)性特征相符。然而,當(dāng)模型應(yīng)用于多井情況下的全井預(yù)測(cè)場(chǎng)景時(shí),雖然鉆井操作參數(shù)(如鉆壓、轉(zhuǎn)速等)的數(shù)值范圍可能相似,但可能是因?yàn)橛捎谌狈υ敿?xì)的地層特征信息,模型難以準(zhǔn)確理解不同井之間的地質(zhì)差異對(duì)機(jī)械鉆速的影響,學(xué)習(xí)到的知識(shí)完全不同。這也說(shuō)明了當(dāng)前模型學(xué)習(xí)到的更多是數(shù)據(jù)集特定的解釋?zhuān)╠ataset-specific explanations),而非可遷移知識(shí)(transferable knowledge)。這一認(rèn)識(shí)對(duì)未來(lái)研究具有重要指導(dǎo)意義:要提高模型在不同井之間的預(yù)測(cè)能力,需要補(bǔ)充更多地層特征信息,以幫助模型建立起更本質(zhì)的物理關(guān)聯(lián),而不是僅僅停留在表面的數(shù)據(jù)相關(guān)性層面。

image.png

圖5 (a)well-1 和(b)well-2 井上的數(shù)據(jù)訓(xùn)練得到的模型的可視化解釋

結(jié)論:

本研究采用了自解釋神經(jīng)網(wǎng)絡(luò)模型構(gòu)建機(jī)械鉆速預(yù)測(cè)。通過(guò)與已有方法的對(duì)比實(shí)驗(yàn)表明,采用的模型不僅達(dá)到了與黑箱模型相當(dāng)?shù)念A(yù)測(cè)精度,更重要的是具備了清晰的可解釋性,能夠增強(qiáng)用戶(hù)對(duì)預(yù)測(cè)結(jié)果的信任度并提供更深層的洞察。本研究的更廣泛意義在于為石油工程領(lǐng)域引入可解釋AI模型提供了示范。

代碼:

本研究的部分代碼可從https://github.com/IPE-lab/NBMROP獲取。

作者簡(jiǎn)介:

孟翰,中國(guó)石油大學(xué)(北京)人工智能學(xué)院副教授。本科和碩士畢業(yè)于中國(guó)石油大學(xué)(北京),分別獲得石油工程和油氣井工程學(xué)位,于英國(guó)諾丁漢大學(xué)獲得計(jì)算機(jī)科學(xué)博士學(xué)位。2024年加入中國(guó)石油大學(xué)(北京)人工智能學(xué)院。研究方向包括可解釋人工智能、生成式模型、時(shí)間序列分析等。

通訊作者簡(jiǎn)介:

林伯韜,人工智能學(xué)院教授,博士生導(dǎo)師,長(zhǎng)期致力于智能石油工程與工業(yè)數(shù)字孿生等領(lǐng)域的教學(xué)和科研工作。

金衍,石油工程學(xué)院教授,博士生導(dǎo)師,長(zhǎng)期致力于巖石力學(xué)、智能油田、井壁穩(wěn)定和水力壓裂等油氣井工程領(lǐng)域方面的教學(xué)和科研工作,國(guó)家杰出青年科學(xué)基金獲得者。