2023年11月2日,在“第2屆電力行業(yè)數(shù)字化轉(zhuǎn)型大會(huì)暨第4屆電力人工智能大會(huì)”上,「智創(chuàng)獎(jiǎng)」第二屆電力數(shù)智化轉(zhuǎn)型技術(shù)創(chuàng)新應(yīng)用評(píng)選頒獎(jiǎng)典禮同期舉行。
國(guó)網(wǎng)山西省電力公司信息通信分公司憑借其“基于人工智能的人員安全準(zhǔn)入智能分析與預(yù)警”案例,獲得“新型電力系統(tǒng)人工智能技術(shù)創(chuàng)新應(yīng)用案例獎(jiǎng)”。
該案例通過對(duì)基于人工智能的人員安全準(zhǔn)入智能分析與預(yù)警模型研發(fā)工作,借助非結(jié)構(gòu)化平臺(tái)+人工智能解析能力,實(shí)現(xiàn)證照類數(shù)據(jù)智能識(shí)別,關(guān)鍵信息自動(dòng)校驗(yàn),將企業(yè)與隊(duì)伍人員資質(zhì)校核時(shí)間,由平均30分/1人次,降低至平均10分鐘/1人次,極大降低人工成本,智能核查所需時(shí)長(zhǎng)同比縮短70%,嚴(yán)厲打擊證件造假、過期等不合格問題。本次成果的人工智能模型可以進(jìn)行全網(wǎng)推廣。
其搭建可分為以下幾個(gè)步驟:
# 01 OCR識(shí)別模型構(gòu)建
基于企業(yè)與人員安全準(zhǔn)入圖像類數(shù)據(jù)特征,結(jié)合企業(yè)中臺(tái)能力,完成圖像數(shù)據(jù)統(tǒng)一接入與數(shù)據(jù)處理,完成OCR識(shí)別模型構(gòu)建。
通過非結(jié)構(gòu)化平臺(tái)統(tǒng)一納管作業(yè)人員信息、作業(yè)人員資質(zhì)、企業(yè)信息、企業(yè)資信數(shù)據(jù),如營(yíng)業(yè)執(zhí)照、安全生產(chǎn)許可證、身份證等證照類數(shù)據(jù),并存儲(chǔ)于對(duì)象存儲(chǔ)oss/obs,形成樣本數(shù)據(jù)。對(duì)圖片數(shù)據(jù)進(jìn)行切分形成訓(xùn)練集以及驗(yàn)證集,并使用labelimg、labelme等標(biāo)注技術(shù)對(duì)圖片進(jìn)行標(biāo)注,形成訓(xùn)練集標(biāo)注和驗(yàn)證集標(biāo)注數(shù)據(jù)。
OCR識(shí)別模型構(gòu)建,基于企業(yè)與人員安全準(zhǔn)入圖像類數(shù)據(jù)特征的識(shí)別模型由三大模塊組成,分別是圖像分類模塊、文本檢測(cè)模塊、智能糾錯(cuò)模塊。
圖像分類模塊
圖像分類模塊用于快速識(shí)別輸入圖像所屬的具體子分類,如:營(yíng)業(yè)執(zhí)照、身份證、文本掃描件等。后續(xù)OCR識(shí)別引擎將通過本模塊的分類結(jié)果,匹配OCR識(shí)別的模版,實(shí)現(xiàn)證照類信息定制化識(shí)別。
本模塊采用深度學(xué)習(xí)技術(shù),通過構(gòu)建圖像分類模型,采用特殊目標(biāo)檢測(cè)技術(shù)(如:檢測(cè)身份證中對(duì)國(guó)徽、人臉圖像)對(duì)圖像進(jìn)行快速分類。采用paddlex作為本模塊圖像分類、目標(biāo)檢測(cè)訓(xùn)練框架,結(jié)合FasterRCNN深度學(xué)習(xí)算法,交叉驗(yàn)證,提高分類結(jié)果的準(zhǔn)確性。
文本檢測(cè)模塊
由于實(shí)際的圖像數(shù)據(jù)大多來(lái)自于掃描件、復(fù)印件,圖像質(zhì)量差(存在模糊、循轉(zhuǎn)、褶皺等各種實(shí)際問題),且各種圖像分類的數(shù)據(jù)本身也存在較大差異,主流、公開的預(yù)訓(xùn)練模型難以在各種分類的圖像上取得較好的效果。因此,有必要針對(duì)證件圖像數(shù)據(jù)訓(xùn)練定制化的文本檢測(cè)模塊。
對(duì)圖像數(shù)據(jù)進(jìn)行處理,根據(jù)標(biāo)注數(shù)據(jù)生成數(shù)據(jù)集,并按照比例7:2:1拆分為訓(xùn)練數(shù)據(jù)集、測(cè)試數(shù)據(jù)集、評(píng)估數(shù)據(jù)集,進(jìn)行模塊訓(xùn)練,采用評(píng)估數(shù)據(jù)集進(jìn)行評(píng)估。根據(jù)評(píng)估的結(jié)果,通過增加數(shù)據(jù)標(biāo)注、調(diào)整數(shù)據(jù)標(biāo)注、調(diào)整模型參數(shù)等方式,重復(fù)整個(gè)訓(xùn)練過程,直至OCR文本檢測(cè)模塊具有高準(zhǔn)確率。
智能糾錯(cuò)模塊
通過分析各種證件類型涉及到的字段信息特征,結(jié)合規(guī)則引擎,構(gòu)建校驗(yàn)規(guī)則,形成特征庫(kù)。
對(duì)OCR識(shí)別的結(jié)果,將自動(dòng)匹配模版信息、特征庫(kù)進(jìn)行校驗(yàn),自動(dòng)識(shí)別出有誤的字段信息并進(jìn)行糾錯(cuò),OCR整體準(zhǔn)確識(shí)別率由98.3%提升至99.5%。如:身份證中的“民族”應(yīng)在合理的取值范圍內(nèi),如“漢族”,“壯族”; 營(yíng)業(yè)執(zhí)照中的“成立日期”應(yīng)為可解析的日期類型;統(tǒng)一社會(huì)信用代碼應(yīng)為18位阿拉伯?dāng)?shù)字或大寫英文字母組成的字符串等。
# 02、企業(yè)與人員安全準(zhǔn)入智能分析與預(yù)警模型研發(fā)
通過OCR對(duì)企業(yè)與人員準(zhǔn)入資質(zhì)證明材料進(jìn)行識(shí)別后,依據(jù)安監(jiān)部企業(yè)與人員安全準(zhǔn)入要求,人工構(gòu)建規(guī)則庫(kù),完成企業(yè)與人員安全準(zhǔn)入智能分析與預(yù)警模型研發(fā),對(duì)身份證信息一致性、營(yíng)業(yè)執(zhí)照與系統(tǒng)數(shù)據(jù)一致性、企業(yè)與人員資質(zhì)證書或材料等是否滿足準(zhǔn)入要求的自動(dòng)判斷。
企業(yè)與人員準(zhǔn)入管控智能化新模式在山西電力的成功落地運(yùn)用,真正做到安全資信從源頭把控,嚴(yán)把“雙準(zhǔn)入”關(guān),實(shí)現(xiàn)企業(yè)與人員安全管控能力的系統(tǒng)化提升,將為解決企業(yè)與人員的一系列安全管理難點(diǎn)提供強(qiáng)有力的支撐,進(jìn)一步促進(jìn)安全管控實(shí)現(xiàn)智能化、規(guī)范化、常態(tài)化,為推進(jìn)企業(yè)安全生產(chǎn)主體責(zé)任落實(shí)奠定了堅(jiān)實(shí)基礎(chǔ),也為電網(wǎng)安全生產(chǎn)工作提檔升級(jí)樹立卓越標(biāo)桿,后續(xù)將在全網(wǎng)進(jìn)行推廣試用。
參與單位/參與人員:
國(guó)網(wǎng)山西省電力信息通信分公司/劉兵兵、薛泓林、谷良、張家瑋、白建海、宮鑫、劉秀、安龍、韓蕊娜、劉澤坤
CPEM全國(guó)電力設(shè)備管理網(wǎng) ? 2016 版權(quán)所有 ICP備案號(hào):滬ICP備16049902號(hào)-7