本發(fā)明涉及數(shù)據(jù)處理,尤其涉及一種基于人工智能的業(yè)務(wù)告警方法及系統(tǒng)。
背景技術(shù):
1、隨著網(wǎng)絡(luò)的普及,網(wǎng)絡(luò)安全的形勢日益嚴(yán)峻。可以理解的是,網(wǎng)絡(luò)故障會(huì)造成網(wǎng)絡(luò)性能的下降甚至導(dǎo)致整個(gè)網(wǎng)絡(luò)系統(tǒng)的癱瘓,為了保證內(nèi)部網(wǎng)絡(luò)中的計(jì)算機(jī)和網(wǎng)絡(luò)系統(tǒng)的安全,人們提出了針對(duì)網(wǎng)絡(luò)故障的告警管理。告警管理通過對(duì)網(wǎng)絡(luò)中各個(gè)網(wǎng)絡(luò)設(shè)備的設(shè)備狀態(tài)的監(jiān)控,能夠?qū)崟r(shí)地反映出整個(gè)網(wǎng)絡(luò)的運(yùn)行狀態(tài)。
2、傳統(tǒng)告警方法依賴人工經(jīng)驗(yàn)排查,無法快速識(shí)別復(fù)雜系統(tǒng)中故障的傳播路徑和根源節(jié)點(diǎn);并且故障處理高度依賴人工操作,如手動(dòng)重啟服務(wù)、調(diào)整配置等,導(dǎo)致mttr(平均修復(fù)時(shí)間)長,業(yè)務(wù)連續(xù)性風(fēng)險(xiǎn)高。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明意在提供一種基于人工智能的業(yè)務(wù)告警方法及系統(tǒng),以解決現(xiàn)有技術(shù)中存在的不足,本發(fā)明要解決的技術(shù)問題通過以下技術(shù)方案來實(shí)現(xiàn)。
2、本發(fā)明實(shí)施例提供一種基于人工智能的業(yè)務(wù)告警方法,所述方法包括:
3、獲取目標(biāo)網(wǎng)絡(luò)的基礎(chǔ)設(shè)施層數(shù)據(jù)、服務(wù)層數(shù)據(jù)、網(wǎng)絡(luò)層數(shù)據(jù);
4、對(duì)所述目標(biāo)網(wǎng)絡(luò)的基礎(chǔ)設(shè)施層數(shù)據(jù)、服務(wù)層數(shù)據(jù)、網(wǎng)絡(luò)層數(shù)據(jù)進(jìn)行預(yù)處理;所述預(yù)處理至少包括歸一化、異常值過濾;
5、根據(jù)經(jīng)過預(yù)處理的所述基礎(chǔ)設(shè)施層數(shù)據(jù)、所述服務(wù)層數(shù)據(jù)、所述網(wǎng)絡(luò)層數(shù)據(jù)構(gòu)建資源依賴圖譜以及虛擬網(wǎng)絡(luò)拓?fù)鋱D;
6、將實(shí)時(shí)業(yè)務(wù)指標(biāo)數(shù)據(jù)和所述資源依賴圖譜輸入到網(wǎng)絡(luò)預(yù)測模型中得到異常預(yù)測結(jié)果,所述異常預(yù)測結(jié)果包括異常節(jié)點(diǎn)列表;
7、根據(jù)所述異常預(yù)測結(jié)果和所述資源依賴圖譜以及虛擬網(wǎng)絡(luò)拓?fù)鋱D確定網(wǎng)絡(luò)異常原因定位結(jié)果;
8、通過所述異常原因定位結(jié)果在屏幕顯示界面輸出顯示所述目標(biāo)網(wǎng)絡(luò)的異常原因以及異常原因所在的位置。
9、在一個(gè)可選的實(shí)施例中,所述根據(jù)經(jīng)過預(yù)處理的所述基礎(chǔ)設(shè)施層數(shù)據(jù)、所述服務(wù)層數(shù)據(jù)、所述網(wǎng)絡(luò)層數(shù)據(jù)構(gòu)建資源依賴圖譜以及虛擬網(wǎng)絡(luò)拓?fù)鋱D,包括:
10、根據(jù)經(jīng)過預(yù)處理的所述基礎(chǔ)設(shè)施層數(shù)據(jù)、所述服務(wù)層數(shù)據(jù)構(gòu)建資源依賴圖譜;
11、根據(jù)經(jīng)過預(yù)處理的所述基礎(chǔ)設(shè)施層數(shù)據(jù)、所述網(wǎng)絡(luò)層數(shù)據(jù)構(gòu)建虛擬網(wǎng)絡(luò)拓?fù)鋱D。
12、在一個(gè)可選的實(shí)施例中,所述根據(jù)經(jīng)過預(yù)處理的所述基礎(chǔ)設(shè)施層數(shù)據(jù)、所述服務(wù)層數(shù)據(jù)構(gòu)建資源依賴圖譜,包括:
13、從經(jīng)過預(yù)處理的所述基礎(chǔ)設(shè)施層數(shù)據(jù)、所述服務(wù)層數(shù)據(jù)中分別提取業(yè)務(wù)實(shí)體節(jié)點(diǎn)、服務(wù)節(jié)點(diǎn);
14、確定所述業(yè)務(wù)實(shí)體節(jié)點(diǎn)、所述服務(wù)節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系,以及各個(gè)關(guān)聯(lián)關(guān)系的關(guān)系權(quán)重;
15、根據(jù)所述業(yè)務(wù)實(shí)體節(jié)點(diǎn)、所述服務(wù)節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系及其對(duì)應(yīng)的關(guān)系權(quán)重構(gòu)建所述資源依賴圖譜。
16、在一個(gè)可選的實(shí)施例中,所述根據(jù)經(jīng)過預(yù)處理的所述基礎(chǔ)設(shè)施層數(shù)據(jù)、所述網(wǎng)絡(luò)層數(shù)據(jù)構(gòu)建虛擬網(wǎng)絡(luò)拓?fù)鋱D,包括:
17、從經(jīng)過預(yù)處理的所述基礎(chǔ)設(shè)施層數(shù)據(jù)、所述網(wǎng)絡(luò)層數(shù)據(jù)中分別提取網(wǎng)絡(luò)實(shí)體節(jié)點(diǎn)、網(wǎng)絡(luò)節(jié)點(diǎn);
18、確定所述業(yè)務(wù)實(shí)體節(jié)點(diǎn)、所述網(wǎng)絡(luò)節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系,以及各個(gè)關(guān)聯(lián)關(guān)系的關(guān)系權(quán)重;
19、根據(jù)所述業(yè)務(wù)實(shí)體節(jié)點(diǎn)、所述網(wǎng)絡(luò)節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系及其對(duì)應(yīng)的關(guān)系權(quán)重構(gòu)建所述資源依賴圖譜。
20、在一個(gè)可選的實(shí)施例中,所述將實(shí)時(shí)業(yè)務(wù)指標(biāo)數(shù)據(jù)和所述資源依賴圖譜輸入到網(wǎng)絡(luò)預(yù)測模型中得到異常預(yù)測結(jié)果,包括:
21、將實(shí)時(shí)業(yè)務(wù)指標(biāo)數(shù)據(jù)和所述資源依賴圖譜輸入到網(wǎng)絡(luò)預(yù)測模型中,通過所述網(wǎng)絡(luò)預(yù)測模型中的映射模塊將所述實(shí)時(shí)業(yè)務(wù)指標(biāo)數(shù)據(jù)映射到所述資源依賴圖譜中得到攜帶業(yè)務(wù)指標(biāo)數(shù)據(jù)的資源依賴圖譜;
22、將所述攜帶業(yè)務(wù)指標(biāo)數(shù)據(jù)的資源依賴圖譜輸入到特征提取模塊進(jìn)行特征提取得到業(yè)務(wù)依賴圖譜數(shù)據(jù)特征向量;
23、通過所述業(yè)務(wù)依賴圖譜數(shù)據(jù)特征向量得到所述異常預(yù)測結(jié)果。
24、在一個(gè)可選的實(shí)施例中,所述將所述攜帶業(yè)務(wù)指標(biāo)數(shù)據(jù)的資源依賴圖譜輸入到特征提取模塊進(jìn)行特征提取得到業(yè)務(wù)依賴圖譜數(shù)據(jù)特征向量,包括:
25、通過第一特征提取模塊對(duì)所述實(shí)時(shí)業(yè)務(wù)指標(biāo)數(shù)據(jù)進(jìn)行數(shù)據(jù)特征提取得到業(yè)務(wù)特征向量矩陣,所述業(yè)務(wù)特征向量矩陣中的每一行代表一個(gè)時(shí)間單位的業(yè)務(wù)數(shù)據(jù)特征;
26、通過第二特征提取模塊對(duì)所述資源依賴圖譜進(jìn)行特征提取得到依賴圖譜特征向量;
27、對(duì)所述業(yè)務(wù)特征向量矩陣和所述依賴圖譜特征向量進(jìn)行特征融合得到業(yè)務(wù)依賴圖譜數(shù)據(jù)特征向量。
28、在一個(gè)可選的實(shí)施例中,所述根據(jù)所述異常預(yù)測結(jié)果和所述資源依賴圖譜以及虛擬網(wǎng)絡(luò)拓?fù)鋱D確定網(wǎng)絡(luò)異常原因定位結(jié)果,包括:
29、根據(jù)所述異常預(yù)測結(jié)果中的異常節(jié)點(diǎn)列表進(jìn)行異常時(shí)間過濾得到異常節(jié)點(diǎn)簇集合;
30、通過所述異常節(jié)點(diǎn)簇集合和所述資源依賴圖譜構(gòu)建異常傳播路徑圖,所述異常傳播路徑圖中每個(gè)異常節(jié)點(diǎn)對(duì)應(yīng)有異常值;
31、根據(jù)所述異常傳播路徑圖和所述虛擬網(wǎng)絡(luò)拓?fù)鋱D確定所述網(wǎng)絡(luò)異常原因定位結(jié)果。
32、在一個(gè)可選的實(shí)施例中,所述根據(jù)所述異常預(yù)測結(jié)果中的異常節(jié)點(diǎn)列表進(jìn)行異常時(shí)間過濾得到異常節(jié)點(diǎn)簇集合,包括:
33、通過時(shí)間相關(guān)性、空間相關(guān)性以及邏輯相關(guān)性計(jì)算所述異常節(jié)點(diǎn)列表中異常節(jié)點(diǎn)之間的關(guān)聯(lián)度;
34、將所述異常節(jié)點(diǎn)列表中的置信度小于預(yù)置數(shù)值且與其他異常節(jié)點(diǎn)無關(guān)聯(lián)度的異常節(jié)點(diǎn)過濾掉得到異常節(jié)點(diǎn)簇集合。
35、在一個(gè)可選的實(shí)施例中,所述根據(jù)所述異常傳播路徑圖和所述虛擬網(wǎng)絡(luò)拓?fù)鋱D確定所述網(wǎng)絡(luò)異常原因定位結(jié)果,包括:
36、計(jì)算所述異常傳播路徑圖中各個(gè)異常節(jié)點(diǎn)的可疑度,并將所述可疑度滿足預(yù)置條件的異常節(jié)點(diǎn)添加到可疑節(jié)點(diǎn)列表中;
37、將所述可疑節(jié)點(diǎn)列表中的異常節(jié)點(diǎn)映射到所述虛擬網(wǎng)絡(luò)拓?fù)鋱D中,在所述虛擬網(wǎng)絡(luò)拓?fù)鋱D中檢查異常節(jié)點(diǎn)所在網(wǎng)絡(luò)位置的網(wǎng)絡(luò)狀態(tài);
38、若所述異常節(jié)點(diǎn)所在網(wǎng)絡(luò)位置的網(wǎng)絡(luò)狀態(tài)為異常,根據(jù)系統(tǒng)日志、所述實(shí)時(shí)業(yè)務(wù)指標(biāo)數(shù)據(jù)、所述異常傳播路徑圖和所述虛擬網(wǎng)絡(luò)拓?fù)鋱D確定所述網(wǎng)絡(luò)異常原因定位結(jié)果。
39、本發(fā)明實(shí)施例提供一種基于人工智能的業(yè)務(wù)告警系統(tǒng),所述系統(tǒng)包括:
40、獲取模塊,用于獲取目標(biāo)網(wǎng)絡(luò)的基礎(chǔ)設(shè)施層數(shù)據(jù)、服務(wù)層數(shù)據(jù)、網(wǎng)絡(luò)層數(shù)據(jù);
41、預(yù)處理模塊,用于對(duì)所述目標(biāo)網(wǎng)絡(luò)的基礎(chǔ)設(shè)施層數(shù)據(jù)、服務(wù)層數(shù)據(jù)、網(wǎng)絡(luò)層數(shù)據(jù)進(jìn)行預(yù)處理;所述預(yù)處理至少包括歸一化、異常值過濾;
42、構(gòu)建模塊,用于根據(jù)經(jīng)過預(yù)處理的所述基礎(chǔ)設(shè)施層數(shù)據(jù)、所述服務(wù)層數(shù)據(jù)、所述網(wǎng)絡(luò)層數(shù)據(jù)構(gòu)建資源依賴圖譜以及虛擬網(wǎng)絡(luò)拓?fù)鋱D;
43、預(yù)測模塊,用于將實(shí)時(shí)業(yè)務(wù)指標(biāo)數(shù)據(jù)和所述資源依賴圖譜輸入到網(wǎng)絡(luò)預(yù)測模型中得到異常預(yù)測結(jié)果,所述異常預(yù)測結(jié)果包括異常節(jié)點(diǎn)列表;
44、確定模塊,用于根據(jù)所述異常預(yù)測結(jié)果和所述資源依賴圖譜以及虛擬網(wǎng)絡(luò)拓?fù)鋱D確定網(wǎng)絡(luò)異常原因定位結(jié)果;
45、輸出模塊,用于通過所述異常原因定位結(jié)果在屏幕顯示界面輸出顯示所述目標(biāo)網(wǎng)絡(luò)的異常原因以及異常原因所在的位置。
46、本發(fā)明實(shí)施例包括以下優(yōu)點(diǎn):
47、本發(fā)明實(shí)施例提供了一種基于人工智能的業(yè)務(wù)告警方法及系統(tǒng),首先獲取目標(biāo)網(wǎng)絡(luò)的基礎(chǔ)設(shè)施層數(shù)據(jù)、服務(wù)層數(shù)據(jù)、網(wǎng)絡(luò)層數(shù)據(jù);然后對(duì)目標(biāo)網(wǎng)絡(luò)的基礎(chǔ)設(shè)施層數(shù)據(jù)、服務(wù)層數(shù)據(jù)、網(wǎng)絡(luò)層數(shù)據(jù)進(jìn)行預(yù)處理;該預(yù)處理至少包括歸一化、異常值過濾;之后根據(jù)經(jīng)過預(yù)處理的基礎(chǔ)設(shè)施層數(shù)據(jù)、服務(wù)層數(shù)據(jù)、網(wǎng)絡(luò)層數(shù)據(jù)構(gòu)建資源依賴圖譜以及虛擬網(wǎng)絡(luò)拓?fù)鋱D;將實(shí)時(shí)業(yè)務(wù)指標(biāo)數(shù)據(jù)和資源依賴圖譜輸入到網(wǎng)絡(luò)預(yù)測模型中得到異常預(yù)測結(jié)果,最后根據(jù)異常預(yù)測結(jié)果和資源依賴圖譜以及虛擬網(wǎng)絡(luò)拓?fù)鋱D確定網(wǎng)絡(luò)異常原因定位結(jié)果;并通過異常原因定位結(jié)果在屏幕顯示界面輸出顯示目標(biāo)網(wǎng)絡(luò)的異常原因以及異常原因所在的位置。相對(duì)于現(xiàn)有技術(shù)依賴人工經(jīng)驗(yàn)排查告警,本技術(shù)根據(jù)相關(guān)數(shù)據(jù)生成資源依賴圖譜以及虛擬網(wǎng)絡(luò)拓?fù)鋱D,之后通過網(wǎng)絡(luò)預(yù)測模型得到異常預(yù)測結(jié)果,并基于異常預(yù)測結(jié)果、生成資源依賴圖譜以及虛擬網(wǎng)絡(luò)拓?fù)鋱D確定網(wǎng)絡(luò)異常原因定位結(jié)果,由此通過本技術(shù)實(shí)現(xiàn)了快速識(shí)別復(fù)雜系統(tǒng)中故障的傳播路徑和根源節(jié)點(diǎn),從而通過本技術(shù)提高了業(yè)務(wù)告警的準(zhǔn)確率以及效率。