九九热6,久久中文字幕电影,美女撒尿毛片视频免费看,一二三区欧美,特级黄色一级片,亚洲精品爱,国产图色

內(nèi)存故障管理系統(tǒng)、方法、服務(wù)器及電子設(shè)備與流程

文檔序號(hào):42887591發(fā)布日期:2025-08-29 19:35閱讀:12來(lái)源:國(guó)知局

本申請(qǐng)涉及計(jì)算機(jī),尤其涉及一種內(nèi)存故障管理系統(tǒng)、方法、服務(wù)器及電子設(shè)備。


背景技術(shù):

1、隨著互聯(lián)網(wǎng)、云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等技術(shù)的發(fā)展,數(shù)據(jù)呈快速增長(zhǎng),存儲(chǔ)節(jié)點(diǎn)、計(jì)算節(jié)點(diǎn)的數(shù)量越來(lái)越多,隨著內(nèi)存訪問(wèn)的規(guī)模越來(lái)越大,故障率也越來(lái)越高。內(nèi)存故障容易直接導(dǎo)致系統(tǒng)崩潰,服務(wù)器宕機(jī)。

2、相關(guān)技術(shù)中故障大多是通過(guò)mce(machine?check?exception,機(jī)器檢測(cè)異常)log和bmc(baseboard?management?controller,基板管理控制器)記錄的sel?(system?errorlog,系統(tǒng)錯(cuò)誤日志)日志結(jié)合去發(fā)現(xiàn)定位故障的,而這些最大的問(wèn)題是不能夠提前發(fā)現(xiàn)內(nèi)存問(wèn)題,往往是服務(wù)器宕機(jī)重啟后才被動(dòng)發(fā)現(xiàn)的。


技術(shù)實(shí)現(xiàn)思路

1、本申請(qǐng)?zhí)峁┝艘环N內(nèi)存故障管理系統(tǒng)、方法、服務(wù)器及電子設(shè)備,以至少解決相關(guān)技術(shù)中通過(guò)記錄日志定位內(nèi)存故障的方式無(wú)法提前發(fā)現(xiàn)并規(guī)避內(nèi)存問(wèn)題,容易導(dǎo)致服務(wù)器宕機(jī)的問(wèn)題。

2、本申請(qǐng)?zhí)峁┝艘环N內(nèi)存故障管理系統(tǒng),包括:硬件內(nèi)存的處理電路,處理電路上設(shè)置有硬件層和處理器;硬件層檢測(cè)硬件內(nèi)存的第一錯(cuò)誤數(shù)據(jù)和第二錯(cuò)誤數(shù)據(jù),第一錯(cuò)誤數(shù)據(jù)為可恢復(fù)數(shù)據(jù),第二錯(cuò)誤數(shù)據(jù)為不可恢復(fù)數(shù)據(jù);處理器設(shè)置有內(nèi)核層、用戶層和輸入輸出層,其中,輸入輸出層對(duì)第二錯(cuò)誤數(shù)據(jù)進(jìn)行分類處理,得到第一類型數(shù)據(jù)和第二類型數(shù)據(jù),第一類型數(shù)據(jù)為非致命數(shù)據(jù),第二類型數(shù)據(jù)為致命數(shù)據(jù),對(duì)第二類型數(shù)據(jù)進(jìn)行隔離,并將第一類型數(shù)據(jù)和第一錯(cuò)誤數(shù)據(jù)上報(bào)至內(nèi)核層;內(nèi)核層集成多個(gè)驅(qū)動(dòng)組件,利用內(nèi)核態(tài)的保護(hù)處理機(jī)制對(duì)第一類型數(shù)據(jù)進(jìn)行處理,并將第一錯(cuò)誤數(shù)據(jù)和處理后第一類型數(shù)據(jù)上報(bào)至用戶層;用戶層對(duì)第一錯(cuò)誤數(shù)據(jù)進(jìn)行可視化展示,并在用戶態(tài)對(duì)處理后第一類型數(shù)據(jù)進(jìn)行隔離。

3、本申請(qǐng)還提供了一種服務(wù)器,包括:上述實(shí)施例的內(nèi)存故障管理系統(tǒng)。

4、本申請(qǐng)還提供了一種內(nèi)存故障管理方法,方法用于上述實(shí)施例的內(nèi)存故障管理系統(tǒng)的處理器,該處理器被配置執(zhí)行如下步驟:從硬件層獲取硬件內(nèi)存的第一錯(cuò)誤數(shù)據(jù)和第二錯(cuò)誤數(shù)據(jù),其中,第一錯(cuò)誤數(shù)據(jù)為可恢復(fù)數(shù)據(jù),第二錯(cuò)誤數(shù)據(jù)為不可恢復(fù)數(shù)據(jù);在輸入輸出層,利用輸入輸出層對(duì)第二錯(cuò)誤數(shù)據(jù)進(jìn)行分類處理,得到第一類型數(shù)據(jù)和第二類型數(shù)據(jù),第一類型數(shù)據(jù)為非致命數(shù)據(jù),第二類型數(shù)據(jù)為致命數(shù)據(jù),對(duì)第二類型數(shù)據(jù)進(jìn)行隔離,并將第一類型數(shù)據(jù)和第一錯(cuò)誤數(shù)據(jù)上報(bào)至內(nèi)核層;在內(nèi)核層,利用內(nèi)核態(tài)的保護(hù)處理機(jī)制對(duì)第一類型數(shù)據(jù)進(jìn)行處理,并將第一錯(cuò)誤數(shù)據(jù)和處理后第一類型數(shù)據(jù)上報(bào)至用戶層;在用戶層,對(duì)第一錯(cuò)誤數(shù)據(jù)進(jìn)行可視化展示,并在用戶態(tài)對(duì)處理后第一類型數(shù)據(jù)進(jìn)行隔離。

5、本申請(qǐng)還提供了一種電子設(shè)備,包括:存儲(chǔ)器,用于存儲(chǔ)計(jì)算機(jī)程序;處理器,用于執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述任一種內(nèi)存故障管理方法的步驟。

6、本申請(qǐng)的內(nèi)存故障管理系統(tǒng)包括硬件內(nèi)存的處理電路,其上設(shè)有硬件層和處理器,處理器進(jìn)一步劃分為內(nèi)核層、用戶層和輸入輸出層。通過(guò)硬件層檢測(cè)內(nèi)存中的第一錯(cuò)誤數(shù)據(jù)和第二錯(cuò)誤數(shù)據(jù),輸入輸出層對(duì)第二錯(cuò)誤數(shù)據(jù)進(jìn)行分類,將其劃分為非致命的第一類型數(shù)據(jù)和致命的第二類型數(shù)據(jù),并對(duì)致命數(shù)據(jù)進(jìn)行隔離,同時(shí)將非致命數(shù)據(jù)及可恢復(fù)數(shù)據(jù)上報(bào)至內(nèi)核層。內(nèi)核層通過(guò)集成的驅(qū)動(dòng)組件在內(nèi)核態(tài)對(duì)非致命的錯(cuò)誤數(shù)據(jù)進(jìn)行保護(hù)處理,并將第一錯(cuò)誤數(shù)據(jù)和處理后的非致命的錯(cuò)誤數(shù)據(jù)上報(bào)至用戶層。用戶層負(fù)責(zé)對(duì)可恢復(fù)錯(cuò)誤進(jìn)行可視化展示,并在用戶態(tài)對(duì)處理后的非致命的錯(cuò)誤數(shù)據(jù)進(jìn)行進(jìn)一步隔離。由此,通過(guò)硬件層與各軟件層的協(xié)同工作,實(shí)現(xiàn)了對(duì)內(nèi)存錯(cuò)誤的分級(jí)檢測(cè)、分類處理與自動(dòng)隔離,不僅提升了系統(tǒng)的穩(wěn)定性與可靠性,還有效防止了因內(nèi)存故障導(dǎo)致的系統(tǒng)崩潰。同時(shí),通過(guò)內(nèi)核態(tài)與用戶態(tài)的聯(lián)動(dòng)機(jī)制,結(jié)合可視化展示,增強(qiáng)了內(nèi)存錯(cuò)誤的可監(jiān)控性和可維護(hù)性,便于運(yùn)維人員快速定位和修復(fù)問(wèn)題,降低了系統(tǒng)運(yùn)維成本。由此,解決了相關(guān)技術(shù)中通過(guò)記錄日志定位內(nèi)存故障的方式無(wú)法提前發(fā)現(xiàn)并規(guī)避內(nèi)存問(wèn)題,容易導(dǎo)致服務(wù)器宕機(jī)的問(wèn)題。



技術(shù)特征:

1.一種內(nèi)存故障管理系統(tǒng),其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的內(nèi)存故障管理系統(tǒng),其特征在于,所述驅(qū)動(dòng)組件將所述第一類型數(shù)據(jù)從用戶地址空間拷貝至內(nèi)核地址空間,返回錯(cuò)誤碼或者已拷貝長(zhǎng)度。

3.根據(jù)權(quán)利要求1或2所述的內(nèi)存故障管理系統(tǒng),其特征在于,所述驅(qū)動(dòng)組件用于所述硬件層執(zhí)行內(nèi)存巡檢操作檢測(cè)到所述第一類型數(shù)據(jù)的錯(cuò)誤時(shí),識(shí)別所述第一類型數(shù)據(jù)所在的內(nèi)存頁(yè),標(biāo)記所述內(nèi)存頁(yè)為異常頁(yè),解除所述異常頁(yè)對(duì)應(yīng)虛擬地址空間的映射。

4.根據(jù)權(quán)利要求1所述的內(nèi)存故障管理系統(tǒng),其特征在于,所述用戶層設(shè)置有守護(hù)進(jìn)程、監(jiān)控進(jìn)程和主進(jìn)程中的至少一個(gè),其中,所述守護(hù)進(jìn)程用于記錄所述第一錯(cuò)誤數(shù)據(jù)和所述第二錯(cuò)誤數(shù)據(jù)的物理地址信息,所述監(jiān)控進(jìn)程在操作系統(tǒng)的啟動(dòng)階段完成初始化后,為所述主進(jìn)程分配內(nèi)存區(qū)域,并啟動(dòng)所述主進(jìn)程。

5.根據(jù)權(quán)利要求4所述的內(nèi)存故障管理系統(tǒng),其特征在于,所述主進(jìn)程設(shè)置有多個(gè)內(nèi)存管理模塊,其中,所述內(nèi)存管理模塊用于在所述第一類型數(shù)據(jù)發(fā)生在所述內(nèi)存區(qū)域內(nèi)時(shí),對(duì)所述第一類型數(shù)據(jù)對(duì)應(yīng)內(nèi)存頁(yè)進(jìn)行隔離。

6.根據(jù)權(quán)利要求1所述的內(nèi)存故障管理系統(tǒng),其特征在于,還包括:

7.根據(jù)權(quán)利要求6所述的內(nèi)存故障管理系統(tǒng),其特征在于,所述驅(qū)動(dòng)組件用于:通過(guò)目標(biāo)映射文件定位所述第一錯(cuò)誤數(shù)據(jù)和所述第二錯(cuò)誤數(shù)據(jù)的對(duì)應(yīng)內(nèi)存物理插槽,其中,所述目標(biāo)映射文件為操作系統(tǒng)啟動(dòng)階段由所述適配組件生成的配置文件,存儲(chǔ)內(nèi)存物理插槽與錯(cuò)誤數(shù)據(jù)對(duì)應(yīng)硬件標(biāo)識(shí)之間的映射關(guān)系,所述硬件標(biāo)識(shí)包括內(nèi)存控制器編號(hào)、片選行編號(hào)、通道編號(hào)及內(nèi)存條編號(hào)的至少一個(gè)。

8.一種服務(wù)器,其特征在于,包括:權(quán)利要求1-7任意一項(xiàng)所述的內(nèi)存故障管理系統(tǒng)。

9.一種內(nèi)存故障管理方法,其特征在于,所述方法用于上述權(quán)利要求1-7任意一項(xiàng)所述的內(nèi)存故障管理系統(tǒng)的處理器,所述處理器被配置執(zhí)行如下步驟:

10.一種電子設(shè)備,其特征在于,包括:


技術(shù)總結(jié)
本申請(qǐng)公開了一種內(nèi)存故障管理系統(tǒng)、方法、服務(wù)器及電子設(shè)備,涉及計(jì)算機(jī)技術(shù)領(lǐng)域,包括硬件內(nèi)存的處理電路,其上設(shè)有硬件層和處理器,處理器進(jìn)一步劃分為內(nèi)核層、用戶層和輸入輸出層。通過(guò)硬件層與各軟件層的協(xié)同工作,實(shí)現(xiàn)了對(duì)內(nèi)存錯(cuò)誤數(shù)據(jù)的分級(jí)檢測(cè)、分類處理與自動(dòng)隔離,有效防止了因內(nèi)存故障錯(cuò)誤數(shù)據(jù)導(dǎo)致的服務(wù)器宕機(jī)。同時(shí),通過(guò)內(nèi)核態(tài)與用戶態(tài)的聯(lián)動(dòng)機(jī)制,結(jié)合可視化展示,增強(qiáng)了內(nèi)存錯(cuò)誤的可監(jiān)控性和可維護(hù)性,便于運(yùn)維人員快速定位和修復(fù)問(wèn)題,降低了系統(tǒng)運(yùn)維成本。

技術(shù)研發(fā)人員:張士輝,李冬冬,劉清林
受保護(hù)的技術(shù)使用者:蘇州元腦智能科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/8/28
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1