前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇傳播模型范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
很多醫(yī)學(xué)工作者試圖從醫(yī)學(xué)的不同角度來解釋傳染病傳播時的一種現(xiàn)象,這種現(xiàn)象就是在某一民族或地區(qū),某種傳染病傳播時,每次所涉及的人數(shù)大體上是一常數(shù)。結(jié)果都不能令人滿意,后來由于數(shù)學(xué)工作者的參與,用建立數(shù)學(xué)模型來對這一現(xiàn)象進(jìn)行模擬和論證,得到了較滿意的解答。
一種疾病的傳播過程是一種非常復(fù)雜的過程,它受很多社會因素的制約和影響,如傳染病人的多少,易受傳染者的多少,傳染率的大小,排除率的大小,人口的出生和死亡,還有人員的遷入和遷出,潛伏期的長短,預(yù)防疾病的宣傳以及人的個體差異等。如何建立一個與實際比較吻合的數(shù)學(xué)模型,開始顯然不能將所有因素都考慮進(jìn)去。為此,必須從諸多因素中,抓住主要因素,去掉次要因素。先把問題簡化,建立相應(yīng)的數(shù)學(xué)模型。將所得結(jié)果與實際比較,找出問題,修改原有假設(shè),再建立一個與實際比較吻合的模型。從而使模型逐步完善。下面是一個由簡單到復(fù)雜的建模過程,很有代表性,讀者應(yīng)從中體會這一建模過程的方法和思路。
一.最簡單的模型
假設(shè):(1)
每個病人在單位時間內(nèi)傳染的人數(shù)是常數(shù)k;(2)
一個人得病后經(jīng)久不愈,并在傳染期內(nèi)不會死亡。
以i(t)表示t時刻的病人數(shù),表示每個病人單位時間內(nèi)傳染的人數(shù),i(0)=
表示最初時有個傳染病人,則在時間內(nèi)增加的病人數(shù)為
兩邊除以,并令0得微分方程
…………
(2.1)
其解為
這表明傳染病的轉(zhuǎn)播是按指數(shù)函數(shù)增加的。這結(jié)果與傳染病傳播初期比較吻合,傳染病傳播初期,傳播很快,被傳染人數(shù)按指數(shù)函數(shù)增長。但由(2.1)的解可知,當(dāng)t∞時,i(t)∞,這顯然不符合實際情況。最多所有的人都傳染上就是了。那么問題在那里呢?問題是就出在于兩條假設(shè)對時間較長時不合理。特別是假設(shè)(1),每個病人單位時間內(nèi)傳染的人數(shù)是常數(shù)與實際情況不符。因為隨著時間的推移,病人越來越多,而未被傳染的人數(shù)卻越來越少,因而不同時期的傳播情況是不同的。為了與實際情況較吻合,我們在原有的基礎(chǔ)上修改假設(shè)建立新的模型。
二.
模型的修改
將人群分成兩類:一類為傳染病人,另一類為未被傳染的人,分別用i(t)和s(t)表示t時刻這兩類人的人數(shù)。i
(0)=。
假設(shè):(1)
每個病人單位時間內(nèi)傳染的人數(shù)與這時未被傳染的人數(shù)成正比。即;
(2)
一人得病后,經(jīng)久不愈,并在傳染期內(nèi)不會死亡。
由以上假設(shè)可得微分方程
…………
(2.2)
這是變量分離方程,用分離變量法可求得其解為
…………
(2.3)
其圖形如下圖2-1所示
模型
(2.2)
可以用來預(yù)報傳染較快的疾病前期傳染病高峰到來的時詢。
醫(yī)學(xué)上稱為傳染病曲線,它表示傳染病人的增加率與時間的關(guān)系,如圖2-2所示。
由
(2.3)式可得
…………
(2.4)
再求二階導(dǎo)數(shù),并令,可解得極大點為
…………
(2.5)
從
(2.5)
式可以看出,當(dāng)傳染病強度k或人口總數(shù)n增加時,都將變小,即傳染病高峰來得快。這與實際情況吻合。同時,如果知道了傳染率k(k由統(tǒng)計數(shù)據(jù)得到),即可預(yù)報傳染病高峰到來的時間,這對于預(yù)防傳染病是有益處的。
模型
(2.2)
的缺點是:當(dāng)t∞時,由(2.3)式可知i(t)n,即最后人人都要得病。這顯然與實襪情況不符。造成這個結(jié)果的原因是假設(shè)
(2)
中假設(shè)一人得病后經(jīng)久不愈,也不會死亡。
為了得到與實際情況更吻合的模型,必須修改假設(shè)
(2)
。實際上不是每個人得病后都會傳染別人,因為其中一部份會被隔離,還有由于醫(yī)治和人的身抵抗力會痊愈,有的人會死亡從而也就不再會傳染給別人了。因此必須對模型作進(jìn)一步的修改,建立新的模型。
三.
模型的進(jìn)一步完善
從上面的分析我們看到模型
(2.2)
的假設(shè)
(2)
是不合理的。即不可能一人得病后會經(jīng)久不愈,必有一部份人因醫(yī)治或自身的免疫力,或是被隔離,或是死去而成為不會再繼續(xù)傳染給別人的第三類人。因此我們把人群分成三類:
第一類由能夠把疾病傳染給別人的那些傳染者組成的。用
I(t)
表示
t
時刻第一類人數(shù)。
第二類是由并非傳染者但能夠得病而成為傳染者的那些人組成的,用
S(t)
表示
t
時刻第二類人數(shù)。
第三類包括患病后死去的人,病愈后具有長期免疫力的人,以及在得病后被隔離起來的人。用R(t)
表示
t
時刻第三類人數(shù)。
假設(shè)疾病傳染服從下列法則:
(1)
在所考慮的時期內(nèi)人口總數(shù)保持在固定水平N,即不考慮出生及其他原因引起的死亡,以及人口的遷入遷出的情況。
(2)
易受傳染者人數(shù)S(t)的變化率正比于第一類的人數(shù)I(t)與第二類人粉S(t)的乘積。
(3)
由第一類向第三類轉(zhuǎn)變的速度與第一類的人數(shù)成正比。
在這三條假設(shè)情況下可得如下微分方程:
…………
(2.6)
其中r、λ為比例常數(shù),r為傳染率,λ為排除率。
由方程(2.6)的三個方程相加得
則
故
因此只要求出
S(t)、I(t)
即可求出
R(t)。
方程組
(2.6)
的第一個和第二個方程與
R(t)
無關(guān)。因此,由
…………
(2.7)
得
…………
(2.8)
積分得
由初始條件:當(dāng)
并記
代入上式可確定常數(shù)
最后得
…………
(2.9)
下面我們討論積分曲線
(2.9)
的性質(zhì),由(2.8)知
所以當(dāng)S<ρ時,I(S)
是S的增函數(shù),S>ρ時,I(S)
是S的減函數(shù)。
又有I(0)=-∞,
由連續(xù)函數(shù)的中間值定理及單調(diào)性知,存在唯一點,,使得,
而當(dāng)
時,I(S)>0。
由
(2.7)
知I=0時,,所以為方程組
(2.7)
的平衡點。
當(dāng)
時,方程(2.9)的的圖形如圖2-3。當(dāng)t由變到
∞
時,點(S(t),I(t))沿曲線
(2.9)
移動,并沿S減少的方向移動,因為
S(t)
隨時間的增加而單調(diào)減少。因此,如果小于ρ,則
I(t)
單調(diào)減少到零,S(t)
單調(diào)減少到。所以,如果為數(shù)不多的一群傳染者分散在居民中,且,則這種病會很快被消滅。
如果,則隨著
S(t)
減少到ρ時,I(t)
增加,且當(dāng)S=ρ時,I(t)
達(dá)到最大值。當(dāng)S(t)<ρ
時
I(t)
才開始減少。
由上分析可以得出如不結(jié)論:
只有當(dāng)居民中的易受傳染者的人數(shù)超過閾值
時傳染病才會蔓延。
用一般常識來檢驗上面的結(jié)論也是符合的。當(dāng)人口擁擠,密度高,缺少應(yīng)有的科學(xué)文化知識,缺乏必要的醫(yī)療條件,隔離不良而排除率低時,傳染病會很快蔓延;反之,人口密度低,社會條件好,有良好的醫(yī)療條件和較好的管理而排除率高時,則傳染病在有限范圍內(nèi)出現(xiàn)會很快被消滅。
傳染病學(xué)中的閾值定理
設(shè),且假設(shè)同1相比是小量。并設(shè)最初傳染者人數(shù)很小,則最終患病人數(shù)為2r。即是易受傳染者的人數(shù)最初比閾值高多少,那么最終就會比閾值低多少。這就是有名的傳染病閾值定理。生物數(shù)學(xué)家Kermack和Mekendrick在1927年首先證明了這個定理(證明從略)
根據(jù)閾值定理就可以由起初易受傳染者的人數(shù)來估計最終患病的人數(shù)。這定理解釋了研究人員長期以來難以解釋的為什么對于某一民族或地區(qū),某種傳染病傳播時,每次所涉及的人數(shù)大體上是一常數(shù)的現(xiàn)象。
在傳染病發(fā)生的過程中,不可能準(zhǔn)確地調(diào)查每一天或每一星期的得病人數(shù)。因為只有那些來醫(yī)院就醫(yī)者才能被人知道他們得了病,并把他們隔離起來防止傳染。因此,統(tǒng)計的記錄是每一天或星期新排除者的人數(shù),而不是新得病的人數(shù)。所以,為了把數(shù)學(xué)模型所預(yù)示的結(jié)果同疾病的實際情況進(jìn)行比較,必須解出(2.6)中的第三個方程。
因為
所以
從而有
…………
(2.10)
方程
(2.10)
雖是可分離變量的方程,但是不能用顯式求解,如果傳染病不嚴(yán)重,則R/ρ是小量,取泰勒級數(shù)前三項有
從而
其解
其中
因此
…………
(2.11)
方程
(2.11)
在
平面上定義了一條對稱鐘形曲線,稱為疾病傳染曲線。疾病傳染曲線很好地說明了實際發(fā)生的傳染病的情況:每天報告的新病案的數(shù)目逐漸上升到峰值,然后又減少下來。
Kermak和Mekendrick把
(2.11)
得到的值,
關(guān)鍵詞:傳播分布模型 運動過程 質(zhì)平衡
在空調(diào)通風(fēng)條件下,室內(nèi)顆粒物的運動以及分布情況是評價室內(nèi)空氣品質(zhì)的重要指標(biāo),研究室內(nèi)顆粒物的分布情況主要有三種方法:實驗檢測、模型分析和CFD模擬。本文欲重點分析顆粒物在室內(nèi)的沉降模型。
1.模型分析
模型分析法是一種數(shù)學(xué)物理研究方法。這種方法把室內(nèi)顆粒物的發(fā)散源頭、影響因素等加以綜合,從質(zhì)量守恒的角度出發(fā),在一系列假設(shè)(如室內(nèi)空氣混合均勻等)的前提下,建立起室內(nèi)顆粒物運動和分布的模型。
1.1 滲透過程
滲透過程是指在室內(nèi)外壓差的作用下,室外空氣中的顆粒物通過門窗的縫隙向室內(nèi)低速傳播的過程??紤]到一般情況下滲透過程的作用相對于室內(nèi)人員活動以及物品散發(fā)的作用較為微小,故在近似計算中,滲透過程可忽略不計。
1.2 通風(fēng)過程
顆粒物隨空氣進(jìn)入和離開室內(nèi)環(huán)境主要有三種方式:機械通風(fēng)、自然通風(fēng)和滲透風(fēng)。機械通風(fēng)系統(tǒng)中由于裝有過濾器,進(jìn)入室內(nèi)環(huán)境中的顆粒物濃度和大小主要取決于過濾器效率。由于自然通風(fēng)中的開口尺寸較大,顆粒物在開口處幾乎沒有沉降就直接進(jìn)入室內(nèi)環(huán)境中;顆粒物離開時亦然。對于小裂縫,顆粒物的滲透時會在其表面沉積;對于大縫隙,顆粒物也幾乎不會沉積下來。
1.3 沉積過程
沉積到物體表面是顆粒物濃度減少的主要方式之一。室內(nèi)空氣中懸浮顆粒物由于受到重力作用、壁面的吸附作用或是壓差、熱力梯度的影響等,沉降到地面或其他物室內(nèi)表面。
1.4 轉(zhuǎn)化過程
轉(zhuǎn)化過程能夠增加也有可能減少顆粒物的濃度,包括蒸發(fā)沉積、氣體到顆粒物的轉(zhuǎn)變以及顆粒物的凝結(jié)等過程。轉(zhuǎn)化過程同時還會改變顆粒物的粒徑及粒度分布曲線。本文假設(shè)顆粒在整個運動、沉積和傳播過程中不發(fā)生轉(zhuǎn)變。
1.5 重新懸浮
重新懸浮過程能較為明顯地增加室內(nèi)顆粒物的濃度??紤]到本文的研究目的是氣流組織形式的影響,因此本文不考慮重新懸浮作用對室內(nèi)懸浮顆粒物濃度的影響,同時在模擬中假設(shè)物品和墻面都為吸附性墻體。2 顆粒物室內(nèi)濃度預(yù)測模型
建筑室內(nèi)環(huán)境中的顆粒物有室內(nèi)和室外兩種來源,室外來源為通過建筑維護(hù)結(jié)構(gòu)滲透進(jìn)入室內(nèi),或是由空調(diào)系統(tǒng)的新風(fēng)帶入室內(nèi),室內(nèi)來源為人體散發(fā)、室內(nèi)微生物顆粒物的氣溶膠化以及其他物質(zhì)的相變、凝結(jié)和轉(zhuǎn)化等過程。建筑室內(nèi)顆粒物濃度的其他影響因素有通風(fēng)過濾、顆粒物沉積、顆粒物轉(zhuǎn)化以及再懸浮過程。假設(shè)空氣各向同性,空氣與室內(nèi)物體表面不存在溫度梯度,室內(nèi)各處顆粒物濃度均勻,依據(jù)以上所述的不考慮顆粒物的重新懸浮過程和轉(zhuǎn)化過程,依據(jù)質(zhì)量平衡的原理,則某建筑在時間t內(nèi)的室內(nèi)顆粒物濃度的變化可用式1.1表示,室內(nèi)空氣中懸浮顆粒物的各種運動過程和質(zhì)量平衡示意圖如圖1所示。
(1.1)
圖1 室內(nèi)環(huán)境中懸浮顆粒物遷移和轉(zhuǎn)變機理示意圖
室內(nèi)顆粒物的濃度預(yù)測公式可由以下質(zhì)平衡方程1.2表示。
(1.2)
其中,為室內(nèi)顆粒物的濃度變化率,(ug/(m3· min);Qf為中央空調(diào)系統(tǒng)新風(fēng)送風(fēng)量,m3/ min;Qr為中央空調(diào)系統(tǒng)回風(fēng)量,m3/ min;Qp為中央空調(diào)系統(tǒng)排風(fēng)量,m3/ min;Qin為室外空氣向室內(nèi)環(huán)境的滲透量,m3/ min;Cf為室外空氣顆粒物的濃度,(ug/(m3· min);C為室內(nèi)空氣顆粒物的濃度,(ug/(m3· min));η為中央空調(diào)系統(tǒng)送風(fēng)過濾器的過濾效率,%;Ai為室內(nèi)各表面的面積,m2;vi為室內(nèi)環(huán)境中顆粒物相對室內(nèi)各表面的沉降速度,m/s;R1為以其他方式如吸濕、凝結(jié)、化學(xué)反應(yīng)等生成顆粒物的速度ug/min;R2為室內(nèi)發(fā)生源生成顆粒物的速度ug/min;P為滲透因子。
對于公式1.2,需要指出的是,一般研究考慮的是顆粒物由室外向室內(nèi)的滲透過程,而對于空調(diào)房間,由于室內(nèi)壓力比室外大,縫隙中的氣流方向為由室內(nèi)向室外,顆粒物是由室內(nèi)向室外滲透,因此,對于空調(diào)房間來說,公式1.2變?yōu)椋?/p>
(1.3)
2.1 室內(nèi)外顆粒物濃度的確定
室內(nèi)外顆粒物的濃度,通常數(shù)量濃度和粒徑是呈高斯分布的關(guān)系,數(shù)量濃度的值和質(zhì)量濃度、表面積濃度的值也不盡相同,本文為了研究方便,假定室內(nèi)外顆粒物的粒徑統(tǒng)一 ,濃度采用質(zhì)量濃度的計量方式。
2.2 滲透因子的確定
室外空氣向室內(nèi)滲透時顆粒物的滲透因子目前還沒有可以適用一般情況的公式或數(shù)據(jù),故一般采取數(shù)學(xué)模型的方法推導(dǎo)出實際工程中近似條件下滲透因子的適用公式。2007年,湖南大學(xué)田利偉博士綜合重力、布朗擴散和慣性攔截三種沉積機理對顆粒物在穿透過程中的影響,分析了顆粒物粒徑等因子,得出了顆粒物在建筑圍護(hù)結(jié)構(gòu)中穿透過程的滲透因子,如公式2.1所示,最后用實驗數(shù)據(jù)對該因子的預(yù)測結(jié)果進(jìn)行了驗證[1]。
(2.1)
其中,H為縫隙的高度,mm;L為縫隙的深度,cm;Δp為縫隙兩端的壓差,Pa;d為顆粒物的直徑,μm;u為縫隙中的氣流速度,m/s;CC為Cummingham滑動修正系數(shù);μ為空氣動力粘性系數(shù),取值18.2×10-6kg/(m·s);T為絕對溫度,K;K為波爾茲曼常數(shù),取值1.38×10-16g·cm2/(s2·K)。
在Δp取10Pa,H取0.25mm,L取4cm時,由以上公式可得,粒徑為2.5μm的顆粒物的滲透因子為0.62,粒徑為10的顆粒物的滲透因子為0。值得指出的是,公式2.1是在假定顆粒物通過的內(nèi)表面為光滑狀態(tài)下得出的,沒有考慮通道的粗糙度對顆粒物通過的影響。
2.3 沉降速度的確定
顆粒物沉積是影響室內(nèi)空氣中顆粒物濃度分布的一個重要因素,對于顆粒物的沉積速度,國內(nèi)外大部分的研究均集中于對沉積率的實驗檢測[3~4],實驗過程中往往存在大量干擾因素、不可控因素以及偶然因素,實驗的外部條件具有特殊性,且無法將實驗結(jié)果和相應(yīng)的顆粒物粒徑對應(yīng)起來,因此實驗方法不具有普遍適用性。
于是有學(xué)者提出了基于實驗數(shù)據(jù)的顆粒物沉積過程的模型,但是問題在于無法確定哪個模型是較為精確和適用的,因此通過數(shù)學(xué)分析的方法研究出的模型通常是適用的。文獻(xiàn)[1]運用數(shù)學(xué)方法建立了室內(nèi)懸浮顆粒物的沉積模型。文獻(xiàn)首先分析了空氣中懸浮的顆粒物所受到的各種力,然后利用物體表面上的邊界層質(zhì)量通量得出了沉降速 度公式(見式2.2),分析了影響沉降公式的各個因子(紊流系數(shù)等),并利用實驗數(shù)據(jù)驗證了公式的合理性。
(2.2)
其中,vd為顆粒物的沉降速度,m/s;C為空氣中的顆粒物濃度,kg/m3;DPM為顆粒物布朗擴散系數(shù),m2/s;εp為顆粒物的紊流擴散系數(shù),m2/s;C∞為邊界層主流區(qū)顆粒物的濃度kg/m3。
當(dāng)顆粒物的粒徑大于0.01μm時,布朗擴散系數(shù)相對于紊流擴散系數(shù)很小,于是可以忽略布朗擴散系數(shù),得到簡化的顆粒物沉降公式2.3。
(2.3)
假定邊界層主流區(qū)顆粒物的濃度和建筑室內(nèi)核心濃度相等,即C∞=C,帶入式3.6,令, ,解式1.3,可得
(2.4)
初始條件為:t0,C(t)C0
(2.5)
則式2.4變?yōu)?/p>
(2.6)
則當(dāng)t∞,即室內(nèi)顆粒物濃度達(dá)到穩(wěn)定狀態(tài)時,由式2.6可知
(2.7)
即:
(2.8)
其中,
式2.4可以估算出室內(nèi)顆粒物的濃度變化和分布情況。
3.結(jié)論
本文首先研究了室內(nèi)顆粒物運動的幾種基本過程:滲透過程、通風(fēng)過程、沉積過程、轉(zhuǎn)化過程以及重新懸浮,然后結(jié)合這幾種過程,以建筑室內(nèi)顆粒物質(zhì)平衡為依據(jù),建立起室內(nèi)顆粒物濃度分布的預(yù)測模型,并在參考前人研究成果的基礎(chǔ)上,給出了模型中主要影響因子的表達(dá)式。
關(guān)鍵詞:社交網(wǎng)絡(luò);剪枝策略;傳播模型;話題
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識號:A
The Research on Pruning Strategies Topic Propagation Model of Social Network
YIN Zelong, TANG Xianglong
(School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China)
Abstract: With the spreading of topics in the social network, topic models would spent more time and more storage space with the increase of the size of data. However, most topics focus on some key nodes and parts of nodes have no significant effect on topic propagation in the real process of topic propagation. If we could reasonably cut some nodes in the social network during the spread of topics, the runtime of the program and the storage space both would be reduced. To solve the above problem, the paper designs two novel graph pruning algorithm to reduce the number of nodes in the social network. The two algorithms presented in this paper introduced the thought of recommend system into the research on pruning strategy of topic propagation models and have a certain novelty. With the analysis and comparison, the paper analyzes the impact of different pruning strategies of propagation model on the effectiveness, the space, running time and the robustness of the graph.
Keywords: Social Network; Pruning Strategy; Propagation Model; Topic
0 引 言
剪枝是一種機器學(xué)習(xí)技術(shù),通過移除樹的某些節(jié)點來減少決策樹的大小,其中這些節(jié)點對分類實例擁有很小的影響因子[1-2]。剪枝不僅能夠減小算法的復(fù)雜性,同時還能夠提高算法的預(yù)測準(zhǔn)確性。
在決策樹算法中,一個重要的問題就是優(yōu)化最終樹的規(guī)模。如果樹的規(guī)模過大,就會存在訓(xùn)練數(shù)據(jù)集過度擬合而新樣本概括不準(zhǔn)確的問題;樹的規(guī)模過小也會無法把握樣本空間重要的信息結(jié)構(gòu)。同時,也很難分析出算法何時應(yīng)該停止,因為此時仍無法判斷新加入的節(jié)點能否動態(tài)地減少錯誤,這個問題被稱為視界效應(yīng)。一個一般化的策略是讓樹自然生長直到停止為止,再使用剪枝策略去移除那些沒有重要作用的節(jié)點。
在本文中,研究擬將將剪枝技術(shù)運用到社交網(wǎng)絡(luò)話題傳播模型中。在進(jìn)行社交網(wǎng)絡(luò)話題傳播時,話題在不同的用戶之間相互傳播,這些用戶則形成了社交網(wǎng)絡(luò)關(guān)系圖[3]。當(dāng)隨著時間不斷向前推移,社交網(wǎng)絡(luò)關(guān)系圖變得更加復(fù)雜,則話題傳播模型在這樣的社交關(guān)系圖上模擬將會花費更多的時間和空間。為了節(jié)省空間和時間開銷,本文提出并設(shè)計了兩種新穎的圖剪枝策略來減少社交網(wǎng)絡(luò)圖中的節(jié)點數(shù)量。文中的算法是將推薦系統(tǒng)的思想引入到社交網(wǎng)絡(luò)傳播模型剪枝策略中,具有一定的新穎性。在本文實驗部分,則將本文提出的算法同隨機剪枝策略[4]和基于度的剪枝策略[5]進(jìn)行比較分析,結(jié)果表明本文的算法在剪枝效果上具有明確顯著的優(yōu)越性。
1 問題定義
該小節(jié)介紹了相關(guān)概念和符號以及社交網(wǎng)絡(luò)話題傳播模型剪枝問題的定義。在此假設(shè)給定一個社交網(wǎng)絡(luò)關(guān)系圖 , 是社交網(wǎng)絡(luò)關(guān)系圖中用戶的集合, 是社交網(wǎng)絡(luò)關(guān)系圖中用戶和用戶關(guān)系的集合。同時假設(shè)以關(guān)鍵詞 作為用戶討論的話題,且在社交網(wǎng)絡(luò)關(guān)系圖 中存在的話題集合為 ,由于話題在社交網(wǎng)絡(luò)中是分布在不同的用戶 上,因此 和 之間存在二元映射關(guān)系,如圖1所示。
圖1 話題與用戶的映射關(guān)系圖
Fig.1 Mapping relationship between topics and users
一個用戶可以包含多個話題,一個話題也可能對應(yīng)多個用戶。同時話題對于不同用戶,其權(quán)重也是不同的,因此上假設(shè)關(guān)鍵詞 對于用戶 的權(quán)重為 。根據(jù)上述定義,可以抽象出本文的研究問題:已知社交網(wǎng)絡(luò)關(guān)系圖 和話題集合 ,求出 。為了解決上述問題,本文提出了兩種新穎的圖剪枝算法,根據(jù) 和話題集合 提供的信息,結(jié)合圖剪枝算法來獲取 。下面將介紹本文所研究的社交網(wǎng)絡(luò)話題模型的剪枝策略。
2 剪枝策略算法研究
本節(jié)介紹了兩種社交網(wǎng)絡(luò)話題模型的剪枝策略,基于話題權(quán)重和基于用戶興趣相似性的剪枝策略??偠灾@兩種算法均是將推薦系統(tǒng)的思想引入圖剪枝策略中。
2.1 基于用戶話題權(quán)重的剪枝策略
基于用戶話題權(quán)重的剪枝策略與基于用戶興趣相似度剪枝策略類似,都是利用了話題與用戶之間的關(guān)系。不同之處是后者計算與用戶具有共同興趣用戶廣泛度,前者是計算擁有話題的廣泛度。在傳播模型中,如果多個話題出現(xiàn)在某個用戶上,則在一定程度上可以說明話題在傳播過程中頻繁地經(jīng)過該用戶,因此這樣的用戶可以被看作關(guān)鍵用戶。基于上述的原因,研發(fā)設(shè)計了一種基于用戶話題權(quán)重的剪枝策略算法。
假設(shè)社交網(wǎng)絡(luò)關(guān)系圖為 以及話題集合為 ,每一個話題 被一個或者幾個用戶所擁有,則假設(shè)擁有話題 的用戶集合為 ,用戶 擁有話題 的權(quán)重為 。首先,對每一個話題 的用戶集合 按照用戶 擁有該話題的權(quán)重 進(jìn)行排序,如圖2所示。
圖 2 基于話題權(quán)重的剪枝步驟1
Fig.2 Topic weight pruning step 1
然后,將每個話題的用戶按照從小到大的順序進(jìn)行編碼,如圖3所示。
圖 3 基于話題權(quán)重的剪枝步驟2
Fig.3 Topic weight pruning step 2
最后,循環(huán)遍歷每一個 來統(tǒng)計每一個 的話題權(quán)重總和,并排序,如圖4所示。
圖 4 基于話題權(quán)重的剪枝步驟3
Fig.4 Topic weight pruning step 3
2.2 基于用戶興趣相似度的剪枝策略
在本節(jié)中,給出了話題集合 與用戶集合 存在映射關(guān)系,即同一個用戶可以擁有多個話題,同一個話題可以被多個用戶擁有,因此即以用戶擁有的話題相似性來表示用戶的興趣相似性。在以上研究中,已經(jīng)闡述到用戶的興趣相似度對話題轉(zhuǎn)移概率是有影響的,當(dāng)用戶間興趣相似度越大,則話題更有可能在同群用戶之間經(jīng)常傳播。如果某個用戶與很多用戶均具有頗高的興趣相似度,則這樣的用戶就是話題傳播過程中的關(guān)鍵用戶而應(yīng)該得到保留。假設(shè)用戶 的話題集合分別為 和 ,則采用cosine-index[6]來衡量興趣相似度,即:
(1)
由公式(1)可知,可以計算出 的 。下面將以4個用戶( )為例來說明該算法步驟。當(dāng)計算出所有用戶之間的興趣相似度后,就可以得到如下所示的矩陣圖:
圖 5 基于用戶興趣相似性的剪枝步驟1
Fig.5 Interest similarity pruning step 1
如圖5所示,該圖的前半部分表示用戶興趣相似度的矩陣圖,后半部分即將每一個用戶與之關(guān)聯(lián)的用戶興趣相似度進(jìn)行排序。而后再對排序后的矩陣進(jìn)行歸一化處理,如圖6所示。
圖 6 基于用戶興趣相似性的剪枝步驟2
Fig.6 Interest similarity pruning step 2
最后,則將歸一化的矩陣中每一個用戶的興趣相似度進(jìn)行統(tǒng)計,并排序得到綜合結(jié)果。具體如圖7所示。
圖 7 基于用戶興趣相似性的剪枝步驟3
Fig.7 Interest similarity pruning step 3
用戶最終得到的權(quán)值越大,就說明用戶和周圍用戶有著更為廣泛的興趣相似度,反之亦然。
3 實驗結(jié)果與結(jié)論分析
本節(jié)主要介紹上述幾種剪枝策略的實驗設(shè)計原理以及實驗結(jié)果。實驗中采用真實的微博數(shù)據(jù)集來構(gòu)建社交網(wǎng)絡(luò)關(guān)系圖和相關(guān)話題的提取,并運用上述幾種剪枝策略來對社交網(wǎng)絡(luò)關(guān)系圖進(jìn)行剪枝,完成后則將傳播模型的算法在剪枝后的社交網(wǎng)絡(luò)關(guān)系圖上進(jìn)行傳播模擬,從而比較不同剪枝策略下傳播模型的預(yù)測效果。
3.1 數(shù)據(jù)集
本文采用的是微博數(shù)據(jù)集,抽取的是在某一時間粒度下的數(shù)據(jù)集來構(gòu)建社交網(wǎng)絡(luò)關(guān)系圖以及話題的抽取,實驗數(shù)據(jù)及環(huán)境配置如表1所示。
表 1 實驗數(shù)據(jù)及環(huán)境配置
Tab.1 The experimental data and environment configuration
名稱 參數(shù)
實驗數(shù)據(jù) User(節(jié)點)
Connection(邊)
Topic(話題) 11589
72395
107
機器配置 8G RAM,3.40GHZ Core i7 處理器
編程語言 C++
分析工具 Matlab2010,Excel
數(shù)據(jù)庫 Mysql
3.2 實驗設(shè)計
本節(jié)從新浪微博數(shù)據(jù)中選取了11 589個節(jié)點以及106 198條邊構(gòu)成一個社交網(wǎng)絡(luò)關(guān)系圖,并從中抽取107個話題。首先是將不同的剪枝策略對社交網(wǎng)絡(luò)關(guān)系圖進(jìn)行剪枝,然后用傳播模型算法分別在不同的剪枝后的關(guān)系圖上模擬話題傳播,比較不同剪枝策略下的預(yù)測效果和運行時間。同時,對于每一種剪枝策略,均將會構(gòu)建實驗并據(jù)此分析不同剪枝程度對傳播模型話題預(yù)測效果的影響。
3.3 實驗效果評估
圖8是將準(zhǔn)確率和召回率進(jìn)行結(jié)合所得到關(guān)于不同剪枝策略對于剪枝比例同傳播模型F1值關(guān)系的曲線圖。從圖中可以看出,Degree PruningASC 的F1變化最快也是最低,主要是因為按照節(jié)點度數(shù)從大到小的順序進(jìn)行剪枝,首先就會剪掉一些關(guān)鍵節(jié)點。其次是Random Pruning,然后是Degree PruningDESC。上述三種剪枝方式從某種程度可以反映出節(jié)點的度數(shù)同節(jié)點的影響力之間的正相關(guān)性。Interest Similarity Pruning和 Topic Weight Pruning在隨著剪枝比例增大時,前期對傳播模型的準(zhǔn)確率并沒有太多的影響。到后期時二者的F1值都會發(fā)生下降,但I(xiàn)nterest Similarity Pruning的F1值會出現(xiàn)陡降,因為當(dāng)剪枝比例越大時,通過Interest Similarity Pruning所剪掉的節(jié)點才是正真意義上的關(guān)鍵傳播節(jié)點,因此將會導(dǎo)致話題傳播嚴(yán)重受阻,F(xiàn)1急速下降。
圖 8 不同剪枝策略下剪枝比例與F1的關(guān)系對比圖
Fig.8 Relation between F1 and pruning proportion based on different pruning strategies
圖9 展示了不同剪枝策略下,剪枝比例同程序運行時間的關(guān)系圖。整體上看,隨著剪枝比例增大,所用的時間呈線性下降。Degree PruningDESC的程序運行時間低于其他剪枝策略,因為這具體是按照節(jié)點度數(shù)從大往小進(jìn)行剪枝,將容易破壞圖的連通性,致使信息傳播受阻。其次是Random Pruning。利用Interest Similarity Pruning,Degree PruningASC 以及Topic Weight Pruning三種剪枝策略剪枝后,傳播模型的運行時間將十分相近,這在某種程度來說如上三種剪枝策略都能夠保證社交網(wǎng)絡(luò)中圖的連通性。
圖 9 不同剪枝策略下剪枝比例與運行時間的關(guān)系對比圖
Fig.9 Relation between runtime and pruning proportion based on different pruning strategies
4 結(jié)束語
本文主要是介紹并研究社交網(wǎng)絡(luò)傳播模型剪枝策略。因為在進(jìn)行社交網(wǎng)絡(luò)話題傳播的過程中,數(shù)據(jù)量會不斷地增大,傳播模型在進(jìn)行傳播模擬時所花銷的時間必將增多,程序運行所占用的空間也會不斷加大,所以本文提出了幾種社交網(wǎng)絡(luò)傳播模型的剪枝策略來對社交網(wǎng)絡(luò)進(jìn)行削減,保證在不降低傳播模型預(yù)測效果的情況下,能夠減少傳播模型所花銷的時間和空間。首先,本文給出了社交網(wǎng)絡(luò)話題傳播模型剪枝策略研究的相關(guān)概念和問題定義,主要包括圖的定義,話題定義以及研究的問題描述。其次,本文給出了兩種新穎的剪枝策略,包括基于用戶興趣相似性的剪枝策略和基于用戶話題權(quán)重的剪枝策略。最后,本文又給出了上述幾種算法的實驗分析結(jié)果,主要從時間的運行效率,所包含節(jié)點比例以及傳播模型的預(yù)測效果來進(jìn)行對比和分析。實驗結(jié)果表明,按節(jié)點度大的順序進(jìn)行剪枝的效果最差,但是模型的運行時間最短;其次是隨機剪枝,效果和運行時間居中;基于用戶話題權(quán)重的剪枝策略,預(yù)測效果表現(xiàn)最好,同時剪枝策略設(shè)計并不復(fù)雜。
參考文獻(xiàn):
[1] HARABOR D, GRASTIEN A. Online graph pruning for pathfinding on grid maps[C]//Association for the Advancement of Artificial Intelligence ,San Francisco, CA, USA:AAAI, 2011.
[2] KRETZSCHMAR H, STACHNISS C, GRISETTI G. Efficient information-theoretic graph pruning for graph-based SLAM with laser range finders[C]//Intelligent Robots and Systems(IROS),San Francisco, CA :IEEE/RSJ,2011 :865-871.
[3] DENG H, HAN J, ZHAO B, et al. Probabilistic topic models with biased propagation on heterogeneous information networks[C]// KDD’11, New York, NY, USA:ACM, 2011:1271-1279
[4] GOYAL A, BONCHI F, LAKSHMANAN L V S. A Data-Based Approach to Social Influence Maximization[J]. VLDB 2012, 2012,5(1):73-84
雙基因模型對感染率變化以及病毒對抗措施介入對病毒傳播所造成的影響進(jìn)行了考慮。在病毒傳播的過程中,計算機用戶可能會發(fā)現(xiàn)病毒采取措施來對抗病毒,如對病毒庫的更新、對病毒的查殺、對系統(tǒng)補丁的完善等,這些方法能夠有效的使病毒感染率降低。
計算機病毒防御研究
主機檢測策略基于主機的檢測策略主要包括權(quán)限控制技術(shù)、完整性驗證技術(shù)和特征碼匹配技術(shù)三類。特征碼匹配技術(shù)可以通過對主機代碼的掃描來確定這些代碼的特征是否與病毒庫中的惡意代碼相同來判定計算機中是否存在惡意程序。其中同種及同類病毒具有相同代碼的理論是特征碼掃描技術(shù)的基礎(chǔ),特征碼匹配技術(shù)需要不斷的對其病毒庫進(jìn)行更新,不然將會不能識別新的病毒代碼,這種技術(shù)在這種情況下也自然會失去價值權(quán)限控制技術(shù)是通過對計算機中程序權(quán)限的選定來避免惡意程序和代碼對計算機進(jìn)行破壞,這是因為惡意程序和代碼只有在運行狀態(tài)下才能夠?qū)τ嬎銠C進(jìn)行破壞完整性檢測是基于病毒代碼需要依附和嵌入程序文檔來運行,它們并不是獨立存在的,而一旦程序或者文檔遭到感染,其本身的完整性也就會被破壞,所以對程序和文檔的完整性進(jìn)行檢驗?zāi)軌蛴行У姆乐共《镜母腥??;谥鳈C的檢測策略需要計算機用戶能夠在計算機中安裝防毒軟件并對軟件進(jìn)行及時更新,而這種要求也使主機檢測策略具有了成本較高以及管理性較差的劣勢。
網(wǎng)絡(luò)檢測策略基于網(wǎng)絡(luò)的檢測策略主要包括異常檢測以及誤用檢測兩類。病毒在植入和傳播的過程中會發(fā)送探測包,這種行為會使網(wǎng)絡(luò)中的流量增加,對病毒本身的異常行為進(jìn)行檢測并采取有效措施進(jìn)行控制是十分必要的,異常檢測可以及時的發(fā)現(xiàn)計算機網(wǎng)絡(luò)流量的變化,當(dāng)其變化異常時會采取措施來避免惡意程序和代碼的進(jìn)一步傳播,這種方法不僅對已知病毒的檢測有效,同時也能夠檢測出新的未知的病毒,但是其本身存在較高的誤報率;誤用檢測技術(shù)以特征碼為基礎(chǔ)。
【關(guān)鍵詞】計算機病毒;SIR模型;穩(wěn)定性;Dulac函數(shù)
1.引言
隨著計算機網(wǎng)絡(luò)的發(fā)展,人們在日常生活中越來越依賴于網(wǎng)絡(luò)來辦理各種事情。網(wǎng)絡(luò)給我們帶來了很多的方便,同時也給我們帶來了各種威脅。目前,計算機病毒已經(jīng)嚴(yán)重威脅到信息安全和個人隱私,并可能導(dǎo)致一些組織遭受巨大損失。如何有效地對抗計算機網(wǎng)絡(luò)病毒,以及如何減少病毒的非法入侵已經(jīng)成為信息安全領(lǐng)域亟待解決的重大問題。
目前,一些學(xué)者利用數(shù)學(xué)模型來研究計算機病毒的傳播規(guī)律[1-9]。最近,馮麗萍等人在文獻(xiàn)[10]中提出了一種改進(jìn)的SIR計算機病毒傳播模型。作者利用微分方程理論分析了模型的動力學(xué)行為,得到了免疫平衡點的全局漸近穩(wěn)定性和流行病平衡點的局部漸近穩(wěn)定性并給出了數(shù)值模擬。但作者并未證明流行病平衡點的全局漸近穩(wěn)定性。因此,在文獻(xiàn)[10]的基礎(chǔ)上,本文研究流行病平衡點的全局漸近穩(wěn)定性。
2.改進(jìn)的SIR計算機病毒傳播模型
下面,我們給出文獻(xiàn)[10]中的一種改進(jìn)的SIR計算機病毒傳播模型:
(1)
其中S(t),I(t)和R(t)分別表示時刻t尚未感染病毒但容易被感染的節(jié)點,已感染病毒的節(jié)點和對病毒已具有免疫功能的節(jié)點。n表示新節(jié)點的接入數(shù),p表示新接入節(jié)點的免疫率,表示有效傳染率,u表示節(jié)點“死亡率”,k表示反病毒的實施率,表示病毒自然死亡率。另外,S,I,R滿足:
(2)
系統(tǒng)(1)中前兩項不依賴于第三項,故考慮如下系統(tǒng):
(3)
其中:
定義:
當(dāng)時,系統(tǒng)(3)在D內(nèi)有唯一的免疫平衡點;當(dāng)時,系統(tǒng)(3)在D內(nèi)除了免疫平衡點M1之外,還有流行病平衡點:
由文獻(xiàn)[10]知,我們有如下結(jié)論:
定理2.1:當(dāng)時,M1在D內(nèi)全局漸近穩(wěn)定。
定理2.2:當(dāng)時,M2在D內(nèi)局部漸近穩(wěn)定。
3.流行病平衡點的全局漸近穩(wěn)定性
本節(jié),我們證明系統(tǒng)(3)的流行病平衡點M2在D內(nèi)全局漸近穩(wěn)定。
定理3.1:當(dāng)時,M2在D內(nèi)全局漸近穩(wěn)定。
證明:要證明這個定理只需證明,當(dāng)時,系統(tǒng)(3)在D內(nèi)不存在閉軌線。對系統(tǒng)(3),考慮和。構(gòu)造Dulac函數(shù):
計算得:
由Bendixson-Dulac定理[11-12]知,系統(tǒng)(3)在D內(nèi)不存在閉軌線。因此,由上述討論可知M2在D內(nèi)全局漸近穩(wěn)定。
4.數(shù)值模擬與分析
為了驗證定理3.1的正確性,我們進(jìn)行了數(shù)值模擬仿真實驗,通過選取三組不同的參數(shù)值來觀察流行病平衡點隨時間的演化趨勢。
1)取 P=0.9,=0.005,n=15,k=0.08,u=0.001,r=0.001,此時R0=1.1292>1,數(shù)值模擬結(jié)果如圖1所示。
2)取P=0.9,=0.005,n=20,k=0.08,u=0.001,r=0.001,此時R0=1.5056>1,數(shù)值模擬結(jié)果如圖2所示。
3)取 P=0.9,=0.005,n=20,k=0.06,u=0.001,r=0.001,此時R0=2.6441>1,數(shù)值模擬結(jié)果如圖3所示。
圖1 取第一組參數(shù)時流行病平衡點
隨時間的演化示意圖
圖2 取第二組參數(shù)時流行病平衡點
隨時間的演化示意圖
圖3 取第三組參數(shù)時流行病平衡點
隨時間的演化示意圖
圖1,圖2和圖3表明,當(dāng)時,流行病平衡點M2是全局漸近穩(wěn)定的,即網(wǎng)絡(luò)中的病毒最終不會消亡。圖1和圖2在參數(shù)b變化時,網(wǎng)絡(luò)中被感染的計算機數(shù)會隨著參數(shù)的增大而增加。圖2和圖3在參數(shù)k變化時,網(wǎng)絡(luò)中被感染的計算機數(shù)會隨著參數(shù)的減小而增加。
5.結(jié)束語
本文研究了一種改進(jìn)的SIR計算機病毒傳播模型的流行病平衡點的全局漸近穩(wěn)定性,發(fā)現(xiàn)模型中病毒的傳播主要依賴于R0的取值,為了減小病毒在網(wǎng)絡(luò)中的傳播,應(yīng)該盡力減小R0的值。在現(xiàn)實中,比較有效和可行的辦法是提高k或者降低n的值。
參考文獻(xiàn)
[1]MISHRA B K,PANDEY S K.Dynamic model of worms with vertical transmission in computer network[J].Applied Mathematics and Computation,2011,217(21):84388446.
[2]TOUTONJI O A,YOO S M,PARK M.Stability analysis of VEISV propagation modeling for network worm attack [J].Applied Mathematical Modelling,2012,36(6):2751-2761.
[3]YANG L X,YANG X F.The spread of computer viruses under the influence of removable storage devices[J].Applied Mathematics and Computation,2012,219(8):3914-3922.
[4]ZHU Q Y,YANG X F,REN J G.Modeling and analysis of the spread of computer virus [J].Communications in Nonlinear Science and Numerical Simulation,2012,17(12):5117-5124.
[5]楊茂斌,楊小帆,祝清意,楊櫓星.具有分級感染率的4倉室計算機病毒傳播模型[J].重慶大學(xué)學(xué)報,2012,35 (12):112-119.
[6]李紅偉,楊小帆.帶有用戶意識的計算機多病毒傳播模型[J].計算機工程,2012,38(1):125-129.
[7]馮麗萍,王鴻斌,馮素琴.基于生物學(xué)原理的計算機網(wǎng)絡(luò)病毒傳播模型[J].計算機工程,2011,37(11):155-157.
[8]馮麗萍,韓琦,王鴻斌.具有變化感染率的僵尸網(wǎng)絡(luò)傳播模型[J].計算機科學(xué),2012,39(11):51-53.
[9]彭梅,李傳東,何興.基于直接免疫的SEIR 計算機病毒傳播模型[J].重慶師范大學(xué)學(xué)報(自然科學(xué)版),2013,30(1):77-80.
[10]馮麗萍,王鴻斌,馮素琴.改進(jìn)的SIR計算機病毒傳播模型[J].計算機應(yīng)用,2011,31(7):1891-1893.
[11]馬知恩,周義倉,王穩(wěn)地,靳幀.傳染病動力學(xué)的數(shù)學(xué)建模與研究[M].北京:科學(xué)出版社,2004.
[12]張芷芬,丁同仁,黃文灶,董鎮(zhèn)喜.微分方程定性理論[M].北京:科學(xué)出版社,2003.
基金項目:天地(常州)自動化股份有限公司研發(fā)項目(編號:13GY001-01);中國煤炭科工集團(tuán)科技創(chuàng)新基金重點項目(編號:2013ZD010)。
作者簡介:
傳播學(xué) 傳播與溝通 傳播學(xué)畢業(yè) 傳播學(xué)論文 傳播論文 傳播學(xué)理論 傳播學(xué)信息論 紀(jì)律教育問題 新時代教育價值觀