国产亚洲AV自拍|av中文字幕一区|资源在线观看一区二区|亚洲影视久久亚洲特级性交|一级做一级a做片爱免费观看|欧美另类亚洲色婷婷精品无码|亚洲青青草免费一区|青青草免费成人网|91久久国内视频|五月天丁香久久

DSE精選文章 | Set-Based Adaptive Distributed Diferential Evolution for Anonymity-Driven…【轉(zhuǎn)發(fā)】
1207
2022-09-15
1
0
0
用微信掃描二維碼

https://mp.weixin.qq.com/s/gbMpds_GHENUQQvy0fZSLw

 

DSE精選文章

Set-Based Adaptive Distributed Diferential Evolution for Anonymity-Driven Database Fragmentation

 

Data Science and Engineering (DSE)是由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,數(shù)據(jù)庫(kù)專業(yè)委員會(huì)承辦,施普林格·自然(Springer Nature)集團(tuán)出版的開(kāi)放獲取(OA)期刊。本篇文章精選自DSE第6卷第4期發(fā)文,得到中新賽克贊助文章處理費(fèi)。

 

文章介紹

數(shù)據(jù)庫(kù)碎片可以通過(guò)打破屬性之間的敏感關(guān)聯(lián)來(lái)保護(hù)外包數(shù)據(jù)存儲(chǔ)的隱私。數(shù)據(jù)庫(kù)碎片算法需要先驗(yàn)知識(shí)處理數(shù)據(jù)庫(kù)中的敏感關(guān)聯(lián),因此這些算法的有效性受到先驗(yàn)知識(shí)的限制。受匿名技術(shù)中匿名度度量的啟發(fā),該文提出了一種基于集合的自適應(yīng)分布式差分進(jìn)化(S-ADDE)算法,用于解決匿名驅(qū)動(dòng)的數(shù)據(jù)庫(kù)碎片問(wèn)題。S-ADDE中的個(gè)體代表數(shù)據(jù)庫(kù)分片的解,每個(gè)解的匿名度設(shè)置為個(gè)體的ftness值。S-ADDE中個(gè)體的更新反映了數(shù)據(jù)庫(kù)碎片化匿名度的增加。此外,該文的主要貢獻(xiàn)如下:

1.為了保證種群的多樣性,該文采用包含四個(gè)亞種群的島嶼模型;

2.該文提出了兩種基于集合的算子,即基于集合的變異算子和基于集合的交叉算子,將傳統(tǒng)差分進(jìn)化中的連續(xù)域轉(zhuǎn)移到數(shù)據(jù)庫(kù)碎片問(wèn)題中的離散域;

3.在基于集合的變異算子中,每個(gè)個(gè)體的變異策略根據(jù)進(jìn)化性能自適應(yīng)選擇;

4.實(shí)驗(yàn)結(jié)果表明,該文提出的S-ADDE明顯優(yōu)于文中比較的方法,驗(yàn)證了提出的算子的有效性。

實(shí)驗(yàn)效果

如圖1所示,描述了一個(gè)樣本數(shù)據(jù)庫(kù),包含九個(gè)屬性和六個(gè)記錄。其中數(shù)據(jù)庫(kù)分為三個(gè)片段,這三個(gè)片段構(gòu)成圖底部所示的片段解決方案。所提出的S-ADDE算法中的每個(gè)個(gè)體代表一個(gè)數(shù)據(jù)庫(kù)碎片解決方案。因此,個(gè)體中的每個(gè)位表示數(shù)據(jù)庫(kù)中的一個(gè)屬性,其值表示選擇相應(yīng)屬性進(jìn)行分配的片段。

圖1. S-ADDE算法中的個(gè)體表示的示例

如圖2所示,描述了島嶼模型的一個(gè)示例,其中每個(gè)大圓表示一個(gè)子種群。在大圓中,小三角形和圓代表最好的個(gè)體和個(gè)體其他亞群體個(gè)體。子種群中的最佳個(gè)體以預(yù)定義的遷移間隔被發(fā)送到通信拓?fù)渖系泥徲蜃臃N群。然后,隨機(jī)選擇每個(gè)子群體中的一個(gè)個(gè)體,并由接收到的精英個(gè)體代替。

圖2. S-ADDE算法中的孤島模型的示例

如表1所示,描述了其他方法在實(shí)驗(yàn)中獲得的平均值和標(biāo)準(zhǔn)偏差值,最佳結(jié)果用黑體標(biāo)出??梢钥吹?,S-ADDE算法在所有測(cè)試用例上都優(yōu)于其他方法,可以在探索性搜索和開(kāi)發(fā)性搜索之間實(shí)現(xiàn)更好的平衡。但是在復(fù)雜的測(cè)試用例(如和)中,S-ADDE更容易陷入局部最優(yōu)。

表1. S-ADDE算法與其他方法的比較

如圖3所示,描述了四個(gè)典型測(cè)試用例的收斂曲線。其中,HA是一種針對(duì)數(shù)據(jù)庫(kù)碎片問(wèn)題的最先進(jìn)的啟發(fā)式算法,DE用作基線算法,S-DDE算法中數(shù)據(jù)庫(kù)碎片問(wèn)題通過(guò)基于集合的變異和交叉算子進(jìn)行優(yōu)化。

一開(kāi)始,這三種算法都收斂得很快。HA很快陷入局部最優(yōu)并停滯。由于DE和S-ADDE的探索能力,它們可以在搜索過(guò)程中不斷提高匿名度。S-ADDE的綠線和DE的紅線之間的差異驗(yàn)證了孤島模型和所提出的基于集合的算子在S-ADDE中的有效性。

圖3. 四個(gè)典型測(cè)試用例上競(jìng)爭(zhēng)方法的收斂曲線 

如表2所示,描述了S-ADDE算法結(jié)果對(duì)原始數(shù)據(jù)集的影響。其中,AD表示每個(gè)數(shù)據(jù)集的匿名程度,min(AD)、avg(AD)和max(AD)表示由S-ADDE中的片段獲得的匿名度的最小值、平均值和最大值。

表2. S-ADDE結(jié)果對(duì)原始數(shù)據(jù)集的影響

如圖4所示,描述了16個(gè)測(cè)試用例的S-ADDE加速比。隨著S-ADDE的并行粒度不斷增加,加速比也顯著增加。不同測(cè)試用例中的加速比曲線各不相同,這是因?yàn)椴煌臏y(cè)試用例具有不同的復(fù)雜性,需要不同的評(píng)估時(shí)間。

圖4. 所有測(cè)試用例的S-ADDE加速比

結(jié)語(yǔ)

該文定義了一個(gè)匿名驅(qū)動(dòng)的數(shù)據(jù)庫(kù)碎片問(wèn)題。為了解決這個(gè)問(wèn)題,該文提出了S-ADDE 算法。S-ADDE算法利用孤島模型來(lái)提高種群多樣性,這在復(fù)雜性高的搜索問(wèn)題中至關(guān)重要。該文提出了兩種基于集合的算子,即具有自適應(yīng)變異策略選擇的基于集合的變異算子和基于集合的交叉算子。S-ADDE的計(jì)算效率驗(yàn)證了所提出算子的有效性。此外,該文對(duì)數(shù)據(jù)庫(kù)分片的隱私問(wèn)題(即匿名度)進(jìn)行了優(yōu)化。在未來(lái)工作中,作者計(jì)劃進(jìn)一步研究和優(yōu)化數(shù)據(jù)庫(kù)碎片的效用問(wèn)題。

作者簡(jiǎn)介

Yong-Feng Ge,分別于 2015 年和 2018 年在中國(guó)廣州中山大學(xué)獲得計(jì)算機(jī)科學(xué)學(xué)士、碩士學(xué)位,在華南理工大學(xué)計(jì)算機(jī)專業(yè)攻讀博士學(xué)位。主要研究方向包括進(jìn)化計(jì)算算法及其應(yīng)用、大規(guī)模優(yōu)化算法,分布式進(jìn)化算法及其應(yīng)用。
Jinli Cao,1997年獲得澳大利亞南昆士蘭大學(xué)計(jì)算機(jī)科學(xué)博士學(xué)位。目前是澳大利亞拉籌伯大學(xué)計(jì)算機(jī)科學(xué)和信息技術(shù)系的全職高級(jí)講師。她在國(guó)際會(huì)議和期刊上發(fā)表了115多篇研究論文。主要研究方向是數(shù)據(jù)工程和信息系統(tǒng),包括大數(shù)據(jù)分析、推薦系統(tǒng)和數(shù)據(jù)隱私保護(hù)。
王樺,2004年獲得南昆士蘭大學(xué) (USQ) 計(jì)算機(jī)科學(xué)學(xué)士學(xué)位。2011年至2013年擔(dān)任南昆士蘭大學(xué)教授。他目前是維多利亞大學(xué)應(yīng)用信息學(xué)中心的全職教授。主要研究方向包括人工智能、數(shù)據(jù)分析、數(shù)據(jù)挖掘、訪問(wèn)控制、隱私和 Web 服務(wù),以及它們?cè)陔娮咏】岛碗娮迎h(huán)境領(lǐng)域的應(yīng)用。
陳貞翔,工學(xué)博士,濟(jì)南大學(xué)教授,博士生導(dǎo)師,濟(jì)南大學(xué)信息科學(xué)與工程學(xué)院院長(zhǎng),網(wǎng)絡(luò)工程國(guó)家一流專業(yè)負(fù)責(zé)人,山東省優(yōu)秀研究生導(dǎo)師,山東省高等學(xué)校青創(chuàng)科技團(tuán)隊(duì)帶頭人,濟(jì)南市高校自主創(chuàng)新團(tuán)隊(duì)領(lǐng)軍人才。主要從事計(jì)算機(jī)網(wǎng)絡(luò)、網(wǎng)絡(luò)安全、智能信息處理等領(lǐng)域研究,主持國(guó)家自然科學(xué)基金項(xiàng)目2項(xiàng)、山東省重點(diǎn)研發(fā)計(jì)劃等省部級(jí)項(xiàng)目10余項(xiàng)。

張彥春,廣州大學(xué)/鵬城實(shí)驗(yàn)室特聘教授,澳大利亞維多利亞大學(xué)名譽(yù)教授。多年來(lái)一直從事社會(huì)計(jì)算和電子健康,大數(shù)據(jù)與AI算法與應(yīng)用研究工作,在信息技術(shù)及醫(yī)學(xué)領(lǐng)域發(fā)表國(guó)際期刊和學(xué)術(shù)會(huì)議文400余篇。已經(jīng)出版,編輯書(shū)刊和專輯20余部,完成指導(dǎo)相關(guān)方向40多名博士生和博士后。

 

 

期刊簡(jiǎn)介

Data Science and Engineering(DSE)是由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦、數(shù)據(jù)庫(kù)專業(yè)委員會(huì)承辦、施普林格自然(Springer Nature)出版的Open Access期刊。為了迎合相關(guān)領(lǐng)域的快速發(fā)展需求,DSE致力于出版所有和數(shù)據(jù)科學(xué)與工程領(lǐng)域相關(guān)的關(guān)鍵科學(xué)問(wèn)題與前沿研究熱點(diǎn),以大數(shù)據(jù)作為研究重點(diǎn),征稿范疇主要包括4方面:(1)數(shù)據(jù)本身,(2)數(shù)據(jù)信息提取方法,(3)數(shù)據(jù)計(jì)算理論,和(4)用來(lái)分析與管理數(shù)據(jù)的技術(shù)和系統(tǒng)。

目前期刊已被EI、ESCI與SCOPUS收錄,CiteScore 2021為6.4,在Computer Science Applications領(lǐng)域排名# 157/747(位列前21%)。稿件處理費(fèi)由贊助商中新賽克(Sinovatio)承擔(dān),歡迎大家免費(fèi)下載閱讀期刊全文,并積極投稿。

 

 

論文原文鏈接:https://link.springer.com/article/10.1007/s41019-021-00170-4


SCHOLAT.com 學(xué)者網(wǎng)
免責(zé)聲明 | 關(guān)于我們 | 聯(lián)系我們
聯(lián)系我們: