【国民娱乐每日礼金gm777.top,国民彩票手机版app中大奖】我们为您提供国民彩票手机版app注册,国民彩票手机版app投注,国民彩票手机版appapp,国民彩票手机版app平台,巨华彩票开户,充提快速,操控简单,为国民彩票手机版app彩民服务!

答辯公告
我的位置在: 国民彩票手机版app > 答辯公告 > 正文
蔡潔答辯公告
瀏覽次數:日期:2019-09-20編輯:研究生教務辦1

答辯公告

論文題目

基于信息差異性分析的特征選擇算法研究

答辯人

蔡潔

指導教師

駱嘉偉 教授

答辯委員會主席

王志英 教授

學科專業

計算機科學與技術

學院

信息科學與工程學院

答辯地點

信息學院223

答辯時間

20199238:30

學位論文簡介:

隨著獲取信息數據技術的飛速發展国民彩票手机版app,信息數據以前所未有的速度增長和積累。這些數據往往呈現出樣本多国民彩票手机版app、維度高的特點,對機器學習和數據挖掘帶來了巨大的挑戰。高維的數據集中往往存在大量冗余的、無關的甚至是噪聲的信息,這些信息可能對機器學習算法的建模造成困擾。特征選擇技術通過剔除原始高維數據集中的噪聲、無關和冗余特征国民彩票手机版app,實現對數據集的預處理,良好的特征選擇結果可以高效地生成精度更高的機器學習模型。因此,針對高維數據特征選擇方法的研究具有重要的研究價值和應用意義。本文從信息差異性分析的角度出發国民彩票手机版app,在聚類特征選擇、啟發式特征選擇、深度特征選擇和集成特征選擇方面開展了一系列的研究工作。主要研究工作如下:

1)針對聚類特征選擇算法中特征差異表達不足的問題,本文運用信息距離作為差異性分析指標,提出了一種基于密度峰值聚類的特征選擇方法国民彩票手机版app,DPCID。

2)針對基于信息相關性的特征選擇方法過于傾向于選擇熵值較大的特征,可能導致分類器出現過擬合的問題,本文引入自冗余因子作為適當的懲罰,提出了一種基于信息距離度量的啟發式特征選擇方法,MFFID国民彩票手机版app。

3)針對深度學習模型在建模小樣本數據集時,往往存在訓練精度高而測試精度低的過擬合問題。本文提出一種基于交叉熵的高層降噪自動編碼特征的選擇方法,HDAECE。

4)大多數集成特征選擇方法由于沒有合適的度量特征子集差異性的方法,對特征子集采用隨機劃分的策略,從而導致集成方法的性能不穩定。本文設計了最小信息距離和SMID度量標準,并提出一種新的集成特征選擇框架,EFSMID国民彩票手机版app。

主要學術成果:

[1] Jie Cai, Jiawei Luo, Shulin Wang, Sheng Yang. Feature selection in machine learning. a new perspective. Neurocomputing, 2018, 300:70-79. (SCI

[2] Cai Jie, Liang Cheng, Luo Jiawei. Feature Selection Using Information Distance Measure for Gene Expression Data. Current Proteomics, 2018, 15(5):352-362. (SCI

[3] Cai Jie, Luo Jiawei, Liang Cheng, Yang Sheng. A novel information theory-based ensemble feature selection framework for high-dimensional microarray data. International Journal of Performability Engineering, 2017, 13(5):742-753. (EI)

[4] Cai Jie, Cao Shilong, Yang Sheng, Wang Shulin, Luo Jiawei. Feature Selection Based on Density Peak Clustering Using Information Distance Measure. Lecture Notes in Computer Science13th International Conference on Intelligent Computing, ICIC 2017, 125-131. (EI)

[5] Qiu Xiao, Jiawei Luo, Cheng Liang, Jie Cai, Pingjian Ding. A graph regularized non-negative matrix factorization method for identifying microRNA-disease associations. Bioinformatics, 2018, 34(2):239-248. (SCI

[6] Qiu Xiao, Jiawei Luo, Cheng Liang, Jie Cai, Guanghui Li, Buwen Cao. CeModule: an integrative framework for discovering regulatory patterns from genomic data in cancer. BMC Bioinformatics, 2019, 20(1):67. (SCI)

[7] Qiu Xiao, Jiawei Luo, Cheng Liang, Guanghui Li, Jie Cai, Pingjian Ding, Ying Liu. Identifying lncRNA and mRNA Co-expression Modules from Matched Expression Data in Ovarian Cancer. IEEE/ACM Transactions on Computational Biology and Bioinformatics. 2018, DOI: 10.1109/TCBB.2018.2864129.SCI



下一篇:
胡逸騉答辯公告
国民彩票手机版app