近期,中国科学院合肥物质科学研究院智能机械研究所离子束生物工程与绿色农业研究中心研究员吴跃进课题组围绕
近红外光谱分析技术,提出基于组合移动窗口和智能优化算法相结合的变量选择算法。相关研究结果在线发表在Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy上。
近年来,随着光谱技术的发展,光谱数据呈现数量高、维度高、复杂度高等特点。光谱数据中包含大量的噪声和干扰变量,且当样本数量远小于变量数量时,寻找最优变量子集将成为NP-hard问题,对光谱数据挖掘和光谱定量分析提出挑战。提取关键变量信息、减少数据维度,不仅可以提高光谱定量分析能力,而且可以选取特征光谱,降低仪器研发成本,提高经济效益。
该研究改进传统粒子群算法(PSO),提出变维度的粒子群算法(VDPSO),结合组合移动窗口策略,实现光谱数据变量的快速选择。该算法可在不同维度搜索数据空间,降低限入局部极值和过拟合的风险。通过与四种高性能变量选择算法BOSS、VCPA、iVISSA和IRF比较,发现该算法可选择出最优的光谱信息,提升模型的预测能力,有望进一步应用于基因组学、蛋白质组学、代谢组学和定量构效关系(QSAR)等学科数据分析中。
研究工作得到安徽省重点研究开发计划、中科院战略性先导科技专项和国家自然科学基金等的支持。