控制台输出如下内容:
avg 列 这个列表中:
第1个值: 平均适应度值(目标函数值),通常越高越好。
例如: 代表第0代个体的目标函数值的平均值。
注意这里是负值,通常是因为使用了最小化问题的目标函数,例如误差(MSE、负对数似然等)。
第2个值: 平均特征数量,代表每个个体选择了多少个特征。
例如: 代表第0代平均每个个体选择了约15.5个特征。
第3个值: 平均模型性能,例如模型的AUC、F1得分或准确率等。
例如: 表示每个个体(特征组合)在模型中的平均性能。
std 列 这个列表中:
第1个值: 适应度值的标准差,表示目标函数值的离散程度。
例如: 表示目标函数值的波动范围。
第2个值: 特征数量的标准差,表示个体选择特征数量的离散程度。
例如: 表示特征数量的波动范围较大。
第3个值: 模型性能的标准差,表示个体在性能上的波动范围。
例如: 表示不同特征组合的模型性能波动幅度。
min 列 这个列表中:
第1个值: 当前世代中目标函数值的最小值(最差适应度值)。
例如: 代表第0代中最差个体的适应度值。
第2个值: 当前世代中最小的特征数量。
例如: 表示第0代中有个体只选择了1个特征。
第3个值: 当前世代中模型性能的最小值。
例如: 表示最差个体的模型性能。
max 列 这个列表中:第1个值: 当前世代中目标函数值的最大值(最优适应度值)。
例如: 表示第0代中最优个体的适应度值。
第2个值: 当前世代中特征数量的最大值。
例如: 表示第0代中有个体选择了最多30个特征。
第3个值: 当前世代中模型性能的最大值。
例如: 表示最优个体的模型性能。根据运行结果,调整种群规模,迭代世代数,交叉率,变异率,修改适应度函数等来得出最优特征变量下的最优模型。调整思路如下:
作用:控制每次迭代中候选解的数量,较大的种群可以更全面地搜索特征空间。
增大种群大小:如果特征空间较大(如上百个特征),可以尝试增大种群大小(如从 50 调整为 100 或 200)。这能增加多样性,避免过早陷入局部最优解。种群越大,计算开销越高,需根据硬件性能和时间限制进行调整。
作用:控制算法运行的迭代轮数,更多的迭代可以帮助遗传算法更充分地优化。
增加迭代次数:如果观察到精度在较早的代数就停止提升,可以将迭代次数从 30 提升到 50 或 100;监控每一代的性能提升,若多次迭代精度没有显著变化,可提前停止。
作用:控制种群中两个候选解之间交换基因(特征组合)的概率。
适当增大:如果解的多样性不足(即种群在初期很快趋于一致),可以提高交叉概率(如从 0.8 提高到 0.9);适当减小:如果种群中解的质量较低,可以稍微降低交叉概率(如降到 0.6),避免过多的随机扰动。
作用:控制种群中候选解随机改变基因(特征选择)的概率,防止陷入局部最优解。
增大变异概率:若观察到算法在较早的代数陷入局部最优(即性能指标不再提升),可以增大变异概率(如从 0.4 调整到 0.6 或 0.7);减少变异概率:若解的质量波动过大,可以适当减小(如降低到 0.2 或以下)。
作用:控制评估模型性能时划分数据的方式。
增大折数:如果数据量足够,可以增大交叉验证折数(如从 5 调整到 10),从而得到更稳定的模型评估结果;减小折数:在数据量较少时,减少折数(如调整到 3),避免过拟合或数据不足。
作用:限制最终选择的特征数量。
本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕,E-mail:xinmeigg88@163.com
本文链接:http://zjk.tttmy.cn/news/4005.html
上一篇
长治百度爱采购代运营
下一篇
企业网站建设是什么