它是一个基于Python的库,旨在通过遗传编程(Genetic Programming, GP)实现机器学习的功能。遗传编程是一种自动化的机器学习方法,通过模拟达尔文的自然选择理论来解决问题。它属于遗传算法的一种,通过选择、交叉(杂交)、变异等操作对程序(个体)进行迭代,以产生更好的解决方案。gplearn主要用于回归和符号回归任务,可以自动生成解决特定问题的数学模型或符号表达式。它的灵感来自于 scikit-learn,可以用于自动化发现数据中的关系,创建复杂的模型或因子。在金融领域,gplearn可以用于因子挖掘,帮助发现影响股票价格
更新时间:2024-02-29 07:09
featuretools有专门的 transfrom 类的特征处理方式,但是我在实际使用中没有使用,因为featuretool的思路是凡是能够进行特征变换的特征都要应用一遍,所以应用的模式基本上是生成大量的性能不强的特征,下一步必须进行严格的。
所以今天尝试用gplearn进行一下特征工程,本人能力有限,如有错误还请指正,也欢迎交流。
gplearn是Python内最成熟的符号回归算法实现,作为一种一种监督学习方法,符号回归(symbolic regression)试图发现某种隐藏的数学公式,以此利用特征变量预测目标变量。
符号回归的具体实现方式是遗
更新时间:2024-01-14 04:45
更新时间:2023-10-09 06:28