“Scikit-learn”的版本间差异
跳到导航
跳到搜索
(→随机森林) |
(→随机森林) |
||
第18行: | 第18行: | ||
*min_samples_leaf:每棵树末端的叶节点所需的最少观察数。 |
*min_samples_leaf:每棵树末端的叶节点所需的最少观察数。 |
||
*bootstrap:是否使用 bootstrapping 来为随机林中的每棵树提供数据。(bootstrapping 是从数据集中进行替换的随机抽样。) |
*bootstrap:是否使用 bootstrapping 来为随机林中的每棵树提供数据。(bootstrapping 是从数据集中进行替换的随机抽样。) |
||
*n_jobs: 可以决定要使用多少处理器内核来运行模型。设置「n_jobs = -1」将使模型运行最快,因为它使用了所有计算机核心。 |
2022年1月16日 (日) 12:56的版本
- python中的机器学习软件库:[1]
- Installed package of scikit-learn can be accelerated using scikit-learn-intelex. More details are available here: https://intel.github.io/scikit-learn-intelex. For example:
$ conda install scikit-learn-intelex $ python -m sklearnex my_application.py
包
- MLPRegressor回归,参考 http://www.weixueyuan.net/a/914.html
随机森林
- max_features = 'sqrt' 这意味着如果有16个特征,则在每个树中的每个节点处,只考虑4个随机特征来拆分节点。
- max_depth:每棵树可以拥有的最大「分裂」数。
- min_samples_split:在树的节点分裂前所需的最少观察数。
- min_samples_leaf:每棵树末端的叶节点所需的最少观察数。
- bootstrap:是否使用 bootstrapping 来为随机林中的每棵树提供数据。(bootstrapping 是从数据集中进行替换的随机抽样。)
- n_jobs: 可以决定要使用多少处理器内核来运行模型。设置「n_jobs = -1」将使模型运行最快,因为它使用了所有计算机核心。