2025年sigmoid函数计算公式（sigmf函数）

编程日记 • 2025-02-11 20:30 • 阅读 45

分类算法在机器学习实验中非常重要，它们通过从数据中学习分类规则来将输入数据归入不同类别。合适的分类算法能提高模型的预测准确性和泛化能力，从而在测试数据上表现良好。选择合适的算法对任务成功至关重要，因为不同算法在特定数据分布和任务上可能表现不同。

逻辑回归 (常用于二分类问题。它是基于线性回归的，但通过使用逻辑函数（sigmoid函数），将回归的输出映射到概率空间，从而解决分类问题)

决策树 (决策树的构建过程是一个递归的划分过程。在每一步，算法会选择一个特征及其对应的分裂点，使得数据集被最有效地划分。最常见的分裂标准是信息增益（Information Gain）或基尼指数（Gini Index）

随机森林 (对数据进行有放回的随机抽样，训练多棵决策树。每棵树在训练时只使用了部分数据和部分特征，最后将所有树的预测结果进行投票（分类）或平均（回归）

支持向量机（监督学习模型，主要用于分类任务。它通过构建超平面来最大化数据集中不同类别之间的间隔，从而实现分类）（找到一个超平面，使得它能将不同类别的数据点尽可能分开，并最大化超平面与最近的支持向量之间的距离）

K近邻（简单的非参数分类算法，较新样本与训练集中最相似的 k 个样本，进行投票或平均来预测新样本的类别或值，主要依赖于距离度量）

朴素贝叶斯（基于贝叶斯定理的分类算法，假设特征之间是条件独立的，简化了联合概率的计算）

梯度提升（通过逐步拟合残差，将多个弱学习器（例如小决策树）加起来，形成一个强学习器。每次添加的新学习器都试图修正之前学习器的误差）

XGBoost （是梯度提升的一种优化实现，具有更高的效率和精度。它通过引入正则化项和基于二阶导数的信息加快收敛速度，并处理缺失值和不均衡数据）

神经网络（每一层由一组神经元组成，神经元之间通过权重相连。输入层接收原始数据，经过若干隐藏层的非线性变换，输出层生成最终的预测结果。常用的激活函数有 Sigmoid、ReLU 等）

LightGBM （是一种高效的梯度提升框架，专为大规模数据集优化。它通过直方算法和基于叶子生长的策略提高了训练速度和模型性能，LightGBM 采用了基于叶子生长的策略，即每次选择误差最大的叶节点进行分裂。这与传统的基于层的分裂策略不同，能够更好地拟合复杂数据）