1. 传统机器学习模型
线性模型(Linear Models):
线性回归(Linear Regression):用于回归任务,拟合线性关系。
逻辑回归(Logistic Regression):用于分类任务,输出概率值。
岭回归(Ridge Regression)和Lasso回归(Lasso Regression):带正则化的线性回归。
树模型(Tree-based Models):
决策树(Decision Tree):通过树结构进行决策,可用于分类和回归。
随机森林(Random Forest):多个决策树的集成模型,通过投票或平均提高性能。
梯度提升树(Gradient Boosting Trees):
GBDT(Gradient Boosting Decision Tree)
XGBoost(Extreme Gradient Boosting)
LightGBM(Light Gradient Boosting Machine)
CatBoost(Categorical Boosting)
支持向量机(Support Vector Machines, SVM):通过寻找最大间隔超平面进行分类或回归。核方法(Kernel Methods)可用于处理非线性数据。
贝叶斯模型(Bayesian Models):
朴素贝叶斯(Naive Bayes):基于贝叶斯定理,适用于文本分类等任务。
高斯过程(Gaussian Process):用于回归和概率预测。
最近邻算法(k-Nearest Neighbors, KNN):基于距离度量,通过邻居的标签进行预测。
2. 深度学习模型(Deep Learning Models)
神经网络(Neural Networks):
多层感知机(Multilayer Perceptron, MLP):基础的前馈神经网络。
卷积神经网络(Convolutional Neural Networks, CNN):用于处理图像、视频等网格数据。
典型结构:卷积层、池化层、全连接层。
循环神经网络(Recurrent Neural Networks, RNN):用于处理序列数据(如时间序列、文本)。
变体:LSTM(Long Short-Term Memory)、GRU(Gated Recurrent Unit)。
变换器(Transformer):基于自注意力机制(Self-Attention),用于自然语言处理。
典型模型:BERT、GPT、T5。
生成对抗网络(Generative Adversarial Networks, GAN):由生成器(Generator)和判别器(Discriminator)组成,用于生成数据。
自编码器(Autoencoders):用于数据压缩、降维或生成。
图神经网络(Graph Neural Networks, GNN):用于处理图结构数据(如社交网络、分子结构)。
3. 概率图模型(Probabilistic Graphical Models)
贝叶斯网络(Bayesian Networks):用有向无环图表示变量之间的条件依赖关系。
马尔可夫模型(Markov Models):
隐马尔可夫模型(Hidden Markov Models, HMM):用于序列数据建模。
条件随机场(Conditional Random Fields, CRF):用于序列标注任务(如分词、命名实体识别)。
4. 集成学习模型(Ensemble Learning Models)
Bagging(Bootstrap Aggregating):通过并行训练多个模型并聚合结果(如随机森林)。
Boosting:通过顺序训练模型,逐步修正前一个模型的错误(如AdaBoost、GBDT、XGBoost)。
Stacking:结合多个模型的输出作为新特征,训练一个元模型。
5. 聚类与降维模型(Clustering and Dimensionality Reduction)
聚类模型(Clustering Models):
K均值聚类(K-Means Clustering):基于距离的聚类。
层次聚类(Hierarchical Clustering):构建树状聚类结构。
DBSCAN(Density-Based Spatial Clustering of Applications with Noise):基于密度的聚类。
高斯混合模型(Gaussian Mixture Models, GMM):基于概率分布的聚类。
降维模型(Dimensionality Reduction Models):
主成分分析(Principal Component Analysis, PCA):线性降维。
t-SNE(t-Distributed Stochastic Neighbor Embedding):非线性降维,用于可视化。
UMAP(Uniform Manifold Approximation and Projection):高效的非线性降维。
6. 强化学习模型(Reinforcement Learning Models)
基于值的方法(Value-based Methods):Q-Learning、Deep Q-Networks(DQN)。
基于策略的方法(Policy-based Methods):策略梯度(Policy Gradient)、REINFORCE算法。
Actor-Critic方法:结合值函数和策略梯度(如A3C、PPO)。
模型基于模型的方法(Model-based Methods):通过学习环境模型进行规划(如MBPO)。
7. 生成模型(Generative Models)
变分自编码器(Variational Autoencoders, VAE):用于生成数据,同时学习数据的潜在表示。
流模型(Flow-based Models):通过可逆变换生成数据(如Glow、RealNVP)。
扩散模型(Diffusion Models):通过逐步去噪生成数据(如DDPM、Stable Diffusion)。
8. 其他模型
规则基模型(Rule-based Models):基于预定义规则进行决策(如专家系统)。
稀疏编码(Sparse Coding):用于学习数据的稀疏表示。
迁移学习模型(Transfer Learning Models):通过预训练模型迁移知识到新任务(如Fine-tuning、Feature Extraction)。