Skip to content
字数
1677 字
阅读时间
7 分钟

作为测试工程师面试准备的一部分,理解 AI/机器学习的基本理论概念和常见模型类型,可以帮助你更好地应对岗位中“AI测试工具应用”和“对AI有浓厚兴趣”的要求。下面我会用简洁、专业的方式为你梳理。


一、AI/机器学习的基本理论概念

1. 人工智能、机器学习、深度学习的关系

  • 人工智能(AI):让机器模拟人类智能的广义领域。
  • 机器学习(ML):AI 的一个子集,让机器从数据中学习规律,而不需要显式编程规则。
  • 深度学习(DL):ML 的子集,使用多层神经网络自动提取特征。

2. 机器学习的核心三要素

  • 数据:特征(X)和标签(y,监督学习时)或纯特征(无监督)。
  • 模型:从输入到输出的数学映射(如线性回归、神经网络)。
  • 学习算法:通过优化方法(如梯度下降)调整模型参数,使预测误差最小化。

3. 学习范式分类

范式定义例子
监督学习数据有标签,学习 X→y 的映射分类(垃圾邮件识别)、回归(房价预测)
无监督学习数据无标签,发现内在结构聚类(用户分群)、降维(PCA)
半监督学习少量有标签 + 大量无标签医疗影像分类(标注成本高)
强化学习智能体通过与环境交互、试错获取奖励最大化AlphaGo、游戏AI

4. 几个关键术语(面试中常被问)

  • 过拟合:模型在训练集上表现很好,但在新数据上很差 → 原因:模型太复杂或数据太少。缓解方法:正则化、早停、增加数据量、Dropout。
  • 欠拟合:模型连训练集都没学好 → 原因:模型太简单。缓解:增加模型复杂度、特征工程。
  • 训练集 / 验证集 / 测试集:训练集用于学习参数,验证集用于调超参数,测试集用于最终评估泛化能力。
  • 偏差与方差权衡:偏差(预测值与真实值的偏离程度)高 → 欠拟合;方差(对不同训练数据的敏感度)高 → 过拟合。

二、常见的AI模型类型及代表模型

1. 传统机器学习模型(仍广泛使用)

类型代表模型核心特点适用场景
线性模型线性回归、逻辑回归、Lasso/Ridge简单、可解释性强、训练快基线模型、金融信用评分
决策树与集成决策树、随机森林、GBDT、XGBoost、LightGBM非线性、处理混合特征、效果好表格数据、风控、推荐排序
支持向量机(SVM)线性SVM、核SVM(RBF)小样本高维有效、核技巧文本分类、图像识别(早期)
朴素贝叶斯高斯朴素贝叶斯、多项式朴素贝叶斯基于贝叶斯定理、假设特征独立垃圾邮件过滤、情感分析
聚类模型K-Means、DBSCAN、层次聚类无监督、发现群体结构客户分群、异常检测
降维模型PCA、t-SNE、UMAP减少特征维度、可视化数据预处理、可视化

2. 深度学习模型(AI测试岗较常接触)

类型代表模型核心特点典型应用
全连接神经网络(DNN/MLP)多层感知机基础结构,可逼近任意函数简单分类/回归
卷积神经网络(CNN)LeNet、AlexNet、VGG、ResNet、EfficientNet自动提取空间特征,参数共享图像分类、目标检测、OCR
循环神经网络(RNN)及其变体LSTM、GRU处理序列数据,有记忆能力文本生成、时间序列预测
TransformerBERT、GPT(GPT-3/4)、T5、ViT自注意力机制,并行计算自然语言处理、大模型基石
生成对抗网络(GAN)DCGAN、StyleGAN、CycleGAN生成器+判别器对抗训练图像生成、风格迁移
图神经网络(GNN)GCN、GraphSAGE、GAT处理图结构数据社交网络分析、分子预测

3. 大语言模型(LLMs)——当前AI测试关注热点

  • 代表模型:GPT 系列(GPT-4,ChatGPT)、Claude、LLaMA、文心一言、通义千问。
  • 能力:文本生成、代码生成、阅读理解、对话、推理。
  • 测试相关:Prompt 测试、模型输出评估(准确性、安全性、偏见)、RAG 效果评测。

三、作为测试工程师,你需要额外理解的AI测试概念

  1. 模型评估指标

    • 分类:准确率、精确率、召回率、F1、ROC-AUC
    • 回归:MAE、MSE、RMSE、R²
    • 生成模型:困惑度(Perplexity)、BLEU、ROUGE
  2. AI测试的特殊性

    • 测试数据不固定(分布漂移)
    • 模型行为非确定性(同一输入可能不同输出)
    • 需要测试公平性、鲁棒性、对抗样本攻击
  3. 提示词测试(Prompt Testing)

    • 验证大模型在给定提示下的输出质量
    • 设计对抗性提示(越狱、注入)测试安全性

面试中如何结合你的经历回答

当被问到“你对AI/机器学习的了解”时,你可以说:

“我系统学习了机器学习的基本概念,包括监督/无监督学习、过拟合与欠拟合、评估指标等。在模型类型方面,我了解传统模型如线性回归、随机森林、XGBoost,以及深度学习中的CNN、RNN和Transformer。我在全国人工智能创新应用大赛中实践过数据预处理和模型效果评估,深刻理解数据质量对模型输出的影响。对于测试岗位,我会将AI知识应用于自动化用例生成、模型评估指标自动化校验以及提示词测试。”

这样既展示了理论,又联系了实际经历,符合岗位要求。

贡献者

The avatar of contributor named as freeway348 freeway348

文件历史

撰写