2025-04-17 李沐深度学习1 —— 深度学习介绍

发布于:2025-04-18 ⋅ 阅读:(32) ⋅ 点赞:(0)

1 人工智能(AI)的四个层次

  1. 感知(Perception)
    • 定义:识别和理解输入数据(如看到物体、听懂语音)。
    • 例子:图像分类(识别猫/狗)、语音转文字。
    • 现状:深度学习在感知任务上已接近或超越人类水平(如 ImageNet 分类错误率 < 5%)。
  2. 推理(Reasoning)
    • 定义:基于感知结果进行逻辑推断(如预测未来事件)。
    • 例子:天气预报、医疗诊断。
    • 挑战:需要结合常识和上下文,目前仍是研究难点。
  3. 知识形成(Knowledge Formation)
    • 定义:从数据中提炼结构化知识(如构建知识图谱)。
    • 例子:自动摘要、问答系统。
  4. 规划(Planning)
    • 定义:制定长期策略(如自动驾驶路径规划)。
    • 例子:机器人决策、游戏 AI(AlphaGo)。
image-20250417141351588

​ AI 技术演进:符号学(早期 AI)→ 概率模型(统计学习)→ 机器学习 → 深度学习。

​ 深度学习是机器学习的子集,但能处理更复杂的任务(如图像、语音、自然语言)。

​ 核心优势:自动从数据中学习特征,无需人工设计规则(如传统计算机视觉需手动提取边缘、纹理等特征)。


2 突破性应用

2.1 计算机视觉

  • 图像分类:ImageNet 竞赛中错误率从 26%(2012 年 AlexNet)降至 <5%(2017 年)。
image-20250417141651076 image-20250417141730089
  • 物体检测和分割:定位图片中的物体位置(如 YOLO、Faster R-CNN)。
image-20250417141932936
  • 风格迁移:将图片转换为特定艺术风格(如梵高滤镜)。
image-20250417141918464
  • 人脸合成:生成逼真假人脸(如 GAN 生成的虚拟人物)。
image-20250417142001810

2.2 自然语言处理(NLP)

  • 文本生成:GPT-3 可生成文章、代码甚至诗歌。
image-20250417142457430
  • 文字生成图片
image-20250417142032789

2.3 其他领域

  • 无人驾驶:特斯拉通过 CNN 实时识别道路、车辆和行人。
image-20250417142201294
  • 广告推荐:预测用户点击率(CTR),优化广告排序(如淘宝、百度广告系统)。
image-20250417142222815

3 广告点击率预测案例

  1. 流程三阶段
    • 触发广告:根据用户搜索关键词匹配相关广告。
    • 点击率预测:用深度学习模型预测用户点击概率(P)。
    • 排序与展示:按 P × 竞价价格 排序,优先展示高价值广告。
image-20250417142723211
  1. 技术实现
    • 特征提取:广告主信息、产品描述、图片特征等。
    • 模型训练:用历史点击数据(如 100GB 日志)训练模型。
    • 迭代优化:数据量增大后需优化模型性能(如分布式训练)。
image-20250417142738149
  1. 团队分工
    • 领域专家:理解业务逻辑(如广告投放规则)。
    • 数据科学家:清洗数据、训练模型。
    • AI 专家:提升模型精度和效率(如模型压缩、多 GPU 训练)。
image-20250417142804687

4 深度学习环境配置

​ 参考教程:2025-03-12 Python&深度学习1——安装Anaconda与PyTorch库_安装pytorch库-CSDN博客


网站公告

今日签到

点亮在社区的每一天
去签到