1 人工智能(AI)的四个层次
- 感知(Perception)
- 定义:识别和理解输入数据(如看到物体、听懂语音)。
- 例子:图像分类(识别猫/狗)、语音转文字。
- 现状:深度学习在感知任务上已接近或超越人类水平(如 ImageNet 分类错误率 < 5%)。
- 推理(Reasoning)
- 定义:基于感知结果进行逻辑推断(如预测未来事件)。
- 例子:天气预报、医疗诊断。
- 挑战:需要结合常识和上下文,目前仍是研究难点。
- 知识形成(Knowledge Formation)
- 定义:从数据中提炼结构化知识(如构建知识图谱)。
- 例子:自动摘要、问答系统。
- 规划(Planning)
- 定义:制定长期策略(如自动驾驶路径规划)。
- 例子:机器人决策、游戏 AI(AlphaGo)。

AI 技术演进:符号学(早期 AI)→ 概率模型(统计学习)→ 机器学习 → 深度学习。
深度学习是机器学习的子集,但能处理更复杂的任务(如图像、语音、自然语言)。
核心优势:自动从数据中学习特征,无需人工设计规则(如传统计算机视觉需手动提取边缘、纹理等特征)。
2 突破性应用
2.1 计算机视觉
- 图像分类:ImageNet 竞赛中错误率从 26%(2012 年 AlexNet)降至 <5%(2017 年)。


- 物体检测和分割:定位图片中的物体位置(如 YOLO、Faster R-CNN)。

- 风格迁移:将图片转换为特定艺术风格(如梵高滤镜)。

- 人脸合成:生成逼真假人脸(如 GAN 生成的虚拟人物)。

2.2 自然语言处理(NLP)
- 文本生成:GPT-3 可生成文章、代码甚至诗歌。

- 文字生成图片

2.3 其他领域
- 无人驾驶:特斯拉通过 CNN 实时识别道路、车辆和行人。

- 广告推荐:预测用户点击率(CTR),优化广告排序(如淘宝、百度广告系统)。

3 广告点击率预测案例
- 流程三阶段
- 触发广告:根据用户搜索关键词匹配相关广告。
- 点击率预测:用深度学习模型预测用户点击概率(P)。
- 排序与展示:按
P × 竞价价格
排序,优先展示高价值广告。

- 技术实现
- 特征提取:广告主信息、产品描述、图片特征等。
- 模型训练:用历史点击数据(如 100GB 日志)训练模型。
- 迭代优化:数据量增大后需优化模型性能(如分布式训练)。

- 团队分工
- 领域专家:理解业务逻辑(如广告投放规则)。
- 数据科学家:清洗数据、训练模型。
- AI 专家:提升模型精度和效率(如模型压缩、多 GPU 训练)。

4 深度学习环境配置
参考教程:2025-03-12 Python&深度学习1——安装Anaconda与PyTorch库_安装pytorch库-CSDN博客。