1. 机器学习

1.1 人工智能的发展历程

逻辑推理 => 知识工程 => 机器学习

  • 逻辑推理
    • 主要通过谓词逻辑演算模拟人类智能。
    • 主流核心技术是符号逻辑计算,在数学定理自动证明等领域获得了一定成功。
  • 知识工程
    • 专家系统使用基于专家知识库的知识推理取代纯粹的符号逻辑计算。
    • 在故障诊断、游戏博弈等领域取得了巨大成功。
  • 机器学习
    • 对于给定的任务性能度量标准,使用先验信息,通过某种计算方式改进初始模型,获得一个性能更好的模型

1.2 AI & ML

深度学习 ⊆ 表示学习 ⊆ 机器学习 ⊆ 人工智能

1.3 ML 定义

假设用E来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验P在T中任务上获得了性能改善,则我们就说关于T和E,该程序对P进行了学习。

机器学习:数据 -> 机器学习 -> 提高某种性能指标
=> 简单点说,就是对数据通过机器学习来提高某种性能指标。

1.4 三类任务

  • 回归:通过若干带有标注的样本数据构造出一个预测模型分f(x),使得f(x)的预测输出尽可能符合真实值。
  • 分类:通过训练样本构建合适的分类器f(x),完成对目标的分类。
  • 聚类:对样本数据实现物以类聚的效果,聚类的类别由不同样本之间的某种相似性确定。

1.5 三种常见类型

  • 监督学习:利用一组带标注样本调整模型参数,提升模型性能的学习方式。
  • 无监督学习:通过比较样本之间的某种联系实现对样本的数据分析。
  • 强化学习:根据反馈信息来调整及其行为来实现自动决策的一种机器学习方式。

比如上述所说的回归和分类任务就属于监督学习,因为他们都是有标签信息;聚类是无标签信息,属于无监督学习。

1.6 机器学习三要素

  1. 模型
  • 感知机、朴素贝叶斯模型、支持向量机、决策树、随机森林……
  • 线性回归、逻辑回归……
  • 神经网络……
  1. 学习准则
  • 经验风险最小化
  • 损失函数
  1. 优化算法
  • 梯度下降法
  • 反向传播算法
  • 动态规划算法
  • ……

1.7 其他重要概念

  • 泛化误差
  • 模型偏好
  • 误差与损失函数
  • 过/欠拟合
  • 数据问题
  • 评测问题
  • 模型问题
  • 算法问题

2. 研究生阶段学习建议

2.1 论文

① 如何读论文?

通过论文,如何得到思路,然后如何通过实验实现这个思路,最后就是实验结果如何。

② 怎么写论文?

通过读论文,获得了哪些启发,进而形成自己的思路,再通过实验来实现思路并对实验结果进行观测、分析。如果结果不符合预期,还需要对思路进行验证、纠正,再重新进行实验并观测、分析结果,知道符合预期结果,然后就可以着手写论文了。

2.2 多读多写

多读论文、多写代码

论文获取来源:

  1. 被动式
  • 大小组会、论坛、汇报
  • 各类科研群、同学老师的分享
  • 微信公众号、知乎等的推送
  1. 知乎专栏搜索
  2. Valse Webinar
    (1) 幻灯片
    (2) 往期简介
  3. 公众号:CVer, arXiv每日学术速递,专知,52CV,VALSE…
  1. 主动式
  • 网站

    • arXiv
    • Papers with Code
    • 会议期刊官网
    • GoogleSchooler
  • 论文章节

    • 相关工作
    • 参考文献
  1. arXiv
  2. 极市平台的Github
  3. 三大视觉顶会(ECCV Iccv CVPR)
  4. 机器学习:ICML,ICLR,NeurlPS…
    ICML
    ICLR
    NeurlPS

2.3 阅读论文方法

① 论文结构

② 阅读方法

  • 批判式阅读
  • 抱着学习的态度阅读
  • 带着问题阅读,阅读中要有思考
  • 不拘泥于自己研究方向的论文。

2.4 科研工具推荐