1. 机器学习
1.1 人工智能的发展历程
逻辑推理 => 知识工程 => 机器学习
- 逻辑推理
- 主要通过谓词逻辑演算模拟人类智能。
- 主流核心技术是符号逻辑计算,在数学定理自动证明等领域获得了一定成功。
- 知识工程
- 专家系统使用基于专家知识库的知识推理取代纯粹的符号逻辑计算。
- 在故障诊断、游戏博弈等领域取得了巨大成功。
- 机器学习
- 对于给定的任务和性能度量标准,使用先验信息,通过某种计算方式改进初始模型,获得一个性能更好的模型。
1.2 AI & ML
深度学习 ⊆ 表示学习 ⊆ 机器学习 ⊆ 人工智能
1.3 ML 定义
假设用E来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验P在T中任务上获得了性能改善,则我们就说关于T和E,该程序对P进行了学习。
机器学习:数据 -> 机器学习 -> 提高某种性能指标
=> 简单点说,就是对数据通过机器学习来提高某种性能指标。
1.4 三类任务
- 回归:通过若干带有标注的样本数据构造出一个预测模型分f(x),使得f(x)的预测输出尽可能符合真实值。
- 分类:通过训练样本构建合适的分类器f(x),完成对目标的分类。
- 聚类:对样本数据实现物以类聚的效果,聚类的类别由不同样本之间的某种相似性确定。
1.5 三种常见类型
- 监督学习:利用一组带标注样本调整模型参数,提升模型性能的学习方式。
- 无监督学习:通过比较样本之间的某种联系实现对样本的数据分析。
- 强化学习:根据反馈信息来调整及其行为来实现自动决策的一种机器学习方式。
比如上述所说的回归和分类任务就属于监督学习,因为他们都是有标签信息;聚类是无标签信息,属于无监督学习。
1.6 机器学习三要素
- 模型
- 感知机、朴素贝叶斯模型、支持向量机、决策树、随机森林……
- 线性回归、逻辑回归……
- 神经网络……
- 学习准则
- 经验风险最小化
- 损失函数
- 优化算法
- 梯度下降法
- 反向传播算法
- 动态规划算法
- ……
1.7 其他重要概念
- 泛化误差
- 模型偏好
- 误差与损失函数
- 过/欠拟合
- 数据问题
- 评测问题
- 模型问题
- 算法问题
2. 研究生阶段学习建议
2.1 论文
① 如何读论文?
通过论文,如何得到思路,然后如何通过实验实现这个思路,最后就是实验结果如何。
② 怎么写论文?
通过读论文,获得了哪些启发,进而形成自己的思路,再通过实验来实现思路并对实验结果进行观测、分析。如果结果不符合预期,还需要对思路进行验证、纠正,再重新进行实验并观测、分析结果,知道符合预期结果,然后就可以着手写论文了。
2.2 多读多写
多读论文、多写代码
论文获取来源:
- 被动式
- 大小组会、论坛、汇报
- 各类科研群、同学老师的分享
- 微信公众号、知乎等的推送
- 主动式
-
网站
- arXiv
- Papers with Code
- 会议期刊官网
- GoogleSchooler
-
论文章节
- 相关工作
- 参考文献
- arXiv
- 极市平台的Github
- 三大视觉顶会(ECCV Iccv CVPR)
- 机器学习:ICML,ICLR,NeurlPS…
ICML
ICLR
NeurlPS
2.3 阅读论文方法
① 论文结构
② 阅读方法
- 批判式阅读
- 抱着学习的态度阅读
- 带着问题阅读,阅读中要有思考
- 不拘泥于自己研究方向的论文。
2.4 科研工具推荐
-
论文管理工具
-
翻译工具