第2步 - 学习各种机器学习概念
现在你已经完成了先决条件,你可以继续实际学习机器学习(乐趣开始了!!!)最好从基础知识开始,然后再进入更复杂的东西。机器学习中的一些基本概念是:
(a) 机器学习的术语
•模型--一个模型是通过应用一些机器学习算法从数据中学习到的具体的表现。一个模型也被称为一个假设。
•特征 - 一个特征是数据的一个单独的可测量的属性。一组数字特征可以方便地用一个特征向量来描述。特征向量作为模型的输入。例如,为了预测一种水果,可能有颜色、气味、味道等特征。
•目标(标签)--目标变量或标签是我们的模型所要预测的值。对于在特征部分讨论的水果例子,每一组输入的标签都是水果的名称,如苹果、橘子、香蕉等。
•训练--我们的想法是给一组输入(特征)和它的预期输出(标签),所以在训练之后,我们将有一个模型(假设),然后将新的数据映射到训练的类别之一。
•预测--一旦我们的模型准备好了,就可以给它输入一组输入,它将提供一个预测的输出(标签)。
(b) 机器学习的类型
•监督学习--这涉及到使用分类和回归模型从具有标记数据的训练数据集中学习。这个学习过程一直持续到达到所需的表现水准。
• 无监督学习--这涉及到使用未标记的数据,然后找到数据中的基本结构,以便使用因子和聚类分析模型来学习更多关于数据本身的内容。
• 半监督学习--这涉及到像无监督学习一样使用未标记的数据,并使用少量的标记数据。使用标记的数据可以大大增加学习的准确性,也比监督学习更具成本效益。
• 强化学习 - 这涉及到通过试验和错误学习最佳行动。因此,下一个行动是通过学习基于当前状态的行为来决定的,而这些行为将在未来获得最大的回报。
(c)如何实践机器学习?
• 机器学习最耗时的部分实际上是数据收集、整合、清洗和预处理。所以一定要在这方面进行练习,因为你需要高质量的数据,但大量的数据往往是脏的。所以这是你的大部分时间都会用到的地方!
• 学习各种模型并在真实的数据集上进行练习。这将有助于你在不同的情况下建立你的直觉,哪些类型的模型是合适的。
• 伴随着这些步骤,同样重要的是了解如何解释使用不同模型获得的结果。如果你了解适用于不同模型的各种调整参数和规则化方法,这就更容易做到了。
(d) 学习机器学习的资源:
有各种在线和离线资源(包括免费和付费!)可用于学习机器学习。这里提供了其中的一些。
• 对于机器学习的广泛介绍,斯坦福大学Andrew Ng的机器学习课程相当受欢迎。它专注于机器学习、数据挖掘和统计模式识别,其讲解视频对于理清ML背后的理论和核心概念非常有帮助。
• 如果你想要一个机器学习的自学指南,那么Geeksforgeeks机器学习基础和高级-按照自己进度学习的课程将是你的理想选择。该课程将向你传授机器学习的各种概念,以及在课堂环境中实施这些概念的实践经验。
第3步 - 参加比赛
在你了解了机器学习的基础知识之后,你就可以进入疯狂的部分了!!!。竞赛! 通过将你的大部分理论知识与实际操作相结合,这些基本上会使你更加精通机器学习。这里给出了一些你可以从Kaggle上开始的基本比赛,这些比赛将帮助你建立信心:
• 泰坦尼克号。灾难中的机器学习。泰坦尼克号。从灾难中学习机器的挑战是一个非常受欢迎的机器学习初学者项目,因为它有多个教程可供选择。所以它是一个很好的机器学习概念介绍,如数据探索、特征工程学和模型调整。
• 数字识别器。数字识别器是一个在你有一些Python和机器学习基础知识之后的项目。这是对这个令人兴奋的世界的一个很好的介绍,其中的神经网络是使用一个包括预提取特征的经典数据集。
在你完成了这些比赛和其他此类简单的挑战之后,恭喜你,你已经在成为一名成熟的机器学习工程师的路上了,你可以通过从事越来越多的挑战来继续提高你的技能,并最终创造出更多更有创造性和难度的机器学习项目。