帖子的图像
帖子的图像
Benjamin O. Tayo的图像

数据科学

数据科学能力的时间表

数据科学能力的时间表取决于级别:基本,中级和高级

I.介绍

本文将讨论数据科学能力的典型时间表。获得数据科学能力所需的时间取决于能力水平。在第二节,我们将讨论三级数据科学。在第三节,我们讨论基于兴趣水平获得数据科学能力所需的时间。简短的摘要完成了文章。

这里提供的观点是我的观点,基于我自己的数据科学之旅。

II。3级数据科学

1.基本级别

1.1数据基础知识

  • 了解如何导入和导出存储在CSV文件格式中的数据
  • 能够清洁,争吵和组织更多分析或模型建筑物的数据
  • 能够在数据集中处理缺失的值
  • 理解并能够应用数据载体技术,例如均值或中位数
  • 能够处理分类数据
  • 知道如何将数据集分区为培训和测试集
  • 能够使用缩放技术(如归一化和标准化)缩放数据
  • 能够通过维数减少技术(如主成分分析)(PC)等维度压缩数据

1.2。数据可视化

  • 数据组件:决定如何可视化数据的一个重要阶段是知道它是什么类型的数据,例如,分类数据,离散数据,连续数据,时间序列数据等。
  • 几何分量:以下是您决定哪种可视化适用于您的数据,例如散射图,线图,条形图,直方图,Q-Q图,光滑密度,Boxplots,对图,热带等。
  • 映射组件:在这里,您需要决定用作您的可变变量x变量和你用的是什么y变量。这是重要的,特别是当您的数据集与多个功能多维时。
  • 缩放组件:在这里,您决定使用什么样的尺度,例如线性刻度,日志比例等。
  • 标签组件:这包括轴标签,标题,传奇,字体大小等的东西。
  • 道德组成:在这里,您想确保您的可视化讲述真实的故事。在清理,总结,操纵和生成数据可视化时,您需要了解您的行为,并确保您不使用您的可视化误导或操纵您的受众。

1.3监督学习(预测连续目标变量)

  • 能够使用numpy或pylab执行简单的回归分析
  • 能够使用Scikit-Learn进行多元回归分析
  • 了解正规化的回归方法,如套索,脊和弹性网
  • 了解其他非参数回归方法,例如kneighbors回归(KNR),并支持向量回归(SVR)
  • 了解评估回归模型的各种度量标准,例如MSE(均方误差),MAE(平均绝对误差)和R2分数
  • 能够比较不同的回归模型

2.中级

2.1监督学习(预测离散目标变量)

  • Perceptron分类器
  • Logistic回归分类器
  • 支持向量机(SVM)
  • 能够使用内核SVM解决非线性分类问题
  • 决策树分类器
  • K-最近的分类器
  • 天真的贝叶斯分类器
  • 了解访问分类算法质量的几个度量,例如精度,精度,灵敏度,特异性,召回,F-L分数,混淆矩阵,ROC曲线。
  • 能够使用Scikit-rearing for Model Building

2.2模型评估和封锁调谐

  • 能够使用k折叠交叉验证来评估模型性能
  • 知道如何使用学习和验证曲线调试分类算法
  • 能够通过学习曲线诊断偏见和方差问题
  • 能够通过验证曲线解决过度装备和磨损
  • 知道如何通过网格搜索进行微调机器学习模型
  • 了解如何通过网格搜索调整超级参数
  • 能够读取和解释混乱的矩阵
  • 能够绘制并解释接收器操作特征(ROC)曲线

2.3结合不同型号进行集合学习

  • 能够将不同的算法组合进行分类
  • 知道如何评估和调整合奏分类器

3.高级水平

  • 聚类算法(无监督学习)
  • k均值
  • 深度学习
  • 神经网络
  • 凯拉斯
  • 纹orflow.
  • Theano.
  • 云系统(AWS,Azure)

III。数据科学能力的时间表

帖子的图像
帖子的图像
数据科学能力的近似时间表。Benjamin O. Tayo的图像

我们在此评论这些是近似值。获得一定程度的能力所需的时间依赖于您的背景以及您愿意投资于您的数据科学研究的时间。通常,与物理学,数学,科学,工程,会计或计算机科学等分析学科中有背景的个体将需要与与数据科学不互补的人的个人相比的时间更少。

IV。概要

其他数据科学/机器学习资源

数据科学课程

进入数据科学的5度最佳程度

数据科学的理论基础 - 我应该关心或简单地专注于动手技能吗?

机器学习项目规划

如何组织您的数据科学项目

大型数据科学项目的生产力工具

数据科学产品组合比简历更有价值

有关问题和查询,请给我发电子邮件:benjaminobi@gmail.com.

对AI.

最好的技术,科学和工程。

注册AI时事通讯

通过朝向ai.

对AI发表最好的技术,科学和工程。订阅才能在收件箱中接收我们的更新。感兴趣和我们一起工作吗?请联系我们→https://towardsai.net/contact看一看

通过注册,您将创建一个betway娱乐官网 帐户如果您尚未拥有一个。回顾我们隐私政策 有关我们隐私惯例的更多信息。

检查你的收件箱
betway娱乐官网 给你发了一封电子邮件完成订阅。

写道

物理学家,数据科学教育者,作家。兴趣:数据科学,机器学习,AI,Python&R,预测分析,材料科学,生物物理学

对AI.

对AI.

对AI来说是一个世界领先的多学科科学出版物。对AI发表最好的技术,科学和工程。由世界各地的思想领袖和决策者阅读。

写道

物理学家,数据科学教育者,作家。兴趣:数据科学,机器学习,AI,Python&R,预测分析,材料科学,生物物理学

对AI.

对AI.

对AI来说是一个世界领先的多学科科学出版物。对AI发表最好的技术,科学和工程。由世界各地的思想领袖和决策者阅读。

betway娱乐官网媒体是一个开放的平台,17亿读者来寻找有洞察力和动态的思维。在这里,专家和未被发现的声音相似地潜入任何主题的核心,并将新的想法带到表面上。学到更多

遵循对您有关的作家,出版物和主题,您将在您的主页和收件箱中看到它们。betway娱乐官网探索

如果您有一个故事来讲述,知识分享,或者提供提供的视角 - 欢迎回家。betway娱乐官网很容易和免费发布您对任何主题的思考。写下媒介betway娱乐官网

获取媒体应用程序betway娱乐官网