菲比安娜克莱门特 在 对数据的科学 ·1天前 如何对时间序列进行EDA 熊猫分析时间序列探索性分析——数据科学开发周期的早期步骤之一是理解和探索您正在解决的问题的数据。EDA对于更好的数据科学工作流程是至关重要的一步,而Pandas分析一直是我的首选,因为它可以快速完成,并且有一个…… 机器学习 8分钟阅读
Anil Ozturk ·7小时前 回归问题的分层 这就跟你问声好!在这篇文章中,我将尝试做一个例子,关于如何在保留分配比例的情况下生成回归问题的分割。让我们从最基本的开始。你也可以在我的Kaggle笔记本上查看工作示例:什么是分层抽样?分层抽样是从… 机器学习 4分钟阅读
祖拜尔。 在 对数据的科学 ·2天前 客户只能 数据科学统计的终极指南 数据科学的统计一目了然:标准指南-动机统计是一个强大的数学领域。我说“强大”是因为它帮助我们从样本数据推断总体结果。由于它可以推断人口的结果,它也可以用于大的图景(如总体影响,未来预测等)。统计不仅仅是一些… 机器学习 14分钟阅读
Kartikeya舒克拉 ·19小时前 在PySpark中构建自定义变压器和管道 PySpark Cookbook Part-1对定制模型的需求是数据科学行业仍然蓬勃发展的唯一原因!否则我们现在已经被AutoML工具取代了。因此在这篇文章中,我们将深入研究PySpark变压器。火花中的变压器是什么?Transformer是一个抽象算法(例如… 机器学习 3分钟阅读
伊娃Giannatou ·1天前 关于卷积神经网络(CNNs)你需要知道的一切 卷积神经网络(CNNs)在图像处理、图像识别、图像复原和图像生成等图像相关任务中已经成为一种流行的工具。cnn具有从大量训练图像中识别图像模式的能力,因此具有较高的性能。它们可以用来识别模式…… 机器学习 13分钟阅读
苏潘沙 ·4小时前 像Pro一样管理多个python版本 Python有几个版本,根据不同的版本有不同的包。我们大多数程序员都不是只有一个项目要做……为不同的目录拥有多个python版本的能力将使您的工作更加轻松。让我向你展示如何管理多个python… 机器学习 2分钟阅读
莫耶兹·阿里 ·1天前 客户只能 机器学习数据科学家在2022年必须知道的顶级特征存储 特征库是一种管理数据的系统,它为数据科学家和工程师提供了一个中心位置来查找和使用数据进行机器学习。特征库使数据/(特征)能够跨不同的机器学习管道共享,这可以加快新模型的开发…… 机器学习 5分钟读
Egor豪厄尔 在 对数据的科学 ·1天前 客户只能 时间序列的Box-Cox变换 如何使用Box-Cox变换创建平稳时间序列。在进行任何时间序列分析或预测时,使时间序列平稳是必不可少的部分。平稳性确保了我们的数据不会随着时间的推移在统计上发生变化,因此它可以更准确地类似于概率分布,从而更容易建模。平稳性的一个要求是时间… 机器学习 4分钟阅读
卡兰库马尔 在 MLearning.ai ·4小时前 客户只能 Udacity数据科学、网络安全和前端Web开发者奖学金 贝塔斯曼和Udacity为世界各地掌握数据科学、网络安全或前端网络技能的个人提供奖学金。-又有了奖学金,如果你喜欢免费的东西,还没有订阅我,你在做什么,亲爱的?让我告诉你,你错过了很多惊人的免费资源。贝塔斯曼和Udacity正在合作为学习者提供奖学金。学习有价值的技能,打开新的… 机器学习 3分钟阅读
Stefan Pircalabu 在 MLearning.ai ·12小时前 客户只能 YouTube上深度学习和数据科学的前5个频道 每个人都有自己学习新事物的方式,这种方式深深扎根于他们的潜意识中。这些学习方式可分为4类:视觉、听觉、阅读/写作和动觉(做)。有些人喜欢通过阅读书籍、论文和文章来学习,而有些人则更喜欢通过视频讲解来学习。 机器学习 6分钟阅读