TDS编辑器 在 迈向数据科学 ·9小时前 机器学习中的基本读数 如果您来年的目标之一是扩大您对机器学习的了解,那么您就在正确的位置。无论您对算法,高参数调整或MLOPS的经验如何,您都可以找到多个进入该主题的入口,而我们的作者(其中许多人都是经验丰富的ML… 数据科学 3分钟阅读 数据科学 3分钟阅读
路易·陈 在 迈向数据科学 ·1天前 只有会员 Shap:解释Python中的任何机器学习模型 您的塑形,三曲和深色塑料的全面指南 - 动机故事时间!想象一下,您已经培训了机器学习模型,以预测抵押申请人的默认风险。一切都很好,而且性能也很棒。但是该模型如何工作?模型如何达到预测值?我们站在那儿说模型… 数据科学 13分钟阅读 数据科学 13分钟阅读
阿姆·哈利勒(Amr Khalil) ·14小时前 只有会员 改善SQL查询性能的4个提示 如何优化SQL查询性能和最佳实践 - 有多种方法可以改善选择查询性能。1.优化选择使用选择字段而不是从中选择 *。选择适当的数据类型。用SELECT TOP命令设置从数据库返回的记录数量的限制。使用在哪里,而不是在哪里查询… 数据科学 2分钟阅读 数据科学 2分钟阅读
路易·陈 在 迈向数据科学 ·8小时前 只有会员 5个错误,每个数据科学家都应避免 通过避免这些陷阱来提升数据科学游戏 - 数据科学是一个庞大的领域,需要大量的经验和知识才能掌握。在成为更好的数据科学家的旅程中,至关重要的是,我们定期审查自己,学习并避免我们无意中犯的任何错误。在此博客中,我们将涵盖5… 数据科学 7分钟阅读 数据科学 7分钟阅读
Vitor Cerqueira 在 迈向数据科学 ·10小时前 只有会员 预测合奏简介 提高预测性能的廉价技巧 - 如果您需要额外的性能挤压,则可能是您想要的预测组合。预测组合是结合许多模型预测的过程。该技术也称为合奏预测。在这里,您将学习… 数据科学 5分钟阅读 数据科学 5分钟阅读
Leonie Monigatti 在 迈向数据科学 ·1天前 只有会员 熊猫与极点:语法和速度比较 了解Python图书馆Pandas和Polars for Data Science之间的主要差异 - PANDAS是数据科学的必不可少的Python图书馆。但是它最大的缺点是,在大型数据集上操作可能会很慢。Polars是一种供大熊猫替代方案,旨在更快地处理数据。Polars是一种供大熊猫替代方案,旨在更快地处理数据。本文简要介绍了Polars… 数据科学 7分钟阅读 数据科学 7分钟阅读
罗布·泰勒 在 迈向数据科学 ·7小时前 只有会员 线性代数的底漆 对数据科学的基本概念和操作的温和复习 - 简介无论您是拟合简单的回归模型还是卷积神经网,线性代数都在使这些计算有效方面起着重要作用。虽然大多数可能熟悉其在几何形状中的使用 - 它用于定义线条和飞机等物体以及它们的… 数据科学 9分钟阅读 数据科学 9分钟阅读
Rafi Kurlansik ·8小时前 数据科学家会喜欢的云中具有成本意识的研发 可以说,在数据科学管理部门,“没有新闻是个好消息”。如果寻呼机和电子邮件很安静,则用户在工作和富有成效。这也意味着没有人在意外的云成本中增加数千美元!在本文中,我们将… 数据科学 7分钟阅读 数据科学 7分钟阅读
Farzad Mahmoodinobar 在 迈向数据科学 ·19小时前 只有会员 多元分析 - 一次超越一个变量 Python中的多元分析和可视化 - 如今,公司和企业收集尽可能多的信息已成为普遍做法,即使收集时此类数据的用例未知 - 希望是理解和使用将来的某个时候数据… 数据科学 9分钟阅读 数据科学 9分钟阅读
Zolzaya luvsandorj 在 迈向数据科学 ·18小时前 只有会员 在Python中创建合成数据集的简单方法 创建模拟表格数据的初学者指南 - 开发代码时,有时我们需要一个虚拟数据集。例如,我们想共享代码和基础数据,但现实生活数据集是机密的,因此不适合共享。一种选择是查找并使用合适的玩具数据集或公开可用的数据集。另一个选择是… 数据科学 7分钟阅读 数据科学 7分钟阅读