麦迪逊猎人 在 对数据的科学 ·1天前 客户只能 5个简单的建议,帮助你作为一个数据科学家的未来 技术和标准可能会改变,但这些建议将适用于你的整个职业生涯——任何从事数据科学工作的人最大的恐惧是变得无关紧要。没有什么比光速和科技行业移动得更快的了,数据科学家在进入这个领域仅仅几年之后就变得无关紧要的情况并不罕见。这意味着战斗是… 数据科学 11分钟阅读
贾里德·海曼 ·1天前 101 Y Combinator的独角兽 2022年8月,Y Combinator发布了最新的顶级公司榜单,目前包括314家私营和16家上市YC初创公司,每家公司的估值都超过1.5亿美元。YC官方报告称,其中“超过80家”的创业公司估值超过10亿美元,但我们最好的估计是,现在有101家Y combinator支持…… 数据科学 7分钟阅读
丹尼尔·帕尔玛 ·1天前 实现数据的合同 数据契约帮助您通过数据管道和处理系统记录和执行记录的形状和元数据。他们的主要目标是减少意外和摆脱无文档记录的更改。例如,如果数据生产者和数据消费者同意他们之间交换的数据具有特定的… 数据科学 6分钟阅读
丹尼尔Kulik 在 对数据的科学 ·1天前 当离群值显著时:加权线性回归 包含重要离群值的加权回归方法——离群值通常是有害的。它们有可能通过将自己介绍为与其他数据同等重要的数据来扰乱一个简单的回归过程,这往往会扭曲拟合模型。一种直接的方法是使用离群值检测方法从数据集中删除它们。 数据科学 8分钟阅读
尼克Piepenbreier 在 对数据的科学 ·13小时前 客户只能 用Python完成三个常见的Excel任务 让迁移到Python更容易一点——从Excel迁移到Python可能会让人望而生畏——但这不是必须的!本教程将指导您完成Excel中常用的三个常见任务,并向您展示如何在Python中使用Pandas完成它们。在本教程结束时,您将学会如何…… 数据科学 2分钟阅读
马克Derdzinski 在 对数据的科学 ·1天前 我们如何创建一个特别的分析过程 将业务和数据科学的利益相关者聚集在一起,用一个集中的队列来处理分析请求——如何管理临时传入的分析请求?几年前我们的共享电子邮件列表已经成熟为一个成熟的过程,可以为我们的数据科学团队捕获、审查、资源和共享所有“Ad Hoc Analytics”(啊哈!)的输出。现在是…… 数据科学 11分钟阅读
汤姆Smykowski ·9小时前 客户只能 如何用Python编写Excel宏? 作为一名Python程序员,你一定记得四年前微软考虑将Python引入作为Excel(微软旗舰电子表格应用程序)的脚本语言。四年来发生了什么,我们有针对Excel的Python吗?微软曾经有一段时间…… 数据科学 5分钟读
凯特墙 在 对数据的科学 ·1天前 客户只能 R2:你哪里做错了? 一个统计示例——最近,我在进行一个机器学习任务,并在坚持测试集上获得了一个负R2评分指标。“等等!不是R2…平方?它不是应该在0和1之间吗?我到底做了什么?”最初,我非常关心我的机器学习任务的状态…… 数据科学 6分钟阅读
约瑟费雷尔 ·14小时前 客户只能 适用于每个开发人员的10个基本SQL命令 以及如何挤入SQL掌握他们。- SQL是一个非常常见但功能强大的工具,它可以帮助从任何数据库中提取、转换和加载数据。数据查询的本质依赖于SQL。随着公司和组织发现自己要处理的数据量迅速增加,开发人员越来越需要…… 数据科学 8分钟阅读
祖拜尔。 在 对数据的科学 ·15小时前 客户只能 数据科学统计的终极指南 数据科学的统计一目了然:标准指南-动机统计是一个强大的数学领域。我说“强大”是因为它帮助我们从样本数据推断总体结果。由于它可以推断人口的结果,它也可以用于大的图景(如总体影响,未来预测等)。统计不仅仅是一些… 数据科学 14分钟阅读