Payal Patel 在 迈向数据科学 ·1天前 使用散景在Python中创建数据可视化的8个提示 快速提示和示例使用散景库创建数据可视化 - Python是创建数据可视化的绝佳开源工具。有许多数据可视化库,包括Matplotlib,Seaborn和Bokeh。Bokeh是一个Python数据可视化库,旨在创建交互式图表。虽然免费使用,但通常需要大量时间来学习细节。 数据科学 11分钟阅读 数据科学 11分钟阅读
Pradhi Aggarwal 在 Lyft工程 ·1天前 使用乘车共享数据评估发行引文时的种族偏见 警务对颜色社区的不成比例的影响是美国的一个核心社会和政策关注,也是学术界强烈研究的话题。Lyft具有独特的位置,可以使用来自我们的大量旅行的数据为这一论述和学术文献做出贡献。 数据科学 9分钟阅读 数据科学 9分钟阅读
Sunita Rawat ·16小时前 第1天:数据科学的SQL SQL是一种用于在数据库中存储,操纵和检索数据的标准语言。数据科学家将SQL用作其标准工具,并使用存储在Oracle,Microsoft SQL,MySQL等关系数据库中的数据进行数据分析,我们需要SQL。这是… 数据科学 4分钟阅读 数据科学 4分钟阅读
Hajime Takeda 在 迈向数据科学 ·15小时前 媒体混合建模:如何使用Python&LightWeightmm衡量广告的有效性 媒体混合建模,其实施和实用技巧 - 本文是Pydata Global 2022. TLDR:媒体混合建模(也称为营销混音建模(MMM))的摘要销售的几项营销投资。LightWeightMMM是一个用于MMM的Python库,考虑媒体饱和度和广告库。然而… 数据科学 13分钟阅读 数据科学 13分钟阅读
Aman Ranjan Verma 在 走向数据工程 ·6小时前 只有会员 如何为pyspark应用程序编写pytest 了解如何像Pro这样的Pyspark应用程序编写Pytest -Pytest是Python的流行测试框架,使您可以轻松编写和运行代码的测试。在这篇博客文章中,我们将学习如何编写和运行Pyspark应用程序的Pytest测试,以确保我们的代码能够按预期工作。… 数据科学 6分钟阅读 数据科学 6分钟阅读
猫王 ·6小时前 及时的工程指南 我们与大型语言模型(LLM)互动的方式正在发展并始终改善。当前的方法包括许多及时的工程,以使LLM在不同的任务中有效。这可能在将来发生变化,但是开发人员和研究人员仍在弄清涉及LLM巧妙提示的新方法。为了帮助学习及时的工程,我很高兴发布及时的工程指南,这是一个新的回购,用于发现论文,指南,工具和数据集。 数据科学 1分钟阅读 数据科学 1分钟阅读
Yunna Wei 在 迈向数据科学 ·17小时前 只有会员 您是否曾经“测试过”数据管道? 一份综合指南,以使您的数据管道可测试,可维护和可靠 - 为什么必须测试数据管道?将适当的测试嵌入到数据管道中会使它们易于漏洞,还可以确保数据通过适当的数据质量检查,然后才能流向最终数据消费者。任何数据管道的两个关键组件是“代码”和“数据”。代码被用作管理… 数据科学 8分钟阅读 数据科学 8分钟阅读
纽约大学数据科学中心 ·1天前 CDS博士学生Swapneel Mehta在斯坦福基金会和安全研究会议上展示了“研究Twitter对唐纳德·特朗普的推文的因果关系” 首届会议包括跨学科演讲和来自新兴信托和安全领域的专家的小组,首届斯坦福信托和安全研究会议将来自学术界,工业,公民社会和政府在新兴信托和安全领域工作的专家聚集在一起为期两天的活动… 数据科学 3分钟阅读 数据科学 3分钟阅读
Stewbalberrie ·7小时前 如何在Python中创建几何引擎 你好!- 以下是python程序的选择,这些程序可以计算不同二维对象的面积和不同三维对象的体积: 数据科学 2分钟阅读 数据科学 2分钟阅读
阿里 ·1天前 简单的镶木教程和最佳实践 Parquet File是一个文件存储系统,它通过对数据工程师,数据科学家,分析工程师和其他技术角色等多个数据用户(例如数据用户)的数据进行操作而改变的任何人的寿命。镶木木的原理在于其面向柱的存储和…… 数据科学 5分钟阅读 数据科学 5分钟阅读