出版于迈向数据科学 ·2022年10月21日 只有会员 负R2:你在哪里出错? 一个统计示例 - 最近,我执行了一项机器学习任务,并在我的保留测试集中获得了负R2评分指标。“等待!R2不是平方吗?不应该在0到1之间吗?我到底做了什么?”最初,我非常担心我的机器学习任务的状态… 数据科学 6分钟阅读 数据科学 6分钟阅读
2022年10月2日 只有会员 在Qualtrics中动态建立,以供下调查后的受访者交流 文件上传的唯一电子邮件链接 - 一天的问题。您如何在Qualtrics中构建调查,要求从受访者上传文件?您如何构建调查,以便受访者可以选择在调查期间或调查后上传该文件?雷克前。本文假设您已经有Qualtrics平台… 调查数据收集 8分钟阅读 调查数据收集 8分钟阅读
出版于迈向数据科学 ·2022年2月26日 只有会员 数据科学家的概率:有能力的卡方分布 分布函数的交互式可视化 - 本文的目的是介绍卡方概率分布。在生成有关概率的一系列文章时,我旨在以直观,简洁,有用的方式描述每个分布。不会关注推导或证据。相反,我希望专注于直觉… 卡方 7分钟阅读 卡方 7分钟阅读
出版于迈向数据科学 ·2022年2月26日 只有会员 与Python升级:快速生产具有惊人视觉效果的PDF 与Matplotlib生产用于业务分销的手册/电子邮件/传单 - 最常见的任务之一是有效的信息通信。您可能会创建任何人见过的最美丽的仪表板,但是,如果您的管理团队拒绝使用仪表板(因为它位于长期URL上,他们会神秘地在浏览器书签中丢失),那就可以了…… matplotlib 8分钟阅读 matplotlib 8分钟阅读
2022年2月24日 数据科学家的概率:出色的几何分布 40 2 凯特墙 嗨 @gregor.sikora, 嗨 @gregor.sikora,谢谢您的反馈!我的目标是使这些分布更加直观和平易近人。我将继续努力。我很高兴看到评论!无内存属性实际上是某些概率分布的非常整洁的属性 - 仅指数(连续)和… 1分钟阅读 1分钟阅读
出版于迈向数据科学 ·2022年2月21日 只有会员 Python中的专业Treemaps:饼图的更好替代品 理解RCPARAMS和MATPLOTLIB COLORMAPS - 作为一个狂热的Python爱好者,我最近想在Python生成一个出版的Treemap。Treemapping通常用于使用嵌套矩形显示分层的分类数据。Treemap的每个叶子都是饼图的时尚,矩形版本,可视化分类数据。但是,有关…的可用文档 matplotlib教程 7分钟阅读 matplotlib教程 7分钟阅读
出版于迈向数据科学 ·2022年2月21日 只有会员 数据科学家的概率:出色的几何分布 PMF/CDF和建模真实数据的交互式可视化 - 本文的目的是介绍几何概率分布。它是有关概率的一系列文章之一。我的目标是以直观,简洁,有用的方式描述每个分布。不会关注推导或证据。相反,我希望集中精力… 概率分布 6分钟阅读 概率分布 6分钟阅读
出版于迈向数据科学 ·2022年2月18日 只有会员 初学者的概率分布 初学者统计数据,基本概念,伯努利分布 - 如果您在数据科学/机器学习领域,则可以决定,在某些时候,阅读具有统计概念的学术论文或包装文档可能很有用。这样做后,您可能会很快被语法和无法解释的符号表示所淹没,这可能会阻止您。… 随机变量 7分钟阅读 随机变量 7分钟阅读
出版于迈向数据科学 ·7月1日,2021年 只有会员 使用运行R内核的Google Colab访问Google Drive 从Google Drive文件或直接从Web URL导入数据 - 本文介绍了一种用于与R内核一起使用Google Colagoratory的分步方法。作为工程师和生物统计学家,我主要在Python和R中进行编码。在过去的六个月内,我决定,对于小型项目,通过Google Drive和Google与他人共享代码是最快的。 r 5分钟阅读 r 5分钟阅读
出版于迈向数据科学 ·2021年6月30日 只有会员 如何分析两组的连续数据 统计假设测试 +带有Scipy和Seaborn的视觉效果 - 大多数数据科学从业人员对传统统计数据尚不理解。传统统计学家没有利用许多现代人物。让我们弥合这个差距。想象一个任务。您有数十或数百个功能可以预测结果。假设这个结果是电子商务的点击次数… t测试 9分钟阅读 t测试 9分钟阅读