迈向数据科学

跟随

Trevor Coppins

·3小时前

一种数据驱动的方法，可减少员工调查长度

减少调查长度的同时最大程度地提高可靠性和有效性 - 员工调查迅速成为组织生活中坚定的方面。的确，人们分析领域的增长和采用数据驱动的人才管理方法证明了这一点（请参阅麦肯锡报告）。在一项调查中，我们可以收集有关领导者表现的信息……

数据科学

16分钟阅读

数据科学

16分钟阅读

尤利·瓦西里耶夫（Yuli Vasiliev）

·5小时前

使用从BERT嵌入的向量表示的傅立叶变换进行语义紧密评估

通过评估Bert嵌入的不同表示，探索单词在句子中的相互影响 - 伯特嵌入是一种在从文本中提取含义的方法时提供了绝佳机会的东西。似乎我们（以及机器）需要理解文本的所有内容都隐藏在这些数字中。这只是正确操纵这些数字的问题。我…

伯特

5分钟阅读

伯特

5分钟阅读

Nakul Upadhya

·5小时前

定义可解释的功能

麻省理工学院研究人员开发的发现和开发分类法的摘要。- 2022年2月，MIT的AI（DAI）小组的数据研究人员发表了一篇名为“对可解释特征的需求：动机和分类法”的论文[1]。在这篇文章中，我的目标是总结这些作者的一些要点和贡献，并讨论一些潜在的影响……

机器学习

9分钟阅读

机器学习

9分钟阅读

马克斯·希尔斯多夫（Max Hilsdorf）

·14小时前

Julia vs Libsa vs Torchaudio用于音频数据处理

速度比较 - 引言在现实世界中提供了广泛的音频数据：语音，动物声音，乐器 - 您将其命名。难怪基于音频的机器学习是许多领域和行业中的利基应用程序。与其他类型的数据相比，音频数据通常需要大量的耗时和资源要求处理…

数据科学

7分钟阅读

数据科学

7分钟阅读

卡梅隆·沃尔夫

·14小时前

专业LLM：Chatgpt，Lamda，Galactica，Codex，Sparrow等

创建更好，域特异性LLM的简单技术 - 大型语言模型（LLMS）是非常有用的，任务不可能的基础模型。但是，通过通用模型，我们实际上可以实现多少？这些模型擅长解决我们在深度学习文献中看到的通用自然语言基准。但是，实际上使用LLMS通常要求将模型教给新的…

chatgpt

30分钟阅读

chatgpt

30分钟阅读

迈克尔·格罗根（Michael Grogan）

·15小时前

用drignsml分析纽约市黄色出租车旅行记录

回归分析和反事实解释 - 解释是由Microsoft设计的可解释的机器学习库，目的是使机器学习模型更加容易理解，并且对人类的解释开放。在与业务利益相关者进行沟通时，这具有特殊的价值，他们在许多情况下是非技术的，并试图了解发现的业务影响……

机器学习

9分钟阅读

机器学习

9分钟阅读

Barrysmyth

·16小时前

训练休息会破坏我的马拉松吗？

准备马拉松比赛时训练中断的性能成本的大规模数据分析-TLDR；超过50％的跑步者在训练马拉松比赛时至少经历了7天的休息时间。较长的训练中断（≥7天）也经常发生。但是有希望，因为即使是长时间的破坏也不必破坏您的马拉松。但是，干扰确实是有代价的，并且…

数据科学

10分钟阅读

数据科学

10分钟阅读

丹尼斯·巴库斯（Dennis Bakhuis）

·17小时前

像数据科学家一样解决一个神秘盒子

获取数据，训练VIT，最小化问题；而且太过分了 - 当数据科学家以盒子的形式获得谜语时会发生什么？当然，他（尝试）将其作为数据问题处理。在本文中，我将描述整个过程，老实说，这并不像我想象的那么容易。与许多问题一样……

数据科学

17分钟阅读

数据科学

17分钟阅读

亚历克斯·莫拉斯（Alex Molas）

·17小时前

分析Chess960数据

使用超过1400万的Chess960游戏来查找是否有比其他差异更好的变化 - 在这篇文章中，我分析了LICHESS玩过的所有可用Chess960游戏。有了这些信息，并使用贝叶斯A/B测试，我表明没有比其他职位更喜欢任何球员的首发位置。原始帖子在这里发布。所有图像和图...

棋

12分钟阅读

棋

12分钟阅读

Gabriele Albini

·17小时前

分析流失的框架

使用模拟数据集进行客户流失分析的逐步指南 - 简介“流失”已成为一个通用的商业词，它指的是Wikipedia定义的流失率概念，为：“合同客户或比例在给定时间段内离开供应商的订户”从数据角度分析流失时，我们通常是要使用可用的工具…

机器学习

14分钟阅读

机器学习

14分钟阅读

一种数据驱动的方法，可减少员工调查长度

使用从BERT嵌入的向量表示的傅立叶变换进行语义紧密评估

定义可解释的功能

Julia vs Libsa vs Torchaudio用于音频数据处理

专业LLM：Chatgpt，Lamda，Galactica，Codex，Sparrow等

用drignsml分析纽约市黄色出租车旅行记录

训练休息会破坏我的马拉松吗？

像数据科学家一样解决一个神秘盒子

分析Chess960数据

分析流失的框架

编辑

TDS编辑器

本·休伯曼（Ben Huberman）

Caitlin Kindig

注册变量