图片由海蒂鳍Unsplash

七个原则我跟随科学家是一个更好的数据

设置我的北极星

时光飞逝,我作为一个数据科学家在两个不同的公司工作了超过一年半了。在我的前一篇文章,我写了一篇关于我如何成为一个数据科学家作为经济学博士学位。在文章的最后,我分享了一些我收集在这个行业工作的想法。在这篇文章中,我想详细说明和总结七原则遵循科学家是一个更好的数据。

原则1:沟通是关键

沟通是关键在建立任何关系。在劳动力,我们不断扩大我们的网络通过与同事交流,老年人,利益相关者,客户,等。即使那些任务是面向更多的研究,我花了很多时间写代码和测试模型,通信仍然起着非常重要的作用在我的日常工作。我需要从IT团队收集和验证数据;我需要与同事讨论模型开发进度;我需要发现和见解股东/经理沟通,等。有效的沟通是非常重要的,尤其是当远程工作越来越常见的大流行。我的建议是在一定频率同步会议预定你的日历和每个人需要交流,不断更新你的项目进展,里程碑和挑战,没有人喜欢惊喜的劳动力

除了任务相关的沟通,沟通是你的另一个重要部分的发现。数据科学家,很多时候我们面临的挑战与非技术受众沟通花哨的技术的东西。一个常见的错误,在这种情况下,将专注于发现背后的复杂的模型和算法,并向他们展示如何先进。除非这是一个学习的会议,很多时候这种类型的沟通只能混淆观众。为什么他们如此在意你如何得到结果(即使你花大部分的时间在这部分),他们只需要知道如何使用这些信息。数据科学不仅仅是编码和花哨的模型。它的商业价值表明,应该强调在沟通。作为一个来自学术界,我花了一些时间来适应融入环境,并学习如何识别我的痛点非技术受众。开发强大的模型仅仅是第一步,只让人看到你的工作的价值和信任它,购买它最终会完成你的任务。

数据讲故事的能力和表达能力是必不可少的交流发现,这些是我强迫自己提高的领域。一些好的建议我收集观察好的主持人,练习演讲,演讲之前总是排练,不断寻求反馈你的听众。

原则2:通过快速学习和学习

数据科学是一个不断变化的领域,从而跟上最新的趋势和技术工作在确保一致的性能至关重要。数据科学家们保持一份全职工作,这是不现实的需要几个星期的时间来学习新的东西可以应用到你的工作项目。我们需要学习快速,实现这一目标的一个方法是通过在实践中学习。而不是迷失在太多的细节在一个新概念和背景信息,最快的方式完全掌握它,是一个值得信赖的实用教程和复制,然后尝试在您的项目定制的创新来实现更好的结果。举一个例子的学习随机森林算法。我们当然需要知道一些基本的算法——它是什么,它可以被使用,等等。然后我们就使用它在当前项目中,一些教程后,看看有什么结果。博客文章和例子是大源快速自学,教科书相比,或在线课程。最后,我们诊断结果和寻找方法来提高算法的应用程序。例如,算法的hyperparameters是什么,我们如何优化它们,等等。

学习东西快让我们最新的。主要是针对问题进行或项目驱动,快速学习为我们提供了短期解决方案。从长远来看,我们应该有一个坚实的计划改善某些技能可能需要更加一致的实践。在这种情况下,我们需要形成一个学习的好习惯。我们可以报名参加课程学习特殊技能。最重要的是,我们应该公开自己的最新实践数据科学,尽管他们可能不是与我们所做的日常工作。我订阅了很多科技公司的科技博客中(betway娱乐官网instacart,Airbnb,Lyft,网飞公司科学和数据通讯等),确保在社区发生了什么,并进一步探索我感兴趣的事情。我们也可以扩大我们的网络,形成我们自己的学习社区,我们分享我们所学到的东西,是什么新鲜事。最后,杠杆的力量教学更好的学习,根据著名的费曼规则。这是我主持这个博客的主要原因。

原则3:发展领域专家

另一个认为我收集工作作为一个数据科学家是我们不需要一个专家,但是我们需要开发数据科学领域专家。这是什么让你一位杰出的数据科学家,而不是一个有用的数据科学家很容易被取代。数据科学是一个职位,需要大量的合作。你需要知道的一切能够与你的同事用同一种语言交流。然而,你应该优先考虑你的时间和精力在至少一个特定的区域有一个全面的了解,和你建立自己外带的人谁有任何有关这方面的问题。这是博士学位计划,就像你选择一个字段来完成你的论文,你让自己更新所有重要的文学在这一领域,你提出和解决问题,研究和开发新的方法在这一领域,坚实的成果分享。有很多科学领域的数据,预测、因果推理,NLP,等。基于你的背景和激情,识别某些字段和在这些领域建立全面的知识体系。广告最重要的是,自己是一个专家(或即将专家)在这些字段,这些字段提供任何有关你的意见来增加你的知名度和影响整个劳动力。

原则4:代码效率

编码数据科学家确实是重要的,但我认为,不是最重要的硬技能解决问题相比,批判性思维,等等。我们需要的代码来完成我们的工作作为一个初级数据科学家,但正如我们在职业生涯中,前进区分我们和其他人不太可能来自编写的代码,但是你可以用代码交付。编码是一个意思,而不是一个目的地。别误会我,我想能够编写代码是很重要的,理想的高效、清洁,尤其当你与其他人合作一个项目。我的观点是,而不是花很多时间通过教程,阅读教科书如何代码,以及如何代码干净,试着学习经验,总结好的做法,并确保将它们应用到自己的项目。在劳动力,很多时候你不需要从头开始编写代码,因为可能已经有点相关的现有项目。作为背景的人不在数据科学或计算机科学,我总是着迷于如何清洁,一目了然,有效的我的同事的代码。我问他们要跟我代码评审,向他们学习,组成我模仿他们所使用的代码。编码是创建通过复制。

关于编码的另一个重要方面是,我们应该建立一个数据库进行模块化的代码片段,尤其是对于那些你经常在不同的空间复用。写函数和类非常有用当有重复使用同一项目内或跨项目。一些公司将购买智能和用户友好的工具,已经存储的模板代码片段,和数据科学家只需要定制数据输入或参数为了得到漂亮的数据可视化或找到最好的模型。

另一个提示我有对于那些工作在一个端到端项目最终会将生产是建立项目文件夹和模块化不同的任务。你会几个python文件照顾不同的任务在数据清洗,特性工程、模型训练,主要进口文件,并调用不同的对象来完成端到端流程。这将是很容易进行任何更改,重新训练模型,更新数据集,并最终把项目投入生产。

图片作者

原则5:开发商业智慧

准备面试,您可能需要自学你将要面试的公司的商业模式,案例研究轮。在工作中,你把你假想案例研究投入生产的问题。你不仅需要提出解决方案,也实现和最终产品。在整个生产过程中,需要开发商业智慧:

  • 知道您正在处理的数据:每一列是什么意思?如何处理缺失值吗?是否部分或使集群的数据吗?有什么特性,将有用的或生成吗?什么是有用的内部或外部数据集我可以用吗?
  • 知道如何构建模型来解决不同的问题:是一个线性基准模型,或我需要使用复杂的深度学习模型吗?我如何选择可解释性模型复杂性节?有哪些指标我应该使用,以确保模型的目标业务痛点?
  • 知道如何宣传你的工作:为什么我的项目有意义(通过xxx使$ $ $,或者节省$ $ $通过xxx) ?我该如何量化效果?

理解的业务处理是第一步。很多时候我们可能太急于进入技术细节没有看到大局。知道如何增加影响和广告项目的值将完成项目一样重要。

原则6:学会管理工作负载和任务的优先级

管理工作负载通常被我们忽略的东西,特别是在我们职业生涯的开始。我们想说的是一切建立良好的声誉和避免显示自己的弱点。知道何时以及如何说“不”是一个我们应该开发质量。尽管接受挑战,走出舒适区是重要的在确保一致的增长,有明确区分推动自己进步和倦怠。推动和挑战自我的进步是主动和所有权。这是你为自己选择做开发你的核心技能,达到你为自己设定的目标。你会激励自己努力工作而不感到累但充实。倦怠、另一方面,逐渐威胁到我们的心理健康,危害我们的生产力从长远来看。这是由于超载你被迫做的责任。倦怠发生超过你所知道的。当你感到很紧张和担心工作,真的需要休息;当你不能专注于手头的工作,因为你担心所有等待完成的其他任务;当你不能停止思考工作时间以外的工作。 Whenever it happens, it’s your body tries to warn you that you are taking too much. Burnout has different stages, and it escalates over time if you just force yourself to pull through.

处理:

  • 第一步是识别的信号。问自己为什么我不富有成效的今天,是因为我有太多的工作在过去的几天里吗?
  • 不要过多的承诺。是合理的对你的工作量和你完成他们的能力。不要害怕说实话并展示弱点。允许你自己有你不知道的事情,你不擅长的事情和你不熟悉的事情。只要你有打算改进所需的关键技能,并且知道如何与人合作,你不应该对自己太严厉的最好的东西。如果你想把自己通过这次过度承诺一项艰巨的任务,问问你自己是否努力你将通过可持续的,你是否可以强迫自己在未来所有的时间。如果不是,为什么这一次?职业发展是一个长期的游戏,不是短跑。
  • 总是调整优先级时获得额外的任务。有时候我们会特别请求别人的处理工作。每当你预见这些任务完成不够快,排列优先级的任务你已经与你的经理,所以你知道你把所有影响为最重要和紧迫的任务。

时间管理和心理健康是非常重要的在专业和个人生活。我们真正需要做的是知道我们的边界,交流我们的边界,并学会说不的事情我们可以集中时间和精力更多的关键元素。

原则7:方向比速度更重要

很多时候我们关注增加实现目标的速度,你想知道,是否值得花时间在这个目标?如果是这样的话,另一个问题是你是否接近这个目标在正确的方向上。如果你的目标是得到晋升,工作影响和较高的知名度较高的项目给你一个更好的机会识别的领导,而处理多个小项目。有好的演讲和讲故事的能力给你一个更好的机会广告你自己和你的项目,你看到的,而不是仅仅专注于实现高档模型和技术细节,但不能让别人看到的值。

每个人的时间和精力是有限的,因此我们需要把它们放在正确的效用函数来解决优化问题。我们怎么知道什么是正确的方向吗?我们可以寻求他人的建议,上课,阅读书籍和文章,等等。然而,这些都是别人的经验,自己可能不兼容。除了指别人,我们需要问自己我们真正想要的我们的生活。我们需要保持我们的眼睛睁开看到所有可能的方向和探索。当然,我们可能会犯错误,这就是为什么我们探索,反映和总结。我喜欢我在做什么吗?我是正确的吗?有什么快速到达目的地,但这不是你想要的目的地?没关系绕道,到后来,只要我们知道我们到达某个地方真正的欲望,不是因为别人已经告诉了我们。我们找不到激情通过阅读别人的故事。我们需要探索自己的可能性。这是真正的职业和个人生活。

总结

总之,我遵循的七个原则:

  • 沟通是关键
  • 通过快速学习和学习
  • 发展专家领域
  • 代码效率
  • 开发商业智慧
  • 学会管理工作负载和任务的优先级
  • 方向比速度更重要

上面列出的所有原则我也彼此相关。例如,我们需要开发商业智慧,知道什么是正确的方向,然后知道如何管理我们的工作负载优先任务。你能想到别人如何连接?

免责声明

这些是我总结的原则基于我的经验和我的理解的劳动力在行业工作了不到两年的时间里,和建议我从不同来源收集。我可能会限制作为初级数据科学家的作品更多的研究。欢迎你多留言低于添加其他原则价值但不列在这里。或详细说明某些原则同意或不同意基于你自己的经验。

感谢您的阅读!检查我的其他文章如果感兴趣:

订阅我的邮件列表:

注册中加入:betway娱乐官网

或者跟我在YouTube上:

- - -

- - -

得到了媒介的应用betway娱乐官网

一个按钮“App Store下载”说,如果点击它会使你的iOS应用程序商店
说一个按钮上,谷歌玩,如果点击它会使你的谷歌商店
夺得朱

经济学博士学位|认证数据科学中| | 1000强的作家的激情在生活中| https://www.linkedin.com/in/zijibetway娱乐官网ngzhu/

Baidu