语言发展的科学数据

月上旬…或运用的散景Scarse意义

发表在
7分钟阅读 2019年8月23日

- - -

“你继续使用这个词。我不认为它的意思是你认为它是什么意思。”——尼博士蒙托亚

我是一个技术作家。许多伟大的事情关于我的工作,我每天去工作和聪明的人。大量的工作涉及到翻译。他们都会说英语,但是仍然可能不理解对方。这是一个自然结果的知识一般的进步,特别是英语如何发展。

随着学科的发展,替代含义和新词发展相匹配。可以扩展到创造新的短语名称学科本身(例如,什么是数据科学家?)。英语的新词汇和意义等一直是务实的。其他西方语言更正式的审批流程,如法国的法兰西学院和德国的依赖单一的著名的词典。最接近正式当局正确的英语很受欢迎词典如《牛津英语词典》,《美国传统词典》、《韦氏大词典》。没有一个人统治最高。

这种非正式的采用新词汇和意义可能导致整个的人没有意识到他们的对话,讨论不同的东西。例如,考虑另一个最近采用了字:“散景。”这个词开始作为一个方言的专业摄影,看起来美观的模糊的强有力的景深可以给一幅画。“散景”也是为一个特定的python的名称数据可视化包。所以“散景”可能已经走向新的意义的范围内数据的科学。

作为一个英语的流体性质的进一步的例子,“散景”来自日本词博客(暈け或ボケ)。在原来的形式,它意味着“故意模糊”,有时“心理阴霾,”。,混乱。

两排的花,在距离变得模糊;代表的散景摄影。
散景的鲜花——照片 谢尔盖Akulich Unsplash
蒙太奇的各种可视化与数据科学产品散景。
数据科学散景, https://bokeh.pydata.org/

“数据”的乌云密布的意义

数据科学家告诉我,当她听到“数据”她倾向于认为大量的信息,综合一组足够大。她惊讶地看到另一个团队的“数据”是一个小桌子在一个电子表格,列出了几个数字。

这一项技术领域也会引起混淆。数据科学家经常解释“数据”定量,而用户体验研究人员解释“数据”定性

探索发展语言与Ngram Viewer

科学的同事介绍我到产品Google Books Ngram Viewer。它是一个搜索引擎显示,通常是一个词或短语出现在谷歌扫描图书印刷的质量。谷歌的集合包含大多数英语从公元1500年到2008年出版的书。

我进入一些我遇到的新单词,并筛选出现不相关的,如地方或人名称和缩写。我也将搜索设置为从1800年开始。中世纪的科学数据可能是有趣的,但我希望它是“scarse。”(这不是一个错字。)

特性

当我第一次看到这个新意义的“特点”,我甚至不知道它已经改变了。从以前的工作软件开发和用户体验,我把“特性”的意思是“方面的产品,用户希望能找到有用的。“但是在数据科学,“特性”与协变量的模型。在技术英语,可测量的属性或特征的现象被观察到。

这种双重意义让我苦思冥想时记录大量的内部数据科学应用程序。应用软件功能定义和操作数据的功能。

下面的图表显示这个新兴意义“特性”通过跟踪相关的短语的出现,“模型的特性。”

折线图显示的上升使用术语“模型特性”从1800年到2000年。
使用术语“模式特性”山峰在1990年代的某个时候。

深入Ngram的具体引用,最早提到我可以发现附近的这个意思是在1954年。有趣的是,它是一本关于管理科学:

“管理科学”的截图从谷歌图书的总结

下使用,似乎完全出现在1969年,在消化记录从计算机协会,工业与应用数学学会,电气和电子工程师学会。除了逗号,例子是完全正确的,我想知道如果我们观察附近的确切时刻这新的意义完全出生:

截图的谷歌图书总结为“消化记录”

去欣赏

“神交”是英语的一个例子将迄今为止窃取的语言的词甚至不存在。罗伯特·a·海因莱茵创造了这个词在他1961年的科幻经典异乡异客。小说中,火星“神交”一词的字面意思是“喝”,比喻意味着“理解这样完全,你也是其中一员。”

折线图显示的趋势使用术语“神交”从1800年到2000年。
使用术语“神交”从1960年代开始增加。

像许多科幻小说和幻想的其他方面,计算机编程文化吸收。的术语的文件1983年股票提前定义的例子:

欣赏(grahk)动词。
特别是全球意义上的理解,通常,理解
所有改变的影响和后果。例子:
“JONL是唯一一个神交MACLISP编译器”。

从那时起,计算机术语“神交”吸收和应用在许多不同的方式。一个直接的例子是引擎源代码和引用OpenGrok。旨在让用户“神交(深刻理解)在开放源代码和开发。”

是一个常见的词,经历了两个步骤的技术变化。首先,它获得了意义涉及信息安全、然后一个额外的一个科学的数据。

作为一个动词和名词,“盐”最初的意思是它听起来像什么——添加化学物质称为氯化钠为调味和保存食物。它得到了什么也许是其知名的技术信息安全的意义。添加“盐”密码散列加密密码更难破解。这个词的进一步和最近的排列在数据科学,“盐”和“resalt”意味着部分随机洗牌一个实验的结果。以下Ngram图跟踪协会的“盐”和“resalt”。

这是很难解析出来,需要潜水深入Ngram的选择。我最终图形的不同时期“盐”修改字“食物”,“密码”或“数据。“谷歌停止扫描2008 -你可以看到裸露的新书在2007年开始这个新的用法。

一个折线图,表示盐对于食物的使用,密码和数据。
从2000年到2008年,盐食物是最常用的背景下,其次是信息安全意义上的盐。

酸洗

传统的“酸洗”指的是另一种方式对待食物,这个几乎完全保护。在Python中,这指的是对象序列化方法Pickle模块。科学家们发现越来越多的数据使用这学期,在最近的方式找到Ngram。

出血边缘语言?

这里有一些单词,可能只是在萌芽阶段的更广泛的使用。

Scarse

这来自一个意外混杂在一起的词,一个会议,此后一直在使用。它描述了数据的情况下稀缺的(不是很多)稀疏的(即使有,很薄)。

这个意思“scarse”不会出现在Ngram图。这样看来我们看到变异与进化在词形式在野外。它会生根和繁荣,继续发展?只有时间能告诉我们答案。

月上旬

“我们应该寻找错误消息的来源的增加。”

我观察这个词在我的野性。“创汇”来找我开会,作为一个词的数量随着时间的增加。我从来没有使用过这个词。它看起来像一个词可以存在。句话说有类似的意义,说这些句话说的规则建设。

我上下文中使用,它的意义并不完全相同的“增量。“增量是指一个特定的数字增加。一个不会引用,例如,越来越多的用户作为一个增量。然而,你可能会把它作为一个月上旬。

寻找在Ngram创汇表明这个词以前存在但是共同使用,如下图所示。

折线图代表的使用术语“创汇”从1800年到2000年。
在使用“创汇”一词逐渐缩减,峰值在1810年代,其次是逐渐下降。

之前的例子:

书:英语的父亲教会

保罗,他又应该返回这些腓立比书,和遵守,并继续在他们,和他们的利润;既能增加他们的信心

书:哈利父子的混合物;或者一组…小册子和传单…在牛津伯爵的图书馆

…。当她看到男人发展定居,稳重的,给了他一个援助,和先进的会计员之职,他在那里他修正了他的房子,他mis-spent时间,增加他的财产和荣誉…

也许是时候“创汇”重启到常用吗?

底线

语言是有可能继续发展,只要我们使用语言。词一般,特别是英语单词,英语和文字技术方言最重要的是,在一个不断变化的状态中。就像许多领域的知识他们讨论。

如果你在技术讨论和别人的反应不是很你期望什么,考虑重新审视技术短语你使用。

和你说的人会欣赏这些话完全不同。

通过对事实上工程博客

- - -

- - -

Baidu