在一起我们可以做这么多

第1部分:我的外卖实地研究和医疗合作

11分钟阅读 2019年8月13日

- - -

在我进入主题之前,让我给你一些上下文。我是一个研究助理,在工作设计深度学习(DL)模型和开发全自动生物医学成像领域的基于ai的诊断工具。简而言之,我师DL算法和管道在图像分类、目标检测、语义分割,分割和深集群实例。

图1:Healthworkscollective(源)

现在,你必须推断,我没有一个极微小的“药”或“生物科学”在我的简历里。说实话,生物学是一个主题,在学校我绝对可怕的。你永远不知道命运和她的车轮已经在商店为您。不久之后,我多次实地考察我们的合作伙伴医院临床验证和数据收集一个视角的转变都花了,接受的理念致力于生物医学问题的陈述。

注意:光谱实验室的有关合作项目细节,印度,都是保密的。因此,我不采取任何直接提及问题的声明。本文起草的动机是完全通过经验学习知识浓缩。以下各部分将重点介绍一些我的经验,我希望我的经历启发你!

欣赏不同的观点

“‘知道’的最好方法是在另一个纪律”。- - - - - -伦纳德伯恩斯坦

语句可以从一个生物医学问题医疗的角度来看,技术的角度来看。要理解这一点,让我们考虑一个恶性肿瘤检测的例子。一群DL爱好者可以想出办法来优化目标检测算法检测恶性或良性肿瘤,同时诊断肿瘤学家利用他们的专业知识。想象这样一个场景:实体不工作。它可以被比作设计一个新的战斗机模型没有任何飞行员(目标用户)之间的相互作用,飞机设计师和飞机零部件的oem厂商。

有什么更好的方法对细节上的多个前景主题,而不是讨论各方面临的挑战?几个访问,我意识到我们的技术挑战和医生的挑战不同的粉笔和奶酪!图2总结了我的观察的一个诊断软件工具。

图2

数据科学鉴赏家和协作的团队

图3

在这一点上,我们要考虑以下问题从数据科学家的角度(奥利)。奥利能够回答下列独立?

  • 有哪些不同的图像采集设备用于奥利吗问题吗?如果设备即不同。传感器有不同的细节-数据分布是不同的。简言之,如果奥利列车从distribution-1她预测模型数据,并验证该模型从distribution-2对数据,她在为一些不稳定的结果
  • 图像增强是必需的吗?奥利可能需要将数据清洗和去噪技术基于图像清晰度。
  • 或病理条件有多严重?严重的疾病(比如癌症)呼吁降低误差,假阳性和假阴性。
  • 尽管DL模型检索高级和低级特征,奥利应该考虑任何额外的手工制作的特征吗?
  • 医生做出正确的诊断如何?让我们认为奥利设计一个DL模型假设肿瘤学家银行主要即视觉感知色彩、纹理和肿瘤深度。如果肿瘤位置和重要器官也扮演重要的角色吗?
  • 有什么风险和风险是可以接受多少?无疑,医疗风险可能带来可怕的后果因此奥利应该询问更多的症状,离群值,性能标准,是否需要实时诊断等。看起来像一个息肉样可以是恶性肿瘤想象得到,错了!
  • 每年有多少情况下遇到的吗?这将给奥利估计她可以收集数据样本的数量。大量可以加强一个论点完全自动化诊断工具或其他自动化平台。
  • 程序的时间和成本是什么?奥利想要构建一个吗健壮、可靠,计算效率高,负担得起的和准确的技术解决方案(硬件/软件),在市场上比现有的便宜。
  • 医生们所面临的挑战是什么?奥利应该考虑如果医生实际上要使用任何辅助技术。例如,医生可能不需要诊断工具来检测皮肤溃疡,因为这些很容易识别。
  • 实时的解决方案会喜欢吗?如果一个ICU病人有一个活跃的地区他的胃出血,医生一定会立即采取行动像烧灼受灾地区以减少出血。没有办法,他将诊断应用程序使用一个,他不得不手动给单独的图像验证了他的诊断。
  • 临床验证如何进行吗?在某些情况下,医生可能无法验证奥利结果仅仅基于视觉感知。例如,肿瘤可能需要第二步的验证(活检)由histopathologist -确定肿瘤是恶性的。
  • 有业绩标准吗?对于青光眼等程序,严重程度进行筛选符合ICD - 9和ddl标准。

数据收集生物医学成像应用程序是一项非常艰巨的任务

缺乏注释数据可以严重时训练神经网络。一个不能简单地刮网站,手动标签数据没有专家,或进行一项调查——创建丰富的医疗数据存储库(NLP爱好者没有冒犯的意思)。最重要的是,医学专家马克受灾地区可能无法准确的说,。

图4所示。(一)组织病理学乳腺癌检测数据(c)注释样本特点(doc) [1]

如果你尝试注释几件样品吗?我开始疯狂数据注释,记住医生教会了我什么。让我沮丧的是,病变的边界模棱两可的,有吗多个变体同样的异常。此外,我误认为正常区域(大明显的樱桃红可怕的条纹)和异常区域(一个极小的轻微的紫色边缘质量)。

深思熟虑的食物:如何识别模型异常如果有多个变体喜欢集群,片状、粒状和粘性的质量?如果这个模型开始学习更大的红色区域,而不是紫色的?

当我忍者注释技巧反对我,我采取弱semi-supervised学习,和人工合成替代品使用甘斯/纹理传递数据。我获得了一些人工样品相当乐观,只有意识到目标分布学我的模型没有屈服视觉逼真的图像。

“血怎么能是透明的吗?我们不应该能够看到下面的组织粘性质量。”——医生

随后,我也知道了背景(正常区域)图像的重要就像前台(地区)异常,因为一些病变具体地点。这是游手好闲的人。有时最好银行医学专家——即使它需要数小时的现场工作,获得可靠的人工注释。

一个想法卖给一个医生

首先,不能离开愚昧地给一个薄弱的证据的概念,目的或理由去看医生(只是为了吸引一些研究出版物的项目)。经验丰富的专家可以看穿你的解决方案之前,你知道。具体的结果,详细说明他们将如何受益,医生和病人。与此同时,避免复杂的算法描述和技术术语——这些只会烦恼的医生。这里有一些黑客,我拿起。

简化的概念

Vid.1:连接体解释5不同团体的人

首先,图片解释应用程序,新奇、范围和新手提出的解决方案的性能。关键是要从高水平/概述“大局”,慢慢地深入底层细节(只有在医生好奇,问你详细说明一个特定的主题)。而编译报告内容,把自己放在医生的鞋子。随后,问你的医疗的朋友他们会找到相关,你应该展示你的问题陈述。

利用视觉学习工具

还记得你高中生物学教授将使用动画视频描述不同的系统和身体功能?可汗学院使用或TED-Ed视频来满足你的好奇心吗?这些平台体现视觉学习的力量。

使用动画视频、图表或概念图能帮助解释复杂的管道和工作流。

Video.2

花几分钟看上面的视频。问自己如何解释这个技术和医学编程初学者,在2分钟内注意你的策略应该是,人可以记住项目至少几天。在这之后,我需要证明为什么应该创建一个保健品原型视频?

医生关心的性能指标

“你对哪些性能指标使用,为什么?”

只是告诉医生,我用精密/召回/ f值/ AUROC -因为相关学术文献提到这些显然是不够的。最先进的结果几乎数如果我不能提供一个强有力的理由选择特定的指标。

图五:(a) IDRiD数据集注释(地面实况)(b)预测分割图

一个简单的例子可以强调需要正确的性能参数。始(一)代表一个注释的micro-aneurysms眼底图像。如果一个细分模式错误地预测分割图5 (B),非常高的精度值(> 98 + %)将观察到的。不幸的是,没有一个micro-aneurysm检测。这里是年代精确度的来救援!

一个大问题

很少有医生将娱乐的想法有技术,取代他们的专业知识和专业职责。如果你去医生说你的软件将超声图像比医生本人,很有可能你会收到居高临下的言论在整个会话。

“这个工具能做什么,我还是我的现有设备不能有效吗?”——医生

这个问题应该是非常重要的如果一个人希望工作在一个医疗应用。对于任何合作风险,医生将理想的寻找双方都有益的,有效的解决方案,是小说或比现有的更好(所有你知道的,他们也遵循10 x的规则在不知情的情况下)。的方式,需要让医生感觉涉及似乎和她的专业知识/经验的价值提到这么简单的东西,”辅助技术,减少诊断时间”将是一个更好的描述说,“这个工具可以减少医疗专家”。

首先,列出你的硬件/软件将有利于当地的医疗机构。您的解决方案可能会专注于:

  1. 设计更好的图像采集设备。
  2. 导致更少的病人不适。
  3. 减少专家审查时间。
  4. 重新设计的硬件负担得起的设备。
  5. 提供辅助技术来减少诊断错误。
  6. 为特定的病理发展试销工具。
  7. 提供模拟/数据可视化工具。
  8. 设计一个多功能病人应用。

(绝不是这详尽的列表)。

这是值得花一些时间阅读有关成功的医疗和技术合作项目,理解的因素使他们脱颖而出的融资(99点是一个很好的起点)。

画出聪明的相似之处

自然观察之间的差距你的医疗应用的功能和应用。医生的医生的看法可能需要时间来可视化程序设计和使用情况,除非你给他一个原型。弥合这一差距,我采取了UI模型/原型工具来传达我的想法。

当医生仍有歧义在最终的产品将会是什么样子,我意识到用类比会导致一个奇异的想法。

医生可以与医疗术语;发现现有的医疗过程/工具,传达你的想法。例如,我们发现我们的应用程序之间的相似之处和心电图报告。后者由病人的人口统计、时间戳和预测——所有这些在我们的应用程序的一些基本特征。

什么可能出错

是透明的虽然解释任何限制建议的解决方案所以医生意识到其中的风险。由于模型under-fitting可能是一个错误,可能导致严重的后果(由于误诊)。

只有医生应该决定风险是否值得。

澄清的黄金标准和可接受的错误而针对任何医疗问题。记住,超越艺术的状态在一些人工智能会议并不能保证您的解决方案将会被医学界所接受。

描述你的样本数据集(即使是公开)

高级医生工作的好处之一就是你学会面对意想不到的查询。访问期间,我被要求描述病人的人口统计数据基于公开数据集的存储库使用。

“病人的数量,是多个样本来自他们?”

“收购设备规格和种族的人?”

我不知道,医生们试图想象我们的解决方案将如何帮助当地群众

当我询问这些细节的必要性,医生解释了4病态的0%我的数据集是极其罕见的在印度和常见的西方国家。因此,设计一个预测模型等罕见的异常不会使用,在印度上下文。其次,在西方国家使用的图像采集设备更先进和昂贵相比,在当地医院的使用;培训我们的DL模型从这些设备,高分辨率的图像可能不会帮助医学界在印度。

医学研究的前景

我必须说,我一直非常幸运与这样的高级医生最大的政府医院在我的国家。因为我们不得不提出我们的解决方案外部的政府机构,他们教我第一手的重要一课。

“你(科技)团队提供一些胡萝卜说服上级外部协作”。

简单地说,有必要强调所有的好处提供给另一方在一个协作环境。证明他们的社区将获得通过时间为您的项目。

在这种背景下,我们阐述了我们的研究将有助于医生的研究。就像科学家、医生著名医疗会议和期刊出版工作。AI爱好者发表他们的研究在完全自动化的解决方案,其医疗合作伙伴可能对发现的蛋白质,同时写一个案例研究的结果或首开先河的过程!医生肯定会喜欢探索的区域智力上的刺激和有一个良好的范围进行研究

给医生一个理由花宝贵的时间从他们拥挤不堪的时间表(包括连续变化和不眠之夜点缀着意外的情况下)的项目。

注意:我感谢我的教授,指导我通过我的项目。第2部分将很快!希望你能喜欢。随意置评。:D

[1]Ronneberger,奥拉夫,菲利普·费舍尔,托马斯Brox。“U-net:卷积网络生物医学图像分割。“医学影像计算和计算机辅助介入的国际会议。施普林格,可汗,2015。

- - -

- - -

RA @印度科学院(毫升/ CV) | | @的创始人Asankhya项目| |谷歌WTM学者| | ACM-W最好官受奖者| | GHCI学者。

Baidu