
Published in Fundamentals - Fundamentals October 2022

约翰霍普金斯医学院将加入一个由美国各地的生物医学和行为研究科学家组成的联盟.S. 生成“人工智能(AI)就绪”的数据集,这些数据集的来源符合道德规范. Pending the availability of funds each year, the consortium, 基于人工智能的公平糖尿病洞察图谱(AI-READI), 将在未来四年从美国国立卫生研究院(NIH)人工智能之桥(Bridge2AI)共同基金获得约3000万美元的支持.

“We’re not aiming to solve just one question about human health,” says Tin Yan Alvin Liu, M.D., 约翰霍普金斯大学医学院和威尔默眼科研究所的眼科学助理教授. “我们正在设计一个系统,以合乎道德的方式收集和生成包含各种信息的数据集,这将对几代专门使用机器学习来解决人类健康方面具有挑战性问题的科学家有用。.”

The AI-READI consortium, led by the University of Washington, will collect health information from people with diabetes, 但刘指出,眼科和放射学领域是最早将人工智能技术融入标准临床实践的领域. For example, Liu says, 这是美国食品和药物管理局在医疗领域批准的首个完全自主的人工智能系统,用于筛查糖尿病视网膜病变, 糖尿病患者视网膜血管受损的常见情况.

portrait photo of tin yan alvin liu

T.Y. Alvin Liu, M.D.

“当我们提到精准医疗时,我们通常会想到遗传学研究的进步. However, 能够预测健康状况和结果的人工智能工具的创新也同样重要,” says Liu, 威尔默精密眼科卓越中心的创始主任, which is part of the Johns Hopkins inHealth precision medicine initiative.

The key to improving such tools, says Liu, is high quality data. “人工智能预测的可靠性取决于用于训练分析数据的计算机系统的数据质量,” says Liu, 谁与威尔默眼科研究所共同领导AI-READI联盟的伦理部分 Megan Collins, M.D., M.P.H., and the Berman Institute of Bioethics’ Kadija Ferryman, Ph.D. “For example, ideally, 这样的数据集将来自不同种族和社会经济背景的研究对象.”

接触到可以为项目提供健康信息的广泛人群, 研究小组正在建立与当地社区接触的资源, 输入可以帮助修改项目计划和数据收集过程.

“Oftentimes, when work like this is undertaken, ethical issues are addressed at the back end, 在数据被收集并被用于研究和开发之后,” says Debra Mathews, Ph.D., M.A.伯曼生物伦理学研究所负责科学项目的助理主任. “That’s when, for example, 发现数据集不具有代表性或数据存在偏差, such that not everyone will benefit equally from the research. Many ethical issues, including those raised by artificial intelligence enabled technologies, are much easier to address much earlier in the process.”

Portrait photo of Debra Mathews

Debra Mathews, Ph.D., M.A.

Mathews and Ruth Faden, Ph.D., M.P.H., the Philip Franklin Wagley Professor of Biomedical Ethics, are co-investigators in the AI-READI consortium.

约翰霍普金斯大学的研究团队正在领导需求评估,以评估科学家对人工智能和数据收集社区的看法了解和不了解的情况. 随后将发展伦理咨询和对其他小组的财团合作者的教育.

“从一开始就将伦理作为开发这一数据集的关键部分,将有助于确保基于它的下游研究有最大的机会产生利益,减轻而不是加剧健康不平等,” says Mathews.

The four-year project will likely generate huge amounts of data, and Christopher Chute, M.D., Dr.P.H., M.P.H., 约翰霍普金斯大学医学院彭博健康信息学特聘教授, is tackling standardization of the data.

Chute是AI-READI联盟中一个专注于数据标准的小组的联合领导. 该小组旨在制定一套标准和指导方针,以帮助确保数据格式具有可比性和一致性.

“To build a robust repository for future research, 科学家需要能够大规模地理解和分析数据,并将其与其他数据集无缝集成,” says Chute.

It comes down to semantics and syntax, Chute adds — which, in scientific terms, is called concept representation. 他说,为了处理大量的数据,它需要很容易地被计算机评估. For example, kidney and renal cancers are the same condition, but a computer doesn’t initially know this.

portrait photo of christopher chute

Christopher Chute, M.D., Dr.P.H., M.P.H.

While AI technology may be able to sort through some data inconsistencies, there is error associated with that, says Chute, 谁正在领导另一个项目,该项目在全国COVID-19患者抽样中收集了约180亿行数据.

To standardize the data, Chute将与研究人员合作,确定使用国际临床术语标准的通用数据模型的联盟指南. For data that is already being collected, 他的团队将帮助研究人员将其转化为可比较和一致的数据集.


“我们希望这个项目也能拓宽数据收集和人工智能技术的未来机会,” says Chute.