暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

AI 研发动态

nirvana 2024-11-04
127

MaCo模型:降低注释需求,提升医疗影像诊断新高度


中国科学院深圳先进技术研究院的研究团队提出了 MaCo 模型,旨在通过减少对大量人工注释数据的依赖,提高医疗诊断的效率和准确性。研究团队利用 MaCo 模型实现对胸部 X 射线图像的高效分析和异常识别,有望为医学图像分析提供新的技术路径。研究发表在 Nature Communications 上。


MaCo(Masked Contrastive Model)是一种基于掩蔽对比学习的视觉语言基础模型,专为胸部 X 射线分析而设计。该模型通过利用掩蔽对比学习方法实现了对图像细节的深度理解,并在多项任务上展示了出色的表现。研究团队使用六个开源的 X 射线数据集进行了多项标签高效的微调实验,包括分类、分割、检测等任务。结果显示,MaCo 在不同注释级别的任务中优于超过十种现有方法,在零样本学习方面尤为出色。相关性加权机制的应用,使得模型能够有效地关注 X 射线图像中的重要区域,从而提高异常识别和定位的精准度。这一成果展示了 MaCo 的潜力,能够在显著降低注释成本的同时,提升医疗影像分析中的诊断性能。

#神经技术 #多模态模型 #自动诊断 #掩蔽对比学习 #影像分析


阅读更多:

Huang, Weijian, et al. “Enhancing Representation in Radiography-Reports Foundation Model: A Granular Alignment Algorithm Using Masked Contrastive Learning.” Nature Communications, vol. 15, no. 1, Sept. 2024, p. 7620. www.nature.com, https://doi.org/10.1038/s41467-024-51749-0


虚拟放牧奶牛游戏揭示人类导航决策规律


最新的合作研究开展了一项关于人类运动和导航决策的研究,其中研究员 Ayman Bin Kamruddin 开发了一款第一人称放牧游戏,旨在模拟人类在复杂环境中的决策过程,以改善未来人机交互及机器人运动模式。


研究人员通过一款放牧虚拟牛的第一人称游戏探讨人类在动态感知运动原语(DPMP,dynamical perceptual-motor primitives)指导下的决策行为。参与者需要在游戏中将虚拟奶牛圈入围栏,研究团队记录了其运动轨迹和选择顺序。分析显示,DPMP 模型能够有效地模拟参与者的移动路径,并预测约 80% 的目标选择决策。在多目标场景中,参与者倾向于选择角度上最近的目标,且会优先选择距离围栏中心较远的奶牛。该研究显示,通过包含智能决策策略的 DPMP 模型,可精确再现人类复杂的运动行为,有望应用于人群管理、虚拟现实中的训练、消防训练和救援任务等领域。研究发表在 Royal Society Open Science 上。

#认知科学 #人机交互 #虚拟现实 #动态感知运动原语 #机器人导航


阅读更多:

Kamruddin, Ayman bin, et al. “Modelling Human Navigation and Decision Dynamics in a First-Person Herding Task.” Royal Society Open Science, Oct. 2024. world, royalsocietypublishing.org, https://doi.org/10.1098/rsos.231919


AI设计DNA开关,精准操控基因表达


麻省理工学院、杰克逊实验室、哈佛大学布罗德研究所及耶鲁大学的联合研究团队近日在Nature杂志发表了一项基于人工智能的新研究,展示了通过人工智能设计合成顺式调控元件(CRE),可以在不同细胞类型中精确控制基因表达。这项研究克服了当前基因疗法中缺乏特异性的难题,为未来精准医疗和基因治疗带来了新希望。


研究团队利用人工智能深度卷积神经网络(Malinois)模型,通过分析跨细胞类型的CRE活性,设计了成千上万种合成顺式调控元件(CRE),从而实现特定细胞类型的基因表达控制。Malinois模型通过大规模并行报告分析(MPRA)技术进行了验证,在三种不同的细胞系中准确预测CRE的活性。团队随后开发了合成CRE设计方法CODA,并在小鼠和斑马鱼中进行了跨物种验证。研究发现,合成CRE能显著提高靶向特定细胞类型的基因表达精度,同时抑制非靶向细胞中的基因活性。


此外,该团队展示了CODA设计的CRE比天然CRE更具特异性,表明人工智能设计的DNA开关不仅适用于实验模型,还在生物复杂组织中展现了跨物种的可移植性。这种人工设计的基因表达控制工具,未来可能广泛应用于生物制造、基因疗法等领域,为疾病特异性治疗提供更安全、高效的解决方案。研究发表在 Nature 上。

#神经技术 #基因编辑 #人工智能 #细胞类型特异性 #基因表达调控


阅读更多:

Gosai, Sager J., et al. “Machine-Guided Design of Cell-Type-Targeting Cis-Regulatory Elements.” Nature, vol. 634, no. 8036, Oct. 2024, pp. 1211–20. www.nature.com, https://doi.org/10.1038/s41586-024-08070-z


数字医疗赋能风湿病护理新模式


风湿病学领域面临医疗专业人员短缺、人口老龄化及成本上升等多重挑战,致使护理缺口不断扩大。近年来,数字医疗技术(Digital Health Technologies, DHT)以指数速度发展,为应对这些问题提供了全新机会,并可能提升整体医疗质量。然而,将这些创新引入临床实践并非易事。近期综述指出,DHT在重塑患者路径和重新定义患者与提供者角色方面具有颠覆性潜力,但同时也面临整合障碍。


综述还提出了一种“数字优先的混合阶梯式护理”模式,通过结合面对面和远程护理,为患者提供个性化和连续的健康监测。此模式在提升护理灵活性的同时,能有效减少不必要的就诊,优化资源配置。然而,将患者与医疗提供者关系转变为“数字健康三位一体”带来技术引入的潜在风险,也亟需解决监管、报销和数据证据方面的障碍。只有通过合作,共同驾驭数字健康的复杂格局,才能实现DHT在风湿病护理中的潜力。

#风湿病学 #数字医疗 #大语言模型 #患者路径 #混合护理模式


阅读更多:

Knitza, Johannes, et al. “Rheumatology in the Digital Health Era: Status Quo and Quo Vadis?” Nature Reviews Rheumatology, Oct. 2024, pp. 1–13. www.nature.com, https://doi.org/10.1038/s41584-024-01177-7


使用ChatGPT提示增强编程学习效果


在现代技术驱动的环境下,编程教育日益受到关注。来自北京大学的研究团队在探索如何通过提示引导ChatGPT,更有效地辅助编程教育。团队希望为大学生编程学习的提升提供新的解决方案。


该研究采用准实验设计,将30名大学生分为两组,分别接受基于提示学习(PbL)和无提示学习(UL)的编程教育。在为期一个学期的实验中,PbL组的学生不仅在Python编程上表现更出色,还更倾向于独立提出复杂问题,并获得更高质量的反馈,而UL组学生则大多采取浅层次互动,尽管能获得准确反馈但学习效果略逊。研究还显示,PbL组在使用ChatGPT后表现出更强的学习意图和实用性感知,尤其在结构化提示和分隔符帮助下,学生能够更好理解编程步骤,从而提升学习效率。该研究为未来编程课程设计提出了建议,强调使用结构化提示能显著提升编程教育效果。此项研究发表在 Humanities and Social Sciences Communications 上。

#认知科学 #编程教育 #人工智能 #学习效率 #技术接受模型


阅读更多:

Sun, Dan, et al. “Investigating Students’ Programming Behaviors, Interaction Qualities and Perceptions through Prompt-Based Learning in ChatGPT.” Humanities and Social Sciences Communications, vol. 11, no. 1, Oct. 2024, pp. 1–14. www.nature.com, https://doi.org/10.1057/s41599-024-03991-6


视觉系统背后的共同原则


近年来,科学家利用深度神经网络(DNN)研究大脑视觉系统,深入探索高层视觉表征的形成规律。此次研究由多个机构的研究人员共同完成,旨在通过不同视觉模型的数据对比,揭示影响视觉表征的核心因素。研究团队包括了视觉科学、神经科学和机器学习领域的科学家,他们利用开源DNN模型的多样性,从多方面分析其与大脑的预测性关系。


研究团队对224个不同架构和任务目标的视觉模型进行了控制变量实验,累计完成18亿次回归分析和50300次表征相似性分析,测试模型对大脑的预测能力。首先,研究发现,虽然卷积神经网络(CNN)与变压器(Transformer)在架构上差异显著,但在其他条件相同下,二者在大脑预测性方面表现相近。视觉任务类型也未显著影响结果,例如纯视觉对比学习与视觉语言对齐的模型在预测性上表现相当。


真正产生显著影响的是视觉训练数据集(或称“视觉饮食”)。在仅变动视觉数据集(例如仅人脸、仅地点等)的条件下,不同模型的视觉表征表现出最大的差异,表明训练数据对预测性能的作用显著。许多模型尽管在内部表征上存在差异,但都能实现相似的高预测性,研究团队认为这表明现有的模型-大脑关联方法过于宽松,难以准确反映模型间的微观差异。


总之,此次研究表明,视觉训练数据的选择在大脑预测性上影响最大,挑战了以往对模型对齐大脑的普遍假设。通过深入对比分析,这项研究为理解生物和人工视觉系统的共同计算原则提供了新的视角。研究发表在 Nature Communications 上。

#神经技术 #深度学习 #视觉表征 #计算神经科学


阅读更多:

Conwell, Colin, et al. “A Large-Scale Examination of Inductive Biases Shaping High-Level Visual Representation in Brains and Machines.” Nature Communications, vol. 15, no. 1, Oct. 2024, p. 9383. www.nature.com, https://doi.org/10.1038/s41467-024-53147-y

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论