时政要闻
时政要闻
AI新工具探索“被忽视的DNA区域”

更新时间:2025-08-01     阅读:665 次

科技日报记者 张梦然

美国索尔克研究所开发出一种名为ShortStop的机器学习框架,用于探索以往“被忽视的DNA区域”,寻找在疾病中发挥关键作用的微蛋白。相关研究发表在最新一期《BMC方法学》上。

这些微蛋白是蛋白质家族中的小型成员,其组成氨基酸通常少于150个,因此难以通过传统蛋白质分析方法检测。长期以来,它们隐藏在基因组中被视为“非编码”或“垃圾DNA”的99%区域中,从未被充分研究。然而,越来越多证据表明,这些区域并非无用,其所编码的微蛋白在调节健康与疾病过程中扮演重要角色。

传统研究方法主要关注编码大型蛋白质的DNA区域,而忽略了可能包含微蛋白编码指令的小开放阅读框(smORF)。尽管已有实验方法识别出了数千个smORF,但这些方法成本高、耗时长,且无法有效区分具有生物学功能的微蛋白与无功能的序列,严重限制了相关研究的进展。

ShortStop的出现改变了这一局面。该AI工具通过机器学习训练,不仅能够从大型基因数据库中识别出潜在的smORF,还能预测哪些微蛋白最有可能具备生物学相关性,从而显著提高研究效率。其核心创新在于采用双类别排序系统:通过将真实发现的smORF与计算机生成的随机“诱饵”序列进行比较,ShortStop能够快速评估新发现的smORF是否可能具有功能性,从而优先筛选出值得深入研究的候选者。

团队将ShortStop应用于已发布的smORF数据集后,发现约8%的序列可能编码功能性微蛋白,并已将其列为优先验证目标。该工具还能识别出以往方法遗漏的微蛋白,包括在人体细胞和组织中实际表达的种类。尤为重要的是,它可直接利用广泛存在的RNA测序数据,这意味着许多实验室无需额外实验即可开展微蛋白研究。

在一项应用实例中,团队使用ShortStop分析了肺癌相关的遗传数据,从肿瘤与正常肺组织的对比中识别出210种全新的微蛋白候选者。其中一种微蛋白在肿瘤组织中显著升高,显示出作为肺癌生物标志物或治疗靶点的巨大潜力,验证了该工具在疾病研究中的实用性。

热门新闻
科技赋能产业向“新” 西安点燃高质量发展“新引擎”
2026-03-01
5G智慧医疗指挥中心的大屏上数据跳动,为患者构筑起数字时代的生命防线;新选育的“秦玉790”玉米良种正待破土而出,孕育着丰收的希望……科技创新正积极融入古城西安产业跃升的脉搏,成为推动经济高质量发展的核心驱动力。在正在召开的西安市第十七届人民代表大会第七次会议上,“科技创新”成为代表们口中的高频词。日前发布的西安市政府工作报告显示,2025年西安规上工业总产值突破万亿元大关,全社会研发投入强度保持
首届太空制造与太空经济创新发展大会在北京举行 成立专业联盟
2026-02-27
第一届太空制造与太空经济创新发展大会2月27日在北京举行。主题为“星途筑造商启苍穹”的大会上,由中国近百家高校、科研院所、企业、投资机构等共同发起组建的太空制造创新发展联盟正式成立,旨在推动构建产学研用金协同创新体系,促进太空制造产业化和太空经济新业态发展。2月27日,第一届太空制造与太空经济创新发展大会在北京举行。大会主席、中国科学院院士白春礼表示,太空制造是航天强国建设的核心支撑,是制造强国建
新春走基层| 智能工厂“不打烊”,中国“智造”开新局
2026-02-22
机器狗沿着预设路线穿梭巡检,AI系统实时分析废钢等级并自动判级……这个春节,在宁波钢铁的工厂里,数据流正替代传统流水线,成为驱动生产的新引擎。这家工厂只是中国制造业加速向“智”转身的一个缩影。近年来,以数据为核心的智能工厂正逐步成为制造业数智化转型的关键抓手。即便在春节假期,部分智能工厂依然保持运转,通过自动化产线与远程管控系统,确保生产不断档、供应链不掉链。在宁波钢铁的未来工厂,员工通过管控平台