时政要闻
时政要闻
AI新工具探索“被忽视的DNA区域”

更新时间:2025-08-01     阅读:378 次

科技日报记者 张梦然

美国索尔克研究所开发出一种名为ShortStop的机器学习框架,用于探索以往“被忽视的DNA区域”,寻找在疾病中发挥关键作用的微蛋白。相关研究发表在最新一期《BMC方法学》上。

这些微蛋白是蛋白质家族中的小型成员,其组成氨基酸通常少于150个,因此难以通过传统蛋白质分析方法检测。长期以来,它们隐藏在基因组中被视为“非编码”或“垃圾DNA”的99%区域中,从未被充分研究。然而,越来越多证据表明,这些区域并非无用,其所编码的微蛋白在调节健康与疾病过程中扮演重要角色。

传统研究方法主要关注编码大型蛋白质的DNA区域,而忽略了可能包含微蛋白编码指令的小开放阅读框(smORF)。尽管已有实验方法识别出了数千个smORF,但这些方法成本高、耗时长,且无法有效区分具有生物学功能的微蛋白与无功能的序列,严重限制了相关研究的进展。

ShortStop的出现改变了这一局面。该AI工具通过机器学习训练,不仅能够从大型基因数据库中识别出潜在的smORF,还能预测哪些微蛋白最有可能具备生物学相关性,从而显著提高研究效率。其核心创新在于采用双类别排序系统:通过将真实发现的smORF与计算机生成的随机“诱饵”序列进行比较,ShortStop能够快速评估新发现的smORF是否可能具有功能性,从而优先筛选出值得深入研究的候选者。

团队将ShortStop应用于已发布的smORF数据集后,发现约8%的序列可能编码功能性微蛋白,并已将其列为优先验证目标。该工具还能识别出以往方法遗漏的微蛋白,包括在人体细胞和组织中实际表达的种类。尤为重要的是,它可直接利用广泛存在的RNA测序数据,这意味着许多实验室无需额外实验即可开展微蛋白研究。

在一项应用实例中,团队使用ShortStop分析了肺癌相关的遗传数据,从肿瘤与正常肺组织的对比中识别出210种全新的微蛋白候选者。其中一种微蛋白在肿瘤组织中显著升高,显示出作为肺癌生物标志物或治疗靶点的巨大潜力,验证了该工具在疾病研究中的实用性。

热门新闻
专家学者江西南昌探讨“AI+制造”赋能产业转型升级
2025-10-20
2025世界VR产业大会“中国联通生态论坛”20日在江西南昌举行,众多专家学者、重要嘉宾齐聚此间,深入探讨工业与AI、VR/AR融合的发展趋势。10月20日下午,2025世界VR产业大会“中国联通生态论坛”在江西南昌举行。江西省工业和信息化厅二级巡视员文杰表示,本届大会以“VR让世界更精彩——VR+AI开启数智未来”为主题,聚焦前沿科技与产业融合,探讨创新路径,引领产业新方向。江西在区位、政策、世
新型编解码方案让DNA存储从容恢复高错误率数据
2025-10-18
记者10月17日从天津大学获悉,该校应用数学中心与合成生物学国家重点实验室吴华明教授团队在《自然·通讯》发表最新研究成果,提出名为“StairLoop”的新型DNA存储方案,显著提升了在高错误率合成环境下的数据恢复能力。图为体外存储实验编码框架。随着全球数据存储需求飞速增长,传统的存储介质逐渐面临瓶颈,DNA因其存储密度高、稳定性强、环境友好等优势,被视为下一代存储技术的重要方向。然而,DNA存储
多国市长聚首西安 畅谈城市发展“锦囊妙计”
2025-10-17
“在基础设施、新能源汽车等领域,伊朗与中国的城市间藏着无限合作潜能。多国城市‘掌舵人’跨越山海,齐聚古城西安,分享城市建设的实践智慧,在交流中增进互信,在共识中推进合作。”伊朗德黑兰市市长阿里礼萨·扎卡尼向中新网记者说。10月17日,联合国工业发展组织“市长对话”活动现场。当日,2025年世界城市和地方政府联合组织理事会会议暨联合国工业发展组织“城市之桥”十周年特别活动期间,联合国工业发展组织“市