6月27日下午,由华南农业大学动物科学学院主办的“动科大讲坛”2025年第4期(总第133期)在温氏楼三楼报告厅成功举行。香港中文大学计算机科学与工程学系李煜教授应我院闫希亮老师邀请,作题为《Complex disease modeling and efficient drug discovery with large language models》(基于大语言模型的复杂疾病建模与高效药物发现)的学术讲座,吸引了众多师生到场聆听。
——内容回顾——
图1.jpg
李煜教授围绕“AI驱动的生物医药创新”主题,聚焦当前生物计算领域面临的前沿挑战。在RNA研究方面,他引用PDB数据库关键数据,指出非编码RNA在三维结构和功能注释上的双重缺失成为药物开发的“信息瓶颈”,并强调“2700万条RNA序列中潜藏着远超蛋白质的靶点潜力”,但因缺乏有效注释尚未被系统性挖掘。在疾病机制解析方面,他介绍了团队提出的全基因组嵌入维度关联分析(GWEA),通过表型网络拓扑特征量化,成功定位108个与复杂性状相关的遗传位点,其中40个位点为首次报道,展现了多模态数据整合在复杂疾病研究中的广阔前景。李煜教授还介绍了其团队所开发的基于蛋白质大语言模型的信号肽识别方法USPNet。该模型融合BiLSTM与蛋白语言模型嵌入,在无需依赖物种信息的前提下,即可高效识别包括Sec/SPI、Tat/SPI等五类信号肽及其切割位点,显著提升了对微生物组等复杂数据中的未知信号肽的预测能力。研究还展示了其在猪肠道宏基因组数据中发现347条潜在新型信号肽的成功应用,极大拓展了传统算法在蛋白分泌研究中的边界。此外,李煜教授结合自身科研经历,与在场师生分享了如何在快速发展的交叉领域中识别有价值的科学问题。他强调,科研的核心在于“提问”,并鼓励青年学者在探索前沿技术时,始终保持问题意识与批判思维。讲座内容详实、互动积极,现场气氛热烈,赢得了师生们的一致好评。
图2.jpg
——主讲嘉宾简介——
李煜,博士,香港中文大学计算机科学与工程学系教授,人工智能医疗(AIH)团队负责人,生物科学学士、计算机科学硕士、博士。主要领域为人工智能与医疗健康交叉研究,聚焦机器学习在生物信息学中的应用,包括:RNA结构预测与计算设计、生物大分子计算建模、结构化学习在健康医疗系统的应用等。荣获MIT TR35中国区创新者(35岁以下)、亚太地区青年领袖(APEC-2024)、香港中文大学校长模范教学奖、福布斯亚洲“30位30岁以下精英”(医疗健康与科学领域)等荣誉与奖项。以第一/通讯作者发表论文42篇,其中包括Nature Biotechnology、NatureMethods、Nature Computational Science、Nature Communications等8篇Nature子刊。