原标题:腾讯宣布进入人工智能新药研发领域:帮助战胜不治之症
据有关统计,传统药物的研发费时费力,一般需要15年以上,耗资30多亿美元,但每年只有十几个原创新药上市。目前,4000多种已知疾病中有90%无法治愈。
如何加快新药研发?腾讯表示,为了解决这些困难,它在——年开始尝试发布第一个人工智能驱动的药物发现平台“iDrug”。它致力于帮助用户大大减少搜索潜在活性药物的时间和成本。“沈芸”起源于“但是透过这些云,我怎么知道是朝着山的哪个角落?”在唐诗《寻隐者不遇》中,这正是发现新药的过程。
基于腾讯人工智能实验室自主开发的深度学习算法,提供数据库和云计算支持,涵盖整个临床前新药研发过程的五个模块。
腾讯表示,其人工智能实验室开发了一种预测蛋白质结构的新思想,该算法已加入CAMEO(全球唯一的蛋白质结构预测自动评估平台),自2020年以来,该平台一直是业内顶尖的评估平台。
目前,该平台已经运行了约10个R&D项目——,包括抗新型冠状病毒药物的虚拟筛选和性质预测,目前筛选的化合物正在实验验证中。
该平台如何加速药物研发?
疾病的形成是由许多物质组成的,最终形成疾病的关键蛋白,这是我们设定的目标。
要解决目标,就有可能解决疾病。
要解决这个目标,我们需要知道它的蛋白质结构,然后找到相应的药物来破解它。
了解关键蛋白的结构,设计药物分子来抑制其功能,疾病就会得到缓解。
过去,通过实验找到针对疾病的有效药物往往是困难的、长期的和昂贵的。
从行业案例进入临床试验,在新药研发中,人工智能技术最早可以将新药研发周期从3-6年缩短到6个月到1年;从技术角度来看,沈芸智能医疗平台也有类似的功能。它可以在最快的时间内模拟锁的结构。
结合人工智能深度学习模型预测的蛋白质结构和蛋白质功能(蛋白质折叠),我们可以设计药物分子来抑制其功能并阻断疾病通路。
基于自监督学习的蛋白质折叠方法不依赖同源序列,而是通过自监督学习直接从序列数据库中学习协同进化模式,从而从头开始生成包含协同进化信息的伪同源序列,最终使这些蛋白质能够有效折叠。
通过基于深度学习的迭代方法,模板建模和自由建模有效结合,首次提出氨基酸对特异性的动态迭代约束条件,显著提高建模精度,从而更好地折叠蛋白质。
沈芸智能医疗平台不仅可以根据锁的类型和形状设计或选择合适的候选钥匙,还可以吸收他人的开锁经验,可以大大节省人力物力。
通过人工智能“迁移”(如分子局部结构对目标结合强度的影响)从其他目标获得的知识可以应用于目标目标,以提高模型的预测精度。
目前,该算法在数千个实验数据集上的中值预测精度(预测活动和实验测量活动之间的相关性)从当前的最高记录0.36提高到0.42,筛选出的可用模型的百分比从56%提高到60%。
IT House了解到,该平台还支持ADMET特性预测功能(药物的吸收、分布、代谢、排泄和毒性),目前已经是开源的。平台上的小药物分子ADMET属性预测模块比学术界现有的多数据集最佳模型提高了3% ~ 11%;根据合作伙伴的反馈,该平台自主开发的算法准确率比现有商业软件高出6%~37%。
当然,
在现有公共数据集的基础上,对沈芸智能医疗平台使用的分子大数据进行了多环节的仔细清理和排序,获得了可用于直接构建深度学习模型的药物分子大数据集。
在计算能力方面,腾讯云为沈芸智能医疗平台提供数据库服务。
制药公司和科研机构可以登录该平台进行研究,而不需要自己部署计算资源,这样就可以尽快将人工智能能力引入到现有的R&D过程中。