人工智能助力医疗,精准找出治病物质
在制药过程中,药物(wù)被淘(táo)汰的原因众(zhòng)多,其中(zhōng)之一就在于其对细(xì)胞色素(sù)P450的(de)消极(jí)抑制作(zuò)用。细胞色(sè)素P450是一组(zǔ)主要在肝(gān)脏中产生的(de)酶,通常被称为CYP450,参与分解化(huà)学物质(zhì),防止它们在血液中积累到危险的水平。然而(ér),事实证明,许多(duō)实验(yàn)药物都能抑制CYP450的产生,这种的副作用(yòng)会使药物对(duì)人体产生毒性。
制药公司一(yī)直依赖于(yú)传统医学工具来(lái)预(yù)测药物是否会抑制患者体内(nèi)的CYP450,比如在试管中(zhōng)进行化学分析,观察CYP450与具(jù)有化学相似性的(de)药物(wù)之间的相互作用(yòng),以及在小白(bái)鼠身上进行实(shí)验(yàn)。但是这样的预(yù)测可(kě)能并(bìng)不(bú)准确。在某些情况下,CYP450相关毒性只有在(zài)人体试验(yàn)中才会被发现(xiàn),导致付诸的金钱(qián)多年的努力白费。就在(zài)这(zhè)个关键(jiàn)时刻,AI制药重新进入了大众视野(yě)。
弥补传统制药弊(bì)端,AI制(zhì)药效率大幅提(tí)高
制(zhì)药的(de)低效率引(yǐn)出了一个更严肃的(de)问题:至少20年(nián)来,价值(zhí)1万(wàn)亿美元(yuán)的全球制药(yào)行业一直处于药物(wù)开发低(dī)迷、生产(chǎn)率下滑的状态。制药公司的(de)金钱投入越来越多(duō)——10家最大的制(zhì)药公司现在(zài)每年花费近800亿美元(yuán)——研发出(chū)的有(yǒu)效药物却越来越(yuè)少。十年前(qián),若投入(rù)一(yī)美元来研发药物,就能(néng)收到10美分的回报;如今(jīn),收(shōu)益率却不足2美分。某种(zhǒng)程度上,这是因(yīn)为用于治疗常(cháng)见疾病的药物都已经找到了,只剩下开发用于解决(jué)复杂(zá)疾病(bìng)的药物,这(zhè)些药物只能治疗一小部(bù)分人的疾病,因此能(néng)够获(huò)得(dé)的(de)收益(yì)也(yě)要少得多。
根(gēn)据塔夫茨(cí)药物(wù)开发研究中心的数据,近年(nián)来,药物上市的平均成本几乎翻了一番,达(dá)到26亿美(měi)元之(zhī)多。药物(wù)从在(zài)实验室中诞生到流入市(shì)场的(de)时(shí)间线被延长到了12年,而有90%的(de)药(yào)物在人(rén)体试验的阶(jiē)段就(jiù)被淘汰。
因此,研究人员对AI在药物研发方面(miàn)的高涨热情也就不足为(wéi)奇了。用户只需要给AI工具提(tí)供样本(某种分子(zǐ)结构)和相应的解决方案(分子最终如何被制成药物),它们就可以开发自己的计算方法来快速(sù)产生相似(sì)的(de)制药方案。
AI(右)能更准确地找到致病(bìng)肿瘤(liú)
大多数机器学习程(chéng)序(xù)可以处理小(xiǎo)数据集,而深(shēn)度学习程(chéng)序可以处理大量原始的(de)、非结构化的数据。一个深度学习(xí)的版本可以从未标(biāo)记的细胞图像中(zhōng)进行分子(zǐ)结(jié)构(gòu)辨识,不(bú)过,它可能需要(yào)查看上百(bǎi)万个细胞样本才能做到这一(yī)点。
最终,AI将(jiāng)在以(yǐ)下几个方面(miàn)改善药物开发:1.识别更(gèng)有效的候选(xuǎn)药物;2.提高药物测(cè)试(shì)的“命(mìng)中率”,即(jí)通过(guò)临床试验并获得监管批准(zhǔn)的候选人的百(bǎi)分比(bǐ);3.加(jiā)速整(zhěng)个制药过程。
百时美施贵宝(Bristol-Myers Squibb)最近部署了一个机器学习程序,该程序经过训练,已能(néng)够在大(dà)量细胞样本(běn)中发现与CYP450抑制效用相关的(de)分子结(jié)构。Saha说,该程序将测(cè)试(shì)准确率提高到95%,与传(chuán)统方(fāng)法相比,失败率降低近6倍。这些结果帮助(zhù)研究人员迅速筛(shāi)选出可能有毒(dú)的药物,转而关注(zhù)那些有更大希(xī)望通过多项人体试(shì)验、获(huò)得美国食品(pǐn)和药(yào)物管理局(jú)批准的候选药(yào)物。礼来(Eli Lilly)首席(xí)数据和分析(xī)官维平•戈帕尔(Vipin Gopal)表示(shì):“在(zài)我们(men)进行投资(zī)之前,AI就能帮助我们在(zài)早期排除掉那些潜在的无效(xiào)用药(yào)物。”
人工智能软件可以预测哪些化合物可能与目标蛋白结合,以(yǐ)帮助缩小候选药物的范围
生物医学(xué)研究人(rén)员认识到(dào),像(xiàng)癌症(zhèng)和阿尔茨(cí)海默病(bìng)等这(zhè)般复杂的疾病(bìng)所涉及的涉及蛋白质达数百种,如果(guǒ)研发的药物只攻击其中一种蛋(dàn)白质,则不太(tài)可(kě)能对整个(gè)病毒本身(shēn)造(zào)成(chéng)破坏。Kurji解释说(shuō),Cyclica正(zhèng)试图寻找能与几十种(zhǒng)目标蛋白(bái)相互作用的单个化合物,同时避免与其他(tā)蛋白(bái)相互作(zuò)用(yòng)。他补(bǔ)充说,目前正在(zài)开(kāi)发的AI 程序(xù)旨(zhǐ)在将大量关于蛋白(bái)质变异的遗传数(shù)据整合在一起,这(zhè)样AI助手就可以检测出(chū)哪些(xiē)候(hòu)选药物最有效。
苏格兰邓迪(dí)大学医学信息学教授安德鲁•霍普(pǔ)金斯(Andrew Hopkins)提出了ex唯科学算法,这个算法只需分析10个蛋白质数据就能(néng)得到有效信息。它将(jiāng)目标蛋白的生(shēng)物数据(jù)与大约10亿个蛋白质相互(hù)作用的数(shù)据库(kù)进行(háng)比较。生成(chéng)的(de)新数(shù)据(jù)被输入到程序中(zhōng),程序(xù)再次(cì)对列(liè)表(biǎo)进(jìn)行精简,并分析另一轮所需的数据。这个过程重复进行,直到程序准备好生成一(yī)个易(yì)于管理的化合物列表,而这(zhè)些化合物正是目标药(yào)物的良好(hǎo)候选。
霍普金斯声(shēng)称,ex唯(wéi)科学的(de)算法可以将药(yào)物的发现时间从4.5年缩短到1年(nián),将发(fā)现成本(běn)降(jiàng)低80%,合成化合物的数(shù)量也会减少到通常生产一(yī)种成功药物所需(xū)的五分之一(yī)。目前,他正与生物科技(jì)巨头Celgene合作,努(nǔ)力为(wéi)三(sān)个目标寻找新的潜在药物。
精(jīng)确(què)定位目标蛋白!
为了发现可能致(zhì)病(bìng)的蛋(dàn)白(bái)质,生(shēng)物制药公司Berg也利用AI助(zhù)手来筛选人体组织样本的生物信(xìn)息(xī)。Berg软(ruǎn)件的方法是(shì)把从病人的组织样本、器官液体和血样中提取的每一份(fèn)数据都输入程序。样品中(zhōng)的活(huó)细胞被(bèi)用于各种实验,如测试其高(gāo)葡萄(táo)糖水平(píng)。这种方法生成(chéng)多种数据,涵盖细胞(bāo)产生能(néng)量的能力和细(xì)胞(bāo)膜(mó)的(de)硬度。
然后,所有的数据都通过(guò)一系列深度学习程序运行,这些程序寻找非(fēi)疾病状态和疾病状态之间的特征差异,最(zuì)终(zhōng)着(zhe)眼(yǎn)于那些含毒性的蛋白质。在某(mǒu)些情(qíng)况下,这(zhè)些(xiē)蛋白质可能成为靶(bǎ)标,这时Berg的(de)AI软件就可以寻(xún)找药物来攻击这些(xiē)靶标。更重要(yào)的是(shì),因为该软件可以(yǐ)识别目标似乎只在一小部分患者身上引起疾病,所以它可(kě)以识别这(zhè)些患者(zhě)的区别性特征。这意(yì)味着患者(zhě)可以在服用药物之前进(jìn)行(háng)测试,以确定药物是否可能对他们有效。
目前,Berg正在与制药(yào)巨头阿斯利康(AstraZeneca)合作,寻找治(zhì)疗帕金森氏(shì)症和其他神经系统疾病的目标,并与赛诺菲(fēi)巴斯德(Sanofi Pasteur)合作(zuò),以改良(liáng)流感(gǎn)疫苗。Berg软件已经确定了诊断测试(shì)的机制,可(kě)以区分前列腺癌和良(liáng)性前列(liè)腺肥大症,而这些病症(zhèng)如果(guǒ)不(bú)做手术则很难区(qū)分。