晶泰科技赖力鹏:化学空间里的搜猎者

快讯

康谈网 四百味 2017-11-29 16:20:29

摘要 现在的制药业特点是成本高,且研发时间长。很多的实验就像在一片漆黑当中寻找目标。而赖力鹏团队希望做到的,是...

晶泰科技

晶泰科技赖力鹏:化学空间里的搜猎者

  编辑丨尹磊

  现在的制药业特点是成本高,且研发时间长。很多的实验就像在一片漆黑当中寻找目标。而赖力鹏团队希望做到的,是运营用计算的方式,在这一片漆黑当中准确发现可供药企开发***的分子结构。

  在近日《四百味》举办的大健康创业者沙龙中,晶泰科技(XtalPi)联合创始人赖力鹏为我们分享了如何从量子物理跨界到新药研发,并在云端推动医药行业的变革。

  ▲ 赖力鹏 晶泰科技联合创始人、大数据与人工智能研发负责人 (Co-founder, Lead of Big Data and AI R&D, XtalPi )北京大学物理学、数学(双学位)学士学位,芝加哥大学物理学博士学位,麻省理工学院博士后(SUTD-MIT Graduate Fellows)。目前在北京主要带领团队研究 AI 技术在***创新方面的应用,致力于利用深度学习算法结合化学、生物数据加速***发现、研究与开发。同时希望借助团队自身积累,促进 AI 技术在更多的基础科学研究领域的应用,与高校研发人员合作,利用 AI 算法加速、深化各领域的研究项目。

  以下为晶泰科技(XtalPi)联合创始人赖力鹏先生现场演讲,经《四百味》编辑整理。

  ▲ 来源:http://matt.might.net/articles/phd-school-in-pictures/

  首先给大家看一张图,这些图形代表了什么?

  和大家解释一下,这整个圆圈代表的是人类的知识,中间蓝色的,是我们小学学的知识、绿色是中学的知识,而粉红色表示我们大学学到的知识,读到了博士,越学越深,就到了深红色部分。我们把它放大看,会发现一个很小的凸起点,这表示触及到了人类知识的边缘。

  其实读了那么多年书,我就是在图上最外围的那个圈上,戳出了一个小点,这其实是一个挺有意思的事。我们之后的创业,以及现在我们发展技术的模式,其实都和这个小点有密切的关系。

  现在的制药业不知道大家是否了解。这个行业目前的特点是:第一成本特别高;第二研发时间特别长。其中最大的问题是传统实验方式存在很大的不确定性。打个比方,很多的实验就像在一片漆黑当中寻找目标。而我们希望做到的,是运营用计算的方式在这一片漆黑当中准确发现可供药企开发***的分子结构。

  关于***研发,我们用几个数字来和大家解读:目前平均一个***的研发时间,从开始设计到送到大家手上,需要15年的时间,研发成本大概是十几亿美元,如果把失败成本也算上,可能接近40亿美元。

  但是和这个对比的问题是,用了更长的时间和更高的研发成本之后,我得到的是一个更低的成功率,所以这个里面有一个问题,我花了更多的钱、更多的时间,但是成功率没有提高。

  在整个***研发的过程中,晶泰科技主要涉及的是其中的前半部分,也就是***的发现和设计的部分。后半部分大概6-8年的时间是用在临床以及政府审批中,我们主要做的是前面6-8年——从***的发现、筛选到优化和临床前的实验部分。

  过去十年,***的研发费用提高了1.5倍,但是如果大家去看FDA审批的***,大概每年也就只有20到30个成果,相较十年前,实际并没有明显的增加。

  我们几个创始人的背景,主要集中在量子力学、人工智能和云计算方面。大家看到***研发的这个悖论,我们现在做的事情就是把化学基础研究的算法应用到传统***研发领域,我们希望用在这种新的算法推动下的跨界,解决***研发的困境,用量子力学+人工智能和云计算这把钥匙,去打开新药这把锁。而这个技术也是最难的。

  下面我要讲两个具体的例子,因为涉及到太多专业的东西,我希望用两个简单的例子帮助大家理解我们到底是干什么的。

  第一个我们公司的主营业务是通过量子力学+云计算来切入***的研究,可能大家都不知道我在说啥。打个比方,大家知道碳是一个非常重要的元素,它可以形成金刚石,也可以形成石墨,它们的组成模式都是碳,但是性质不一样,金刚石非常值钱,而石墨(在石墨烯被发现之前)并不太值钱。***里面也有同样的问题,比如说阿司匹林不同结构在体内吸收的效果是不一样的,所以药企关注的是我怎么找到一个好的结构,当把药投放到市场上的时候,它是药效最好的一个。

  再讲一个例子:有一家海外药企,它们有个***的年销售额大概在60亿美元,但这个***的分子专利会在2016年过期。大家知道,***一旦过期,仿制药就可以上市,随之而来是大量价格便宜的***进入市场。而这个企业的需求,是希望能够独占这个市场更长的时间。于是发现在分子专利之外,有个更重要的专利叫***晶型专利。这个晶型专利到2026年才会过期,也就是说,它让该***独占市场的时间足足延长了十年。所以,有了我们这种计算方法,可以对于所有的晶型做一个全方位的筛选。去年在与这家外企合作时,我们调用了接近上万个CPU的资源。

  就像我最开始说的,通过一个小点,我们在工业领域慢慢建立起了技术壁垒,并正在给一些大型跨国药企提供技术服务。我们目前在做和下一步希望做的是,以这个点为基础,利用以往的模型和人工智能的技术,快速扩展我们的技术服务范围。

  机器学习已经非常火了,而且机器可以做很多事情,可以识别不同的对象,且识别率比人还要高,甚至可以去创造艺术和科学的发现,至于是不是创造艺术这个是一个很有争议的事情,至少我看机器开始创造一些东西了。

  7月份的时候媒体上有一篇核心报道,说到当我们回头去看***分子的化学空间时,发现***分子的数量大概是10的60次方那么多,这和宇宙当中所有星星的数量其实是等同的。我们甚至可以判断,***分子的数量远远大于星星的数量。

  另外一个事实是,现在可能有70%的***还没有有效的治疗方式,我们有没有什么方法可以在目前计算力能够负担的时间范围内,去尽可能探索未知的化学空间呢?一个可能的方向就是我们利用人工智能的方法,对剩余的空间进行有效的探索,这也是我们现在重点发展的方向。

  这个是一个简单的例子,我们用深度神经网络对***溶解度做了一个预测,相当于把盐放在水里搅一搅,它就溶解了,但是这个性质对药来讲是非常重要的性质,它决定了这个药在体内多长时间会吸收?如果吸收太快,可能会有毒,如果吸收太慢,可能就被排出体外了,所以这个很难。要有化学分子我必须找很多有化学经验合成的化学家去做,这个难度比较大,也就是说我发现一个***分子大概要花半年的时间才能知道它适不适合做药。我们对比了传统方式和机器学习的方式,发现后者比前者的误差要小一半。

  所以说从我们的经验来说,刚才的溶解度只是其中一个方法,现在我们能够把自己的这套方法对于ADMET(***的吸收, 分配, 代谢, 排泄和毒性)接近20个不同的属性作为准确的预测。ADMET的五个属性,贯穿了整个***设计和研发,从一开始到临床的所有阶段,对于这些属性能够做到一个准确预测的话,就能够大大提高***的成功率,并且缩短它的研发时间。

  同时我们也有自己的基于神经网络的深层做法,我们现在能够做到的事,就是有台一周24X7小时不停云状的机器,去生成相似的分子结构,同时可以很快对分子各方面的属性进行有效的筛选。我们现在能够做到一天筛选的分子大概有十几万个,虽然离10的60次方还很远,但至少这是一个好的开始。

  从一个技术点向外扩展,我们希望这个技术能够慢慢的扩散下去,帮助到***研发的各个方面。我们觉得,人工智能用在***研发领域,第一就是在短期之内可以明显的提高***研发的效率和成功率,这些都可以帮助到药企。但是我们觉得从长远来讲,它可以重新定义***研发的工作流程。过去很多的实验你必须得到分子实体之后才能进行,有了这种虚拟筛选的技术,像溶解度、毒性你之前就可以做到一个预测,当预测达到一定准确度之后,就可以大大帮助药企们节省实验时间和成本开销。

  跟大多数的机器学习一样,整个算法的成功也十分以来于数据。那么我们目前获取数据的来源主要是有三个方向:

  第一,公共的数据。像美国的药监局和中国的药监局非常重视这件事情。

  第二,我们自己的长处。我们是做计算化学起家,所以用量子力学的方法可以计算得到大量高准确度的模拟数据,基于这些数据,我们可以训练机器的学习模型。

  第三,来自于跟药企还有科研院所的合作。他们有很多的数据,这个不同于传统研究,可能在传统实验里大家看重数据,就是哪些是做成了的?而对于机器学习来说,它是不区分成功数据和失败数据的,所以我们把成功数据和失败数据结合起来,可以得到很好的结果。

  这也是我刚刚讲的,虽然我们只戳了一个小点,但那个小点是非常基础的东西,在它的上层就可以有非常广阔的应用。

  现在主要将人工智能和计算应用于***研发的企业,大多数是来自于美国和欧洲,在国内,我们重点集中在效果分子化学***的研究。晶泰科技的目标,就是希望把人工智能和计算化学的技术结合在一起,因为我们目前来看在短期提供一个通用的人工智能模型可能还是一个需要花很多时间和研究的事情。我们希望把这种人工智能的算法能够和传统的计算化学结合到一起,来去加速***的研发。

  所以我觉得现在发展的一个机会:第一是有越来越多的数据;第二是计算资源越来越可获取。

  我们自己在腾讯和阿里上面加起来可以调用的CPU的核数可能超过一百万个CPU,是依赖于这种庞大集散资源的支持,我们才有现在的发展。这里面的挑战是,生物系统可能是一个最复杂的系统之一了,我自己背景是做物理的,物理和生物最大的区别,就是任何物理模型把它弄到生物里面就失效了。每个人的个体其实都有很多的不同,***最明显的就是一个靶向***可能在这一群人身上就有作用,在另一群人身上就没有作用,现在还不知道是为什么?我们倾向于特定的靶向***,结合我们自己在化学、计算、生物甚至IT方面的优势,结合药企在***研发上的优势,来共同开发照顾患者的***。(四百味)

  文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

康谈网(www.kangtan.com)是定位于关注健康产业。想分享健康产业干货?发邮件至 news@kangtan.com,我们会第一时间与你联系。

康谈网 读懂健康

关注康谈,收听和分享“健康”

携手康谈网,为您提供更多健康新鲜货。

热门阅读

X