具有精确度的变异序列的搜索

变异序列序列变异IP的世界是复杂而混乱的,充满了法律风险,但是有一个解决办法,正如GQ生命科学的艾伦·谢林所报道的。金博宝美式足球

预计到2021年,全球生物工程蛋白药物市场将达到2284亿美元,从2016年的1725亿美元增加到2016年,从2016年到2021年,以5.8%的复合年增长率(CAGR)增长,根据BCC研究。

《APL生物工程》杂志估计,到2018年,全球工业酶市场,其中许多是序列变体,将超过71亿美元大关,其五年CAGR约为8.2%。

随着生物工程和合理的设计,出现了变异序列:在蛋白质或DNA序列中做出的一个或多个改变,以便给正在研究的分子赋予期望的特性。一个快速文本搜索与发现近90种变异蛋白相关的专利,000个家庭和188,1000份专利文件;24,226个家庭和将近40个,仅过去两年就有000份文件。这种大量的IP要求有效和高效的变体搜索。

使用现有工具进行变异搜索是非常困难和劳动密集的,需要多个变通方案来获得可能不完整的结果。因为它没有得到很好的理解,而且可以得到的培训也很少,变异搜索不像其他形式的序列搜索那样常规地进行。因此,错过机会,冒不必要的风险。

尽管序列变异搜索适用于广泛的技术和应用,这些挑战和潜在的方法有许多共同点。

有两种基本的搜索类型:

  • 特定位置的单点突变:SNP,谷胱甘肽转移酶基因编辑;和
  • 多位置变化:酶优化。
  • 这些变化可以是广泛引用的公共主干上的变化,或者,在最简单的情况下,在序列的窄参考区域上的单点突变。对于多个变体,通常搜索变化的多个组合,不仅仅是一个变化。

单一的

直观地说,单个位置改变是最简单的搜索情况。查询序列是用期望的更改编写的,进行的搜索,以100%的同源性进行筛选。这将返回所有单次更改的命中次数。然而,此方法还会遗漏其他潜在的范围内结果。

可变位置可以具有不同的残余或退化特征而不是定义的残基,或者,在命中序列中可能存在额外的更改,这些更改将通过100%标识过滤器移除。

使用当前方法,将百分比识别和特定于坐标的筛选与适当的序列搜索算法相结合的双管齐下的方法提供了最佳结果。为了找到这种性质的命中,需要使用较低百分比的身份过滤器,结合特定于坐标的屏幕,将结果缩小到覆盖变化区域的结果。

这种方法的局限性在于劳动密集;每个不是精确匹配的结果必须手动检查是否存在期望的变化。没有一种自动方法将结果限制为一个位置特定的更改,而不会丢失其他潜在的范围中的结果。

倍数

多位置变化要困难得多。一个例子见美国专利号20150087572:

“一方面,一种包括母体蛋白酶的变异蛋白酶的自动洗碗剂组合物,所述亲本蛋白酶氨基酸序列与SEQ ID NO:1的氨基酸序列相同,所述亲本蛋白酶突变的变体蛋白酶,所述变体蛋白酶包括下列突变组之一相对于所述亲本蛋白酶:

  • N76D+S87R+G118R+S128L+P129Q+S130A。“

这是一个极其狭隘的例子。通常例示和/或声称有十个或甚至数百个组合,并且通常甚至组合的单独组件本身也是如此。正因为如此,这种类型的搜索的最佳实践通常是搜索元素的任何组合,IE报告只包含N76D的命中,例如,或N76D和S87R,等。

为了做到这一点,需要诸如MOTIF(GenomeQuest)或STN模式188bet拳击匹配的算法。因为这些算法需要对所有剩余区域100%的同一性,即使只有一次失配也会导致失误。绕过100%身份要求的一种方法是在变体之间进行通配符干预,所以不匹配将被忽略。这是有效的,但这不是保证,因为为了具有合理的特异性,有必要保留一些侧翼区域。

此外,由于每个位置可以是变异的或野生的,这种类型的查询还将检索野生类型序列,结果导致甚至更高级别的噪声。在成千上万个野生类型序列的背景下,找到十个真正的点击率并不罕见。

典型的搜索协议包括冗长地手工创建多个查询序列以覆盖所有可能性,执行搜索,然后执行不同的布尔运算,或者使用GenomeQuest分组(按主题分组,188bet拳击组大小=1,使用一对野生类型和手动创建的序列的变体符号)以便删除不想要的野生类型结果。这通常需要几个小时甚至几天。

解决

如果有人对了解给定职位的所有变化感兴趣,还是一组职位?MOTIF可以在感兴趣的位置与X一起使用,但是不能交互地缩小结果以深入到结果组合中。

188bet拳击GenomeQuest意识到需要改进的变体搜索工具和方法,并开发了新的搜索产品产品,称为序列变化发现模块。它是GenomeQuest产品的可选组件,188bet拳击并且它允许搜索者快速筛选大量特定变化的结果,不需要预先创建变体序列。

因为它使用交互式过滤,可以用一组变化来查看所有结果,然后改变任何位置以查看不同的组合。也可以交互地设置百分比标识截止值,因此,可以找到与未预期的变化一致的情况。

还有一组宽滤波器,因此,可以针对所有变化筛选一组序列,要么在整个比对中,要么仅在特定的子序列或子序列组中。

查看结果并突出显示特定变化区域,特别是在进行序列景观搜索时,也是非常耗时的。188bet拳击GenomeQuest的序列变化发现模块提供用户可配置的图形来显示所需的变化。它还创建了给定查询/主题对中发现的所有变体的可导出表,用于粘贴到基于文本的查询中,或者用于更容易的评估。

可用的不同视图允许可选地显示紧邻权利要求全文的对齐图形,因此,可以在查看搜索结果的同时评估索赔,节省更多的时间。

序列变异IP的世界总是复杂而混乱的,充满了法律风险。在起草声明和引用变体中缺乏一致性使得文本搜索非常困难。大量的可能性和组合导致只有极小百分比的序列变异被包括在序列列表中,这意味着很少有序列数据库被索引。

然而,在清单中,188bet拳击GenomeQuest的新的序列变异发现模块将使得在大海中发现这种变异的针更加省时和痛苦。

艾伦谢林是GQ生命科学的高级产品经理。金博宝美式足球她是美国注册的专利代理商,目前担任GenomeQuest和LifeQuest的产品经理。金博宝高尔夫球188bet拳击在她被任命为GQ生命科学公司之前,金博宝美式足球谢林在一家财富500强的公司工作了35年多。可以联系她:ellen.sherin@aptean.com.

岗位具有精确度的变异序列的搜索第一次出现生命科学知识产权评论.

无可奉告

第一个开始谈话

留下答复

  • (不会出版)