前言
一种变异株之所以有资格拥有姓名,
其实是因为大家出于方便,
而给变异过程中值得特别留意的某些分支取一个约定俗成的称呼。
所以从系统发生树的角度来看,
所谓的变异株,归根结底就是一些需要留意的分支。
而我们知道,演化树发生分叉的原因,是病毒发生了突变~
因此定义某款变异株(即某个分支),最关键的因素,就是所谓的“特征定义突变”(lineage defining mutation)。
然后上面咱已经提到了一嘴,BF.15的特征定义突变,是刺突蛋白Y248H。
(或者如果更严谨一点的话,可以再加上父毒株继承下来的ORF6:P57L,T6979G和C26625T)。
然而,靠着特征定义突变来定义变异株,
是一种更适合人肉撸树的笨办法,
面对现如今五百万条序列的庞大无比的新冠系统发生树,
靠着人肉去撸,那可真是要地老天荒了……
所以,针对这个情况,大佬们搞出来一些自动化的比对分类工具,
大致来说有四种~
——请品鉴:
各位不需要了解上述四种自动分类工具到底是啥,
但既然它们是自动工具,那么各位可能已经猜到了——它们都会犯傻……
而卢老师所谓香港卫生署7月份上传的序列,
就大概率是上述某个分类工具犯傻的结果……
用人话来解释:
由于BF.15三天前才刚刚确认命名,
所以上述四种工具当中的两种(GISAID和pangoLEARN)还没来得及更新,
压根儿就识别不出来BF.15
所以退而求其次,咱用Nextclade搜了一圈儿,搜出了一共19条来自香港的所谓“BF.15”序列~
——请品鉴:
↑ 其中大概有10条左右满足卢老师所说“7月份由香港卫生署上传”的条件
接下来,咱靠着这19条“BF.15”序列撸了撸树……
结果……
——请品鉴:
↑ 解释一嘴:
上图每一个小圆点代表一条测序记录;不同的颜色代表不同的毒株;
其中蓝色=BA.5.2.1;
绿色=BF.20(即BA.5.2.1.20),这货与本文无关,就不提了;
黄绿色=BF.15;
橙色=被Nextclade判定为香港BF.15的19条序列。
所以,一图秒懂了啊各位~
这19个黄色小圆点,根本就没有位于黄绿色的分支里面……
或者换句话说:
这19个所谓的BF.15,压根儿就不是BF.15
换个角度,再来一次。
上面提到的四种分类工具,还有Usher没用,
这次咱就改用Usher得了。
顺便一提,Usher的生平见下,
各位感兴趣的话不妨自行去啃原文。
——请品鉴:
传送门:doi.org/10.1038/s41588-021-00862-7
总之,回到主题,
咱用Usher撸出了包含了截止今天为止所有BF.15序列的一棵树~
——请品鉴:
↑ 继续解释一嘴:
上图每一个小圆点代表一条测序记录;不同的颜色代表不同的检出国家/地区。
……
……
所以香港呢?
香港在哪里?
最后,除了四种自动比对工具之外,
上面咱还提到一嘴,
咱们还可以靠着特征定义突变来人肉检索……
——检索结果,请品鉴:
不管用cov-spectrum还是用GISAID,都找不出来哎
所以咯,情况就是这么个情况。
深圳这些个所谓的"BF.15",如果真的如卢老师所说,跟香港那边同源的话呢,
那就根本不是BF.15,
而只是一些普通的BA.5.2.1而已。
这个乌龙的起源,大概可能也许只是Nextclade不小心犯傻了……
各位请稍安勿躁,稍安勿躁……
以上,散会啦~