新冠病毒专利的信息。

直言简评,2021-03-15。
https://sites.google.com/site/zhiyanleback/2021-1/z20210315-patent-message

武汉实验室的新冠病毒S-基因专利,还有中国军医陈薇的新冠疫苗及其S-基因专利,都说明该病毒完全可以实验室人工合成。就此,再阅读陈薇关于专利所说:【将高频密码子和低频密码子均匀分布于S蛋白基因。同时考虑到提高mRNA中GC含量,有助于增强mRNA的稳定性,我们适当地提高了S蛋白基因的GC含量,并将G、C核苷酸在整个GP基因中尽可能均衡分布。】#

从这个角度考察,也可说明新冠病毒【元凶】是人工嵌合体WIV1(武汉病毒所一号病毒),即本次疫情病源并非来自云南蝙蝠等自然动物。

首先,相关S-基因序列的样本:

• NC-045512 :武汉病号样本,2019-12采集于当地医院。
• WIV1 :武汉病毒所人工合成体,2015完成。
• RaTG13/S:蝙蝠样本,2013-9采集、2020-02发布,被称为新冠病毒来源。
• WIV-CN101100680:武汉病毒所新冠S-基因专利(可提高传播力10倍),2007年。
• WIV-CN102690336:武汉病毒所新冠S-基因专利,2012年;用于本次病毒检测。
• BJ_WO2006136084:北京中国医科院新冠S-基因专利,2006年。
• CW_CN111218459/DNA:陈薇疫苗基因序列专利,2020-02上生产线。
• CW_CN111218459/S:陈薇疫苗病毒基因专利,2020-02上生产线。
• MG916902.1:云南蝙蝠样本,2012年采集。
• NC_030886.1:云南蝙蝠样本,2014年采集。

根据美国卫生部病毒基因库和产权组织记录,可以得到上述样本的S-蛋白的单个基因(基础基因)的GC和AT的含量。如下:

附表-01:病毒S-基因的单个基因出现频率(BP):


由此可见,武汉病毒一号WIV1和蝙蝠RaTG13两个样本的单个基因出现频率一致,且最接近武汉病号样本。而自然蝙蝠样本则不仅彼此有显著不同,且与病号样本也有显著不同。

进一步从单个基因ACGT分别占有总数(BP)的比例和突变比例差的角度来观察,除掉专利,如下:

附表-02:病毒S-基因的单个基因出现频率的比例:


图表中,上面是单个基因频率占该病毒样本基因序列长度(BP)即总数的比例及其GC含量和突变比例差,下面是各个样本与病号样本的比例差。

可以看到,就2012年和2014年的自然蝙蝠样本而言,其单个基因频率比例分布、GC两个基因的含量和突变差,都与病号样本有很明显的不同,彼此也显著不同。自然突变是随机的,当然如此。因而,可以排除新冠病毒来自自然蝙蝠的说法。

而比武汉病毒所一号病毒WIV1和样本RaTG13,各个方面都非常接近病号样本;尤其是它们的GC含量和突变比例差,不仅非常接近且有的就是一样的。可以说,这两者有一个是新冠病毒的真实来源。鉴于武汉病毒所说明RaTG13携带病毒不传人而WIV1可直接传染人,如此,可见,本次疫情的新冠病毒的来源或真实【元凶】就是武汉病毒所一号病毒WIV1。

其实,就武汉病毒所一号病毒WIV1,美国国家科学院刊物曾发文和编者按,警告说:该病毒为人工合成嵌合体(为武汉病毒所石正丽团队和美国生态健康盟会达萨克团队合作项目产品,2015年完成),可直接感染人,可导致超大规模疫情和造成严重经济损失、甚至可改变现有生活方式(譬如迫使人人戴口罩和保持社交距离等彼此隔离)。如今,该警告成为全球面对的严酷现实。

反证:若病毒来自自然蝙蝠,那么,2013年采集的蝙蝠RaTG13样本与2012和2014年同在云南采集的蝙蝠的样本,彼此的基因含量及分布应该明显一致。然而,蝙蝠RaTG13的样本与两者相差甚远,但与人工嵌合体WIV1是高度一致;此外,其更新版显示含有基因编辑引物序列。这说明,蝙蝠RaTG13样本及其基因序列是人工合成的(涉嫌伪造),是用来掩盖真实【元凶】搞搅混水的人造东西。

需要注意的是,新冠病毒S-基因需要与人类受体ACE2基因组互动、才能传染人和进入人体发挥作用。而过去多年,在中国大陆,所谓【跨种传播】即把本不传人的病毒人工改造为可直接传人的病毒,是相当流行的科研项目,且不少人为此获得荣誉,譬如,那包括武汉病毒所石正丽团队,也包括中疾控官员高福团队,等等。

他们的科研有个显著共同点:根据受体ACE2的互动和突变来改造和提高病毒传播力。譬如,上述武汉病毒所的2007年和2012年的S-基因专利就说明,通过基因工程手段改变其与受体和抗体的互动功能获得,由此两方面发生突变可使得病毒传播力提高10倍左右,且便于低成本开发病毒和疫苗。

中疾控官员高福及其团队和伙伴,多年前就开始了【跨种传播】(把本不传人的病毒改造为可直接传人的病毒,依此做开发病毒和疫苗研究),且获得成功和国家奖励。高福等说到经验和技术经验的时候,其中主要一条,就是通过受体和抗体的互动及其基因变异的手段来实现病毒的新的【功能获得】。

下面,是美国卫生部基因库2020-04发布的世界各地不同人群的受体ACE2的表达频率概览:

附表-03:受体ACE2的单个基因等位突变表达频率:


该数据显示,GC两个基础基因的表达频率明显是最高的。这与军医陈薇及其专利关于GC高频率之说,完全一致;即病毒和受体之间由此而发生明显的较高亲和力。

该数据还显示,A>G和C>T两个突变导致的表达频率高低倾向是相反的;且突变前后的频率表达差、A>G的是正值而C>T的是负值。这说明,A>G突变增强了功能而C>T突变减少了能量消耗,两者组合,使得受体整体更适应病毒的侵入及其功能发挥。

很值得注意的,突变频率差中,远东人群的A>G的频率变化最小、而C>T的变化与其他地理人群的频率变化大体一致。这说明,本次疫情前,远东人群的受体已经发生了与病毒侵入彼此较高程度的适应,即疫情首先在远东爆发并非偶然,而是病源就在远东的直接反映。然而,到疫情爆发时,受体基因突变但还没有获得明显的互动能量消耗变化;随着疫情爆发传播发展,该变异发生,故而,远东人群的C>T导致的表达频率变化与世界其他人群的彼此相当。

所谓远东地区人群,中国大陆有14亿,即完全可以认为该数据在极大程度上反映了中国大陆人群的受体基因表达频率变化。无独有偶,在中国大陆,基因编辑产品以常规育种名义铺开上市多年且非常流行。就此,中国大陆中科院专职基因编辑的李家洋和高彩霞等人的论文说明,他们搞基因编辑作物的多年事实说明,C>T突变在数量和功能方面都是最为突出的。这或许为中国大陆人群受体与病毒彼此更为适应、因而在那里的病毒突变事件相对于世界其它地方就显得更少,提供了生态环境影响的说明。这也是本次疫情病毒病源就在中国大陆的一个事实反映。


基因密码子比对研究的重要意义

做全系列基因密码子出现频率的观察,可以看到同样结果,即本次疫情病毒元凶是人工嵌合体新冠病毒WIV1而不是蝙蝠RaTG13或其它蝙蝠。

基因密码子比对观察的意义:至今,观察分析病毒相似同源性,大都集中于基因序列单个基因比对或单个蛋白比对。然而,跟其它生命体一样,病毒存活和发挥作用,更多是密码子作业、而不是一个个单个基因作业。同理,蛋白发挥作用也是集群网络作业,不是一个个单个蛋白作业。就此而言,一个单个基因变化就可能影响整个作业。

譬如,有这样一个基因系列:ATTACCAAAGGG,它们的密码子是ATT-ACC-AAA-GGG。若在首位加一个基因和砍掉尾部一个基因,使其称为序列成为TATTACCAAAGG,两者相似度极高且总长度没变,但密码子却大变了,成为:TAT-TAC-CAA-AGG。这就直接导致蛋白整体作用变化、甚至重大变化。因此,做相似度或同源性的出现频率观察比对,密码子的比对观察也很必要。

附后是相关样本的全系列基因密码子的原始数据。为作图,样本名称用了缩写,它们分别是:

WH-01:武汉病号样本。
WIV1:如前。
RaTG13:如前。
Bat-2012/Bat-12:2012年在中国云南采集的蝙蝠样本,如前。
Bat-2014/Bat-14:2012年在中国云南采集的蝙蝠样本,如前。

可看到,就各个密码子出现频率而言,WIV1的与病号的最为近似,RaTG13的近似度明显较低。下面是各样本密码子出现频率与病号样本的差距图示:

附表-04:


就与病号样本密码子频率及其分布的差距而言,越是接近零(0)者,越是可能为病源者。上图说明,两个自然蝙蝠(Bat-12和Bat-14)的频率和分布的差距明显都很大;加上它们携带的冠状病毒不是直接传染人类的,如此,可排除它们为病源的可能性。

就蝙蝠RaTG13而言,其频率差距明显也很大,甚至大过自然蝙蝠;而就分布来说,频率差距较大的密码子数量颇多,少说也有10个。还有,其样本提供者武汉病毒所石正丽团队明确说明,该蝙蝠携带的冠状病毒不是直接传染人类的。由此,也可排除RaTG13为病源的可能性,尽管它与病号样本的单个基因的相似度比对高达96.2%。

就人工嵌合体WIV1新冠病毒而言,其密码子出现频率与病号样本比对差距是相关样本中最小的(比其它样本更接近于零),同时,各个密码子布局的差异也是最少的。据美国国家科学院刊物2016年03月刊文所说,该病毒可直接传染人。如此,WIV1才是导致本次疫情最可能的病源。

进一步考察。下面是各样本密码子的三个基础基因的出现频率及其平均频率与病号样本的近似度比对:

附表-05:


很明显,样本WIV1的密码子三个基础基因的平均频率的近似度高达0.99468,而样本RaTG13的近似度为0.97972,两者相差1.49%左右。两个样本的密码子数量大约10050个;如此考察,两者密码子的频率数量差别就是10050*1.49%=150个密码子。一个密码子差异就可能导致整个序列及其蛋白作用了,具有150个密码子差异,其影响是不可忽略的。

基于上表,可得到各个样本的各个基础基因的平均频率布局与病号样本的差距,如下:
 

Average Frequnce and Distribution for Base Genes
Average Frequence for Each Base Gene of Codons Distance from Patient Sample WH-01
  WH-01 WIV1 RaTG13 Bat-12 Bat-14   WIV1 RaTG13 Bat-12 Bat-14
A 3038.33 2884.67 2975.33 2342.33 2552.33 A -153.7 -63.0 -696.0 -486.0
C 1868.00 2020.67 1836.67 1462.67 2135.67 C 152.7 -31.3 -405.3 267.7
G 1983.67 2098.00 1948.67 1936.00 2419.00 G 114.3 -35.0 -47.7 435.3
T 3267.00 3099.67 3190.33 3250.00 2946.00 T -167.3 -76.7 -17.0 -321.0
Average Gap: -13.5 -51.5 -291.5 -26.0


其计算采用简单的算术差,譬如【A】,WIV1的平均频率值为2884.67,减去病号样本WH-01的3038.33,得到的平均差距为【-13.5】。比较看,这是最小差距;而RaTG13的差距高达【-51.5】。显然,WIV1才是病源,RaTG13等蝙蝠不是。

简言之,鉴于样本RaTG13的密码子三个基础基因的平均频率的近似度显然低于样本WIV1、且前者不直接传染人而后者直接传染人,可以说,导致本次疫情的真正元凶是人工嵌和体新冠病毒WIV1、而不是RaTG13或其它蝙蝠。这说明,序列的一个个单个基因比对是必要的,但密码子比对也是不可忽略的。


本文采用突变前后相关数字差(比例差或频率差等)方法,涉及到山农提出的【信息熵】理论方法应用于基因学的【基因熵】(genetic entropy)的问题。就此,多年前,转基因技术的【鸟枪法】发明人J-圣弗德博士的著作【退化论:基因熵与基因组的奥秘】(早有中文版上市)说明,基因突变即生命体与自身变化和自然界变化的适应过程、本质上是【退化】而不是【进化】。他的那套说法遭到达尔文进化论信徒和无神论信徒以及【主流科学家共同体】的猛烈抨击。

然而,通过学习交流,尤其是通过【弦论】和【五维时空】理论方法奠基人科学家的指教,我认为圣弗德博士的【基因熵】和【退化论】能更令人信服地说明基因突变的意义。那就是:突变意味着从高维能量衰变为低维能量,如同核弹爆炸过程是高维能量释放衰变为低维能量的【退化】道理一样。那状态,就如同【熵】学所说的包括人类和日月地球银河系在内的宇宙演化,终将达到某种均衡分布的静态而不再发生演化,直到新的宇宙爆炸发生而开始新的演化。同理,病毒基因和受体基因彼此不适应到彼此适应的基因突变,就是高能量到低能量的【退化】过程。它们完全适应了,突变停止了,也就是疫情完全结束之时。表达分析该【退化】有许多方法。我觉得,最简易的就是【退化】即突变前后的算术差。


参考资料(包括数据来源):

Name used by this essay: WH-01.
NCBI Reference Sequence: NC_045512.1
Wuhan seafood market pneumonia virus isolate Wuhan-Hu-1, complete genome
https://www.ncbi.nlm.nih.gov/nuccore/NC_045512.1

Name used by this essay: WIV1.
GenBank: KF367457.1
Bat SARS-like coronavirus WIV1, complete genome
https://www.ncbi.nlm.nih.gov/nucleotide/KF367457.1

Name used by this essay: RaTG13.
GenBank: MN996532.1
Bat coronavirus RaTG13, complete genome
https://www.ncbi.nlm.nih.gov/nuccore/MN996532.1?report=genbank

Name used by this essay: Bat-2012/Bat-12.
GenBank: MG916902.1
Bat coronavirus BtCoV/Rh/YN2012 isolate BtCoV/Rh/YN2012_Rs4125, complete genome
https://www.ncbi.nlm.nih.gov/nuccore/MG916902.1


Name used by this essay: Bat-2014/Bat-14.
NCBI Reference Sequence: NC_030886.1
Rousettus bat coronavirus isolate GCCDC1 356, complete genome
https://www.ncbi.nlm.nih.gov/nuccore/NC_030886.1


基于以上链接的原始数据:


=#=

 

Comments

Popular posts from this blog