Phresd
Phresd

A Bioinfo postgraduate student in mainland.

記錄一下首次發現新型冠狀病毒的經歷

轉貼聲明:

本人不是文章作者,只因為這則很有意義的文章在牆內被屏蔽,特此轉載。向一線的科研工作者致敬!願這場災難早日結束。

-------------------------------

2019年12月26日剛上班,還是如往常一樣先大概瀏覽一下這一天的mNGS病原微生物自動解讀結果,沒問題的話就開始一天的研發工作了。

意外的是,發現有一個樣本報出了敏感病原體——SARS冠狀病毒,有幾十條的序列,且這個樣本只有這麼一個有意義的病原體,如果是普通病毒,這已經是一個相當可靠的結果了。心頭一緊,趕緊後台查看詳細的分析數據,發現相似度並不算很高,只有大約94.5%(這跟卡相似度的閾值有關,相當於只篩選下了相似度比較高的序列)。想到有幾種可能:1、SARS不同毒株基因組有一定差異;2、RNA病毒容易突變,距離SRAS事件17年了,變異比較大;3、近緣物種的錯誤比對等等。為了確認結果的可靠性,開始了詳細分析。

好在之前已經遇到過幾次這種類似的敏感的病原體確認分析工作,而且領導也曾跟我討論過幾次能不能做一個新發病原自動挖掘的分析流程,心裡一直記著這個事情,在做其他權重更高優先級更高的項目時也隨手做了一個初步的版本出來, 這個樣本剛好可以派上用場。我給它起了個名字,相比於日常生產用的分析流程,它多了個後綴:“探索版”,包含了幾乎所有已測序的病毒基因組。

探索版的分析結果提示這個病原體跟Bat SARS like coronavirus最相似,整體相似度在87%左右,而跟SARS的相似度是約81%。比對上的序列數由幾十條上升到了500多條,此外也組裝出了5條contig,加起來有1200多bp,此時基本上可以確認是一種冠狀病毒,可以針對冠狀病毒進行詳細分析。分析期間也開始跟解讀負責人和領導小範圍內部保密討論。


進一步分析,無論是拿原始序列去NCBI nt庫blastn,還是拿組裝後的序列去blastn,結果都是跟Bat SARS like coronavirus最相似,但整體的相似度也是只有87%左右,進行nr庫蛋白blastx對比的相似度也差不多,因此對結果保留懷疑。

病毒的分類信息一直都很混亂,分類規則不統一,有些基於分型基因(比如甲流)、有些則沒有明確的分型基因,通過其他方法去分類。此前並沒有去調研過Bat SARS like 跟SARS的分類方法,在NCBI Taxonomy上,Bat SARS like 是劃分到SARS下面的。如此緊急的情況下,沒有時間去調研文獻,手上的數據也不多,基於基因組的相似度,潛意識裡認為既然Bat SARS like是SARS的下屬分類,那麼這個檢測到的未知病毒至少也是一個跟Bat SARS like平行的物種,即一個新型的Bat SARS like(後來看文獻SARS和Bat SARS like是通過幾個非結構蛋白進行分類)。

進一步地毯式地分析了幾千個冠狀病毒基因組,從相似度、覆蓋率、基因組分佈均勻等幾方面進行評估,最終找出兩株最相似的基因組,bat-SL-CoVZC45和bat-SL-CoVZXC21(1月9號公佈基因組序列後,很多文章分析的也是這兩個)。

(下午才發到群裡的圖)

僅僅這些信息還是不夠的,至少還要看看進化上的信息,於是開始著手做進化樹分析。

下載了所有冠狀病毒的基因組,最後經過質量過濾、聚類等分析,篩選出了160株的冠狀病毒基因(基本包含了所有已知的各種動物的冠狀病毒)。將組裝的序列與160株冠狀病毒基因組基於全基因組平均相似度做了進化分析(題外話,個人認為在物種進化分析上,基於全基因平均相似度構建進化樹,比基於某個基因構建的進化樹要更準確、合理一些,畢竟是從全局來考量,當然,研究結構、功能等另說,此時組裝的序列也很短,沒有完整的基因序列),結果不出意外,還是跟Bat SARS like coronavirus聚得最近,而且也是在SARS的大支上。

跑到了傍晚才出圖
左上角一大塊紅色是SARS,邊緣顏色沒那麼紅的是Bat SARS like,再往外的大藍邊是另一群Bat SARS like,未知的病毒跟45、21聚在比較獨立的一支上了,紅框圈起來的。

比較奇怪的是,這個未知的病毒跟bat-SL-CoVZC45和bat-SL-CoVZXC21聚到了一個相對獨立的分枝上,而其它Bat SARS like則很集中地聚在SRAS那一群裡面,想著也許是這兩個的分類有點問題,但去看了出處的文獻,方法上跟其它的也沒啥區別,尊重文獻的分類吧,暫且認為是對的。 (這也是後面某些專家們把這個未知病毒判定為新型冠狀病毒的依據之一)

部分進化樹截圖

前端反饋這個患者病重,著急要檢測結果,但是這麼一個重大的病原體確實不可輕易報出,中午跟幾個領導緊急開了個會,決定繼續深入分析,延遲發放報告,同時分享數據給中國醫學科院病原所一塊分析。

後面從基因層面(orf1ab、S、N等基因)進行了深入分析,並沒有什麼意義比較大的發現了,主要還是檢測到的序列數少,覆蓋率太低,都是不完整的基因,做不了什麼。


中午時已經提出了重測補數據進行分析。重測可以進行技術重複性驗證,避免一些未知因素的污染導致的假陽,確保樣本確實有該病原體,另外可以有更多的數據進行分析,如能組裝出完整的基因組,分析結果更可靠,能做的深入分析也更多。

第二天(2019.12.27)一早數據出來後,趕緊進行了組裝分析,終於組裝出了接近完整的基因組序列。數據同時也共享給了中國醫學科學院病原所做其他深入分析。這次的序列數由之前的500多條升到了47萬多條!


因為時間有限,還有其他研發項目需要做,就沒有詳細去對組裝結果進行補gap獲取完整基因組了。另外也已經分享數據給病原所了,他們也會做這個,所以就沒有去組裝出一條完整的基因組序了,已有的組裝結果能滿足大部分分析需求了。

後面也繼續做了一些深入的分析。

回帖序列分佈均勻,沒有明顯的偏好,平均深度和中位深度基本一致,深度達到了1000x,說明組裝沒啥問題,測序也挺好,未知病原體也是完整的基因組存在。

重新構建了進化樹,這次選擇了NCBI所有冠狀病毒的參考株(以登錄號以NC開頭,官方認為最可信的),外加幾株前一天分析最近源的株。

進化樹結果跟前一天的基本一致。

基因組共線性分析、ORF註釋等表明這個未知冠狀病毒是典型的BetaCoV(orf1ab、S、M、N、E等基因)。共線性圖裡顏色較淺的是S蛋白區域,是差異最大的基因。

經過與WHO官網推薦的SARS 7條PCR驗證靶標序列比對,發現平均相似度也只有90%左右,關鍵是引物序列也有幾個變異,推測SARS的檢測試劑盒無法檢測這個未知病原體(後面的很多地方的實驗驗證也是如此)。

此外還做了很多其他針對基因、蛋白等詳細的深入分析,不再贅述了。

分析至此已經基本可以確認這個患者的樣本里面確實有一個病毒,但這個病毒與所有已知基因組信息的病毒都不太像,可能是一種跟Bat SARS like coronavirus類似的新型病毒。

現在看回我當時的那句話,真是一語成讖,對不起全國人民了,都怪我這個烏鴉嘴

這不一定是SARS,傳染性、致病性都未知,同時也意識到了問題潛在的嚴重性,對實驗室做了全面清理消毒,樣本無害化銷毀,實驗操作相關人員進行了相關監測。

接下來就是怎麼去報告的問題了,直接報可能會嚇著醫生,何況這可能是一個新發病毒,報錯了就是重大的事故。有一些必要的信息還是需要先進行排查的。

最先想到的當然是野生動物接觸史,當時得到的信息是這個病人回過老家,不排除接觸過蝙蝠,或者被蝙蝠咬了都可能。

也曾懷疑是不是哪裡的人工病毒洩露導致的感染,畢竟前段時間的布魯菌集體感染就是因為某個工廠滅菌不徹底引發的。

沒有更多信息了,還是要趕緊跟醫生溝通這個事情,畢竟我們能保證送檢的樣本里面就是有這個未知病毒,其他事情就交給醫生去調查處理了。

中午前已經跟醫生溝通了,患者也隔離了。

因為沒有掌握其他更多信息,患者也隔離了,這個病毒又不是真正的SARS,想著或者僅僅只是個野生的Bat SARS like,傳染性未知,所以緊張的心情也有些放鬆了。但因為患者病重,也不容小覷,仍然密切跟醫院溝通中。期間也在繼續做一些深入分析。 27號、28號公司領導也在跟醫院和疾控的人電話溝通這個事,29號、30號還親自去武漢跟醫院、疾控中心的領導當面匯報交流這個事情,包括所有我們的分析結果以及醫學科學院病原所的分析結果。一切都在緊張、保密、嚴格的調查中(此時醫院和疾控的人早已經知道有多名類似患者,我們溝通了檢測結果之後已經開始了應急處理,但我不知道而已)。

本以為這個事情會很快過去,畢竟除了這個患者,好像也沒有聽到其他患者感染的消息,但到12月30號的時候,聽到消息說類似症狀的患者還有挺多個,神經又一下子繃緊了。特別是,大概是30號下午吧,一個“友商”在另一個患者的樣本里面可能也檢測到了同一種病毒,但他們直接發了檢測到SARS冠狀病毒的報告,瞬間把消息給引爆了。晚間相關部門也發了“不明原因肺炎”的公告,31號凌晨時相關流言也開始在微博上大肆傳播。

真正讓我再度緊張的是,友商共享了序列給我們分析,我分析一看,確實就是同一種病毒!潛意識裡的第一個想法就是“這病毒具有傳染性”!可能還真是一種新型的SARS!

30號深夜拿到友商的序列進行分析。

兩個未知病毒聚在了一起,相似度超過99%

由於友商的序列是經過與SARS比對篩選的,所以跟SARS相似度達到93%,而我們的完整的序列則約86%,但兩者的同源性還是接近100%

兩兩直接比對,所有序列均能比對上,相似度達99.6%,再保守的區域,不同物種間的相似度幾乎不可能這樣高,而且全基因組覆蓋率超過了20%,確認是同一種病毒無疑!

此時的心情既很緊張,也很激動。緊張在於,這個未知的病毒可能會像SARS那樣恐怖;激動在於,我們通過mNGS技術及早發現並確認了這個病原體,並且對患者進行了隔離,在病毒大範圍傳播之前有可能通過防控措施把它扼殺在搖籃中!

心情複雜,感慨萬分,隨即發了條沒幾人能懂的朋友圈。

12月31號早間,微博上關於SARS的流言開始大肆傳播。我一直在等著看官方如何回應。下午官方發布通告,只說了是“不明原因肺炎”, 並未提是什麼病原體,有27例類似的病例,其中7例重症。看到這個消息後,我感覺事情不妙了,猜測這個病毒傳染能力並不低。然而官方的通報卻是“未發現明顯人傳人現象”,早期掌握的數據並不多,局勢不好判斷,何況是新發病毒,為了穩住社會情緒,避免民眾過度恐慌,這樣的通告其實也可以理解。

此時專家組已經開始介入,武漢病毒所等“國家隊”也開始分析鑑定,他們知道更多信息,有更多樣本和數據,也更有條件更專業,所以後續我就沒有做太多深入分析的工作了,等待官方的結果。

剛開始我對國家在處理這些突發的重大公共衛生事件的能力還是挺有信心的,畢竟經過了SARS、甲流等事件的洗禮。此外,就在兩個多月前的北京鼠疫事件,也是由我們通過mNGS檢測出來上報的,當天上報後他們就啟動了應急處理程序,馬上用了其他方法再次驗證,第二天一早就看到新聞了,後續也沒有發現新傳染的病例,防控做得很好。 mNGS在鼠疫事件中立了大功,想著在這個未知病毒的防控中也能起很大作用吧。

媒體開始闢謠,最早見新京報發出“SARS系謠言”,人民日報等則用詞稍微委婉些“不能斷定是SARS”,後面8位“造謠”的人被抓了。看到這些新聞後,不知怎麼的,心裡突然有點失望了。科學上尚未有定論或者有爭議的東西,直接就是謠言了?開始有一種感覺:這種闢謠的論調,以及那些過度樂觀的宣傳都會把這個事情推向難以挽回的局面。媒體的高調闢謠會干預這個病毒科學的定性,過度樂觀的宣傳會讓大眾缺乏敬畏之心,不會採取防衛措施。後續事態的發展又一次驗證了我的擔憂。

事件引爆了以後,也有些朋友來問我是否知情,特別是武漢的朋友。在告知一定要先嚴格保密後(畢竟有人被抓了),我還是透露了一點消息給他們,讓他們一定要注意防護。

這個對話或許也能理解為什麼要闢謠SARS,以及命名為新型冠狀病毒,畢竟基因組相似度只有80%左右(題外話,腸道病毒同一個型別的不同毒株,很多的相似度也才80%左右),SARS給我們帶來了太多創傷,大眾對其極為恐慌。

新型冠狀病毒和SARS不同的基因的相似度不同,從75%到94%不等,特別是S基因,與人細胞受體(ACE2)相關,相似度才75%。所以說不是SARS,那也算是有依據吧。不過後來石正麗的文章中,通過他們的方法分析,新型冠狀病毒也是屬於SARSr-CoV(SARS相關冠狀病毒)。

事件後續的發展大家都知道了。這裡再說說幾個問題。

為什麼我們兩天就已經分析出了這個未知的病毒是一個跟SARS很像的冠狀病毒,並且上報了所有分析結果,官方要到1月7號才發布消息明確肺炎是由新型冠狀病毒引起的?

其實我們做的工作只是分析鑑定了送檢樣本里面有這麼個病毒,但肺炎是否是這個病毒導致的,我們並沒有去分析,也無法去分析,檢測到病毒不等於肺炎由該病毒引起。如此重大的衛生事件,官方自然要嚴謹論證,而且也有一套國際參考驗證流程(科赫法則)。官方要做的不僅是檢測到多個樣本都有這麼個病毒,還要驗證肺炎是因為這個病毒導致的等等。



分離、培養、驗證等等這些都是很花時間的,還要經過專家討論,達成共識。從近段時間發表的很多關於新型冠狀病毒的論文上也可以看到,很多測序數據都是在1月份的頭兩三天就完成了的。

這個事情還有一個很感概的事情就是,知道真相的人噤如寒蟬,不知道真相的人各種“大力科普”、“深度分析”;親身經歷的公司隻字不敢言,其他公司各種借勢營銷。從鼠疫到新型冠狀病毒皆是如此,呵呵,好有意思。

要談對整個事件的看法,最大的感覺就是失望,痛心,還有憤怒。我們都已經發現那麼及時了,為啥現在還是沒能控制住?讓全國進入的疫情大戰?更多的不是科學因素,也不是技術因素,而是決策和媒體。

我曾經是個很憤青的人,事已至此,無力回天,傳遞信心才是最重要的吧。馬後砲,人人都是精英,誰都不曾想到事情發展成這個樣子,所以也懶得去批判很多事情了。但有些話還是想說幾句。

闢謠SARS、媒體宣揚的樂觀情緒,這些在最早期的時候都沒有太大問題,畢竟對這個病毒的認知非常有限。在應對這些重大公共衛生事件時,疾控系統可能採用“內嚴外松”的規則,內部謹慎小心、嚴格驗證、仔細評估,對外通告卻可能偏向樂觀,避免引起過度恐慌。何況在這次事件上,怎麼去給公眾交代,顯然已經不是疾控系統能單獨決策的事了。

武漢交通樞紐的地位不必多言,當時也臨近春節,正是餐飲、旅遊、電影等服務業的旺季。悲觀的宣傳無疑會重創這些服務業,還會引起大眾過度恐慌,導致物資哄搶,社會混亂等嚴重後果。若這病毒真無甚麼傳播能力,或者因為採取了這些措施扼殺了病毒的傳播,社會沒看到這個病毒能帶來什麼危害,決策者必然會被罵反應過度、小題大做,到時自然要背鍋。相反,過於樂觀的宣傳,病毒不強則皆大歡喜,開心過大年,病毒強則會導致大眾缺乏防範意識,防控工作難以展開,最終導致病毒的快速傳播,產生更加嚴重的後果。所以,當你作為一個決策者的時候,你不得不綜合考慮方方面面的因素,社會、經濟乃及政治各方面都需要做一個平衡,非常考驗決策者和專家們的能力和遠見。

走對了,平淡無奇,走錯了,千古罪人。

這個世界沒有平行宇宙,我們無法知道哪種決策才是更正確的,或更錯誤的。在國內這種什麼事情都喜歡往樂觀上面宣傳的大氛圍下,以及僥倖心理的存在,決策者做什麼決策,可想而知。

在事件的後期發展中,特別是1月12號左右開始,我相信專家們已經看到事情正在往不好的方向發展了(首批確診的41例患者,約30%並無海鮮市場接觸史,此時多地開始出現疑似病例了,有些已經初步核酸陽性)。但是在後續的宣傳上還是太過於樂觀和藝術化了,同時還在不斷闢謠,還沒任何發布預警的跡象。 “不排除有限人傳人,持續人傳人風險低,可防可控”,用詞頗為謹慎講究,且不說是否過於樂觀,就問有多少普通民眾知道什麼是“有限人傳人”?什麼是“持續人傳人”?他們的理解可能就是基本不會人傳人,自然毫無戒備之心。我還在朋友圈科普了一下。



從現在發表的很多論文上也可以看出,很多專家很早就對這個病毒的傳播能力有較深的認識了,越往後,掌握的數據越多,對局勢的預判越清晰。我相信專家們早已給出不怎麼樂觀的預判,但如果某些人,為了顧及某些人或某些媒體的面子(畢竟之前宣傳得太樂觀,現在打臉太疼),罔顧專家意見,不顧民眾健康,不得不往樂觀上面去通告,堅持不發布預警,這就不可原諒了。無論是誰,該罰的罰,該撤職的撤職。

別的不多說了,談點希望吧。

mNGS確實是一個好技術,在疑難、危重病例診斷以及這種突發的重大公共衛生事件的早期監測和爆發監測中起到很大的作用。現在提供mNGS病原體檢測服務廠商有很多,建議疾控系統可以跟一些技術好的企業建立直接溝通的渠道,能夠更快速地應對像這樣的突發事件。另外,mNGS企業們也可以建立一個信息共享平台,在遇到這些事件時及時共享信息,看看是否有爆發(我知道這個很難,一方面本來就是商業機密,另一方面敏感病原體誰都不敢輕易報吧,但我還是覺得這個事情很有意義,希望有朝一日可以成為現實吧)。

也希望我們經歷了這次新型冠狀病毒事件後,國家的重大公共衛生事件的處理能力有長足進步吧。個人認為,在通告宣傳上可以藉鑑天氣預報的規則——“總是會往危害大些方面去預報”,以提醒民眾做更多預防,降低心理預期。俗話說:沒有期望就不會失望。

這件事情對我而言,彷彿就是一場年終大考,用盡所學,交了一份還算合格的答卷吧,只是這份答卷是否發揮出最大的作用了呢?第一次親身參與到了一次如此重大的公共衛生事件,做出了一點貢獻,也鍛煉成長了許多。

據我目前所知,最早發現這個病毒的應該就是我們了,因為也是我們上報結果以後,疾控系統開始介入。從GISAID數據庫網站上提交的數據看,樣本收集的時間也是我們最早的。也許其他機構也測到了這個病毒,但這是未知的病毒,核酸數據庫中沒有參考基因組,他們不一定有這個生信能力去分析鑑定。


所以,應該就是我們首次發現了這個新型冠狀病毒吧,記錄一下。

希望早點戰勝疫情吧。

中國加油!武漢加油!

2020.01.28

CC BY-NC-ND 2.0 版權聲明

喜歡我的文章嗎?
別忘了給點支持與讚賞,讓我知道創作的路上有你陪伴。

載入中…

發布評論