WFU

2020年2月11日 星期二

3 個論文注意事項,由鐘南山的論文錯誤說起 ( 後續更新 )


這篇文章從鐘南山最近發表關於 2019-nCoV 的大型論文,來提醒新手 3 的地方需要注意的事項。


前言


其實我一直在留意大陸發表關於 2019-nCoV 收案病人數超過 1000 人的論文,所以鐘南山這篇論文一發表,立刻看完了。

但在準備寫這篇論文主要提供的訊息時,卻意外的花了至少兩倍以上的時間閱讀,所以我決定放下整理訊息的文章,先寫這篇注意事項。

總結從鐘南山這篇論文裡面得到的啟示,未來在寫論文時,一些我自己要注意的地方。

歸納以下三項:文獻排序數據一致闡釋留心


文獻排序


這是三項錯誤裡面,最輕微的一項,只要多留心就好,主要是參考文獻的錯誤。

一般常見的問題是格式的問題,不同雜誌要求的格式不同。但此處的問題是引用與排序出問題,在 discussion 內文某一段參考文獻的第 25 篇文章,但後面附上的參考文獻只有 24 篇,而要參考的其實是第 24 篇,不是內文寫的 25 篇。


數據一致


關於數據分成兩個部分,主要是前後一致計算正確

前後一致要講的是如果內文與表格講的是相同數據,最好呈現的方式一致,不要一個小數點後兩位,一個四捨五入變成一位。

在 Result 的內容,死亡率寫 1.36%,但 Table 3 表格寫 1.4%。把 15/1099 得到的數據就是 1.36%,所以 1.4 % 是四捨五入之後的結果,這只是沒有一致的小事情。

第二個注意事項是計算正確

這篇文章有一個重點,就是診斷為武漢病毒肺炎的病患,初期超過一半沒有發燒,所以不可以單用發燒當作初步篩選條件

這原本是這篇論文的亮點,雖然大家都知道,但這是第一篇把發燒分成住院當天與住院過程中來比較,並且證明這點的論文。

在 Discussion 中提到,一開始發燒只有 43.8%,後期住院發燒率達 87.9%。

但不幸的是,在 table 1 的表格中,一開始發燒寫的是 43.1%,這兩個數據無法用四捨五入來解釋,所以拿起計算機算一下,發現 473 / 1099 = 43.04%,跟 Discussion 與 table 1 裡面的都不同。

所以這類數據的計算,提醒我自己不但要呈現要一致,而且計算也要正確。


闡釋留心


前面提的兩個錯誤,或許都可以說是初稿尚未正式發表,只是一些小錯誤,校稿就可以修正了,但第三項我個人認為是最誇張的部分。

這篇論文另外一個重點是,利用症狀加上 RT-PCR 診斷為武漢肺炎的病患,初期 X-ray 有異常的病患只有 14.7%!所以使用 X-ray 來排除是否有武漢肺炎是不足,會遺漏很多人,需要更準確的 chest CT,因為初期 chest CT 顯示有異常的比率高置 76.4%。

不管在 abstract、result 或 discussion 都有提到這點:利用症狀與 RT-PCR 診斷為武漢肺炎的病患,在嚴重病例中,有 23.87% ( 221 / 926 ) 的比率沒有任何放射線異常;在非嚴重病例中,有 5.2% ( 9 / 173 ) 的比率沒有異常。

這段話相當奇怪,依照常理判定,嚴重個案更應該有放射學異常,怎麼反倒是非嚴重個案放射學異常的比率高達 94.8% ( 100% - 5.2% ),這真是太荒謬了!!這麼高的異常發生率,不正代表可用 X-ray 來篩檢?跟想要表達的事情完全相反。

這篇文章開宗明義說,總共收案 1099 人,判定為非嚴重共 926 人嚴重有 173 人,也就是人數引用相反,想表達的事情很清楚,但數據引用錯誤,過程也有問題。

而真正的狀況其實我也算不出來,只好求教高明。以非嚴重 926 人這行來看,我找不到 221 這個數字,相加相減也得不到這個數字。


最後整理


以上只是整理三個部分來講,但其實還有其他部分也有類似的狀況。雖然這篇是尚未同儕審核過的版本,只是初步的版本,但仍給予我不少寫論文的啟示。

文獻排序:除了過去一直被提醒要注意每個雜誌要求的格式不同外,內文引用的順序也不能夠搞錯。

數據一致:最好內文與表格的呈現一致,數字相同,更重要的是不能夠有計算上的錯誤。

闡釋留心:在解釋論文結果時,需要注意引用數據不能夠搞混,不然雖然結論一樣,但數字不足以採納。此外最好在論文或表格處也需要有說明,這個數字怎麼得來的。


延伸閱讀


1. 隔離期有需要延長到 24 天嗎?


後續更新


02.28 這篇錯誤百出的論文終於在 NEJM 上刊登,修改了很多地方,這邊僅列出我提到的部分。


文獻排序


這裡最簡單,直接刪掉,因為這段文字與文章,只是為了引用而引用。


數據一致


這裡分為前後一致計算正確

前後一致已經修改為 1.4%

計算正確方面,原先提到初期發燒只有 43.8%,還真的是正確的,只是表格中的總人數錯誤,原本寫 1099,現在改為 1081,所以得不到這個答案,此外,也沒有說明為何是 1081。


闡釋留心


原本最誇張的闡釋留心,雖然傳達的意義沒有改變,但數據一樣誇張。整個結論完全不一樣,而且也不知道怎麼計算的。

內文提到「887 例嚴重非嚴重病患」,我並不知道怎麼來的,因為非嚴重是 926 例,而且原先的表格與內文,有把 X-ray 與 CT 分別標示,但這裡是混和標示;新的表格標明的是異常比例,但內文解釋的是沒有異常的比例。

前後表格每一欄的數字,沒有一個一樣。

好吧,不糾結在數字問題,浪費我寶貴時間,反正他只是要告訴我們,在非嚴重的病患,初期 X-ray 異常發現只有 59.1%,初期 CT 異常發現有 86.2%。所以 X-ray 免感度低,初期 X-ray 正常,不代表沒有事情


最後總結


這篇傳達的幾個論點

1. 第一篇論文證明, COVID - 19 初期發燒比率不高,所以不能夠用發燒當篩選條件。

2. X-ray 初期發現異常的比率只有一半,尤其在非嚴重的病人,所以中國認為 CT 比較好。

3. 再次證明持續降低的 Lymphocyte 是一個很重要的判斷。

4. 潛伏期中位數保持在 4-5.2 天,隔離觀察期不用改變,一樣 14 天。

5. 嚴重個案死亡高,非嚴重低,但這點直接看四萬人的結論就好。


3 則留言:

  1. 感謝蔡醫師分享。

    有關 radiologic abnormality 一段,我對報告的理解是 RT-PCR 是確診的標準,而 non-severe/severe patients without abnormality on chest CT 分別有244位及15位,當中分別有221位及9位既有病徵又在 RT-PCR 有 positive findings。

    221位及9位這兩顆數字涉及病徵及 RT-PCR positive findings, 而早期確診個案只需 RT-PCR positive finding(並非必需有病徵)。報告的 appendix 並沒有提供既有病徵又有 RT-PCR positive findings的數字。

    這讀法最難以理解的是沒有病徵又怎會到醫院進行檢測,甚至被確診呢?但是暫時我看不到其他可能性了(除非是出錯)。

    回覆刪除
    回覆
    1. 相當感謝分享想法 :)

      這是一個方向......

      但我腦力已經不行了

      看看刊出來之後

      終南山怎麼修改了..........

      要不是 COVID-19

      被 major revise or reject 的機會蠻高的

      刪除