Lại nghĩ về tỉ lệ tử vong covid ở Việt Nam

Nguyễn Văn Tuấn

Hôm nay, đọc bài góp ý của thầy Nguyễn Đình Cống [1] tôi muốn nhân dịp này bàn thêm về tỉ lệ tử vong theo một phương pháp khác. Tôi vẫn nghĩ con số tỉ lệ tử vong ở VN thấp hơn con số nhà nước báo cáo.

Nhìn bề ngoài (và tính đến nay 8/9/2021) thì tỉ lệ tử vong ở VN tính trên 100 ca dương tính là 2.48% (13701/550996) [2]. Nhưng tôi nghĩ con số này là cao hơn thực tế. Vậy có cách nào ước tính con số gần với thực tế?

Tỉ lệ tử vong (tính trên 100 ca nhiễm) cho mỗi tỉnh thành tính đến ngày 7/9/2021.

Thầy Nguyễn Đình Cống cho rằng con số tỉ lệ tử vong 0.26% mà tôi dùng làm điểm tham khảo (để tính số người bị nhiễm trong cộng đồng) là thấp hơn thực tế, vì “còn nhiều người bị chết oan vì những nguyên nhân khác.”

Viết ra một cái note mà có người chú ý và góp ý thì tôi quí lắm, vì ít ra cũng có người đọc và suy nghĩ về nó. Huống hồ chi người góp ý là thầy Cống mà tôi rất kính trọng những quan điểm và suy tư của Thầy. Tôi thấy mình như muốn bàn thêm về suy nghĩ của Thầy Cống.

Trang web ncov cung cấp dữ liệu về số ca nhiễm (đúng ra là số ca dương tính) và số ca tử vong cho từng tỉnh/thành. Tôi tóm tắt những con số đó qua biểu đồ dưới đây để các bạn có thể hình dung tỉnh nào đang đứng đầu và tỉnh nào đứng cuối bảng ‘phong thần’. Không nói ra thì ai cũng biết TPHCM đứng đầu (4.11%). Tỉnh đứng cuối bảng là Hải Dương (0.1%). Thật ra, có 23 tỉnh thành đứng cuối vì 0 ca tử vong.

Chúng ta có thể suy luận gì từ những con số trên?

Có vài điểm cần chú ý. Điều thứ nhứt cần nhớ là các tỉnh thành có 0 ca tử vong không có nghĩa là sẽ có 0 ca tử vong. Điều thứ hai các tỉnh có tỉ lệ tử vong thấp vì số ca tử vong qúa thấp, nên ước số không có độ tin cậy cao. Chẳng hạn như Hải Dương, với 957 ca nhiễm và 1 ca tử vong, thì cái tỉ lệ 0.1% đó là không đáng tin cậy về mặt thống kê. Do đó, nếu lấy trung bình kiểu tổng số ca tử vong từ các tỉnh chia cho tổng số ca nhiễm là không phản ảnh đúng tình hình.

Vấn đề ở đây là tỉ lệ tử vong (tính trên số ca nhiễm hay CFR) rất ư là khác nhau giữa các tỉnh thành. Chúng ta cần có một cách hiệu chỉnh cho sự khác biệt đó. Tôi nghĩ đến một phương pháp Bayes để tích hợp các tỉ lệ tử vong từ các tỉnh thành.

Với phương pháp Bayes, chúng ta tạm gọi số ca tử vong ở mỗi tỉnh thành là d(i) và số ca nhiễm là n(i), với i chỉ 1 tỉnh thành. Chúng ta giả định rằng d(i) tuân theo luật phân bố nhị phân (tức binomial distribution) với trung bình p(i) và phương sai s2(i). Chúng ta còn giả định rằng tập hợp logit của p(i) của nhiều tỉnh thành tuân theo luật phân bố chuẩn (normal distribution) với trung bình Theta và phương sai Tau. Vấn đề là chúng ta ước tính Theta và Tau. Với phương pháp Bayes, chúng ta cho p(i) một phân bố tiền định (prior distribution) phản ảnh rằng chúng ta không biết gì về tỉ lệ thật của mỗi tỉnh thành. Để phản ảnh sự kém hiểu biết đó, tôi cho p(i) theo phân bố chuẩn với trung bình 0  là phương sai cao như 10,000. Theta ở đây chính là tỉ lệ tử vong của cả nước, và Tau là phương sai (như nói trên). Từ đó, chúng ta có thể ước tính khoảng tin cậy 95% tỉ lệ tử vong. Đó là đại khái vài nét về lí thuyết và mô hình.

Kết quả ra sao?

Kết quả có thể xem qua biểu đồ 2 dưới đây. Nhưng biểu đồ hơi khó đọc, nên tôi mô tả cho dễ hiểu: tính trung bình, tỉ lệ tử vong trung bình của cả nước là 0.64%, với xác suất 95% dao động trong khoảng 0.47% đến 0.87%.

Ước tính tỉ lệ tử vong trong cộng đồng. Biểu đồ trình bày: (a) cột 2 là số ca tử vong; (b) cột 3 là số ca nhiễm hay dương tính; (c) cột 4 là xác suất tử vong tính trên số ca nhiễm / dương tính. Dòng cuối là ước tính xác suất tử vong cho cả nước: trung bình 0.64%, với xác suất 95% dao động trong khoảng 0.47% đến 0.87%.

Như vậy, mặc dù tỉ lệ đơn giản của cả nước là 2.48%, nhưng nếu xem xét dao động giữa các tỉnh thành về con số ca nhiễm và số ca tử vong, có lẽ tỉ lệ tử vong thật dao động từ 0.64% đến 0.87%.

Nhưng cách tính trên đây vẫn còn khiếm khuyết, vì chưa có số liệu về độ tuổi và số lượng xét nghiệm ở mỗi tỉnh thành. Vả lại, con số tử vong báo cáo có thể không đúng với thực tế (như thầy Cống nói), nên con số thật có thể dao động cao thấp trong tương lai. Tôi sẽ chờ khi nào có đủ dữ liệu theo độ tuổi, tôi sẽ viết thành một bài báo khoa học.

N.V.T.

Nguồn: nguyenvantuan.info

_____

[1] https://boxitvn.blogspot.com/2021/09/oi-loi-voi-ong-nguyen-van-tuan.html

[2] https://ncov.moh.gov.vn/en/web/guest/trang-chu

This entry was posted in Tử vong vì covid-19. Bookmark the permalink.