Trong 18 tháng qua, sống trong căn hộ ở Tel Aviv, Ariel Karlinsky đã lùng sục trên mạng để tìm dữ liệu có thể giúp anh tính toán số người chết thực sự do Covid-19, theo Guardian.
Sinh viên kinh tế 31 tuổi tại Đại học Hebrew ở Jerusalem trước đây chưa bao giờ làm việc về các vấn đề sức khỏe, nhưng anh nghi hoặc trước những thông tin rằng tỷ lệ tử vong vì Covid-19 ở Israel không nhiều hơn con số mà đất nước đã lường trước, và do đó Covid-19 không nghiêm trọng.
“Tất nhiên, điều này không đúng. Tỷ lệ tử vong cao hơn những gì được báo cáo là điều chắc chắn và rất rõ ràng”, Karlinsky nói. Anh đã đưa ra các con số để chứng minh điều đó, điều này rất dễ thực hiện ở Israel với hệ thống đăng ký nhân khẩu nghiêm ngặt.
Tiếp đến là những hoài nghi về tỷ lệ tử vong ở một số quốc gia không áp dụng các biện pháp hạn chế hoặc áp dụng rất ít. Tuy nhiên, việc nắm giữ dữ liệu để chứng minh điều đó khó hơn.
Karlinsky tin rằng hầu hết quốc gia đều đếm thiếu số ca tử vong vì đại dịch. Việc thu thập dữ liệu đó của nhiều quốc gia sao cho gần với thời gian thực nhất là một thách thức.
Qua Twitter, Karlinsky gặp nhà khoa học dữ liệu Dmitry Kobak của Đại học Tübingen ở Đức - người đang cố gắng làm điều tương tự. Và họ đồng ý hợp tác. Trong khi Karlinsky tìm kiếm các con số, Kobak tham gia phân tích.
Kết quả là họ đã cho ra Tập dữ liệu về Tử vong Thế giới (World Mortality Dataset). Tập dữ liệu này đã tạo cơ sở cho các ước tính về tỷ lệ tử vong vì Covid-19 được công bố trên Economist, Financial Times và nhiều tờ báo hoặc tạp chí khác.
Các con số thực tế được công bố trên các tạp chí này thường cao hơn gấp nhiều lần so với con số được báo cáo chính thức trên toàn cầu là 4,8 triệu người chết. Ví dụ, Economist đưa ra con số thực tế là gần 16 triệu người.
Một bức tranh tường lấy cảm hứng từ Covid-19 ở Delhi, Ấn Độ. Ảnh: AFP. |
Cuộc cách mạng dữ liệu
Những người đo lường tác động của thảm họa sức khỏe cộng đồng đã hoan nghênh nỗ lực của Karlinsky và Kobak.
Các nhà dịch tễ học Lone Simonsen (Đại học Roskilde ở Đan Mạch), và Cécile Viboud (thuộc Viện Y tế Quốc gia Mỹ), đã viết: “Đây là một cuộc cách mạng dữ liệu song song với quá trình phát triển vaccine và giải mã trình tự gene của virus”.
Số người chết của đại dịch có thể được đo lường theo nhiều cách khác nhau, tất cả đều có ưu điểm và nhược điểm. Con số chính thức được lấy từ các báo cáo quốc gia về số ca tử vong vì Covid-19, nhưng những báo cáo này phụ thuộc vào tỷ lệ xét nghiệm và hầu như luôn bị đánh giá thấp.
Nhà báo chuyên về dữ liệu Sondre Ulvund Solstad - người dẫn đầu nỗ lực theo dõi đại dịch của Economist, cho biết: “Các con số chính thức về lượng người tử vong vì Covid-19 không đáng tin cậy ở phần lớn quốc gia”.
Cách tính số ca tử vong dựa trên xét nghiệm là một cách tính lỗi thời, đã được sử dụng để ước tính tỷ lệ tử vong của các đại dịch trong lịch sử. Ở những nơi mà điều kiện xét nghiệm còn hạn chế, cách tính này đặc biệt không đáng tin.
Trong khi đó, các con số về lượng người chết thực tế được ước tính không phụ thuộc vào tỷ lệ xét nghiệm.
Cách tính tổng quát không chỉ ghi lại những cái chết trực tiếp vì Covid-19, mà đếm cả người tử vong có liên quan gián tiếp đến đại dịch, chẳng hạn như bệnh nhân ung thư không được điều trị kịp thời, hoặc nạn nhân bị bạo hành trong gia đình trong thời gian phong tỏa hoặc hạn chế.
Karlinsky và Kobak đã thu thập các nguồn dữ liệu địa phương từ những quốc gia nghèo dữ liệu thông qua nhà báo, học giả, và áp dụng những kỹ thuật ngoại suy khác nhau để đưa ra ước tính.
Chôn cất nạn nhân Covid-19 ở Jakarta, Indonesia, ngày 23/7. Ảnh: Reuters. |
Họ cũng ước tính dựa trên dữ liệu sẵn có từ một quốc gia láng giềng của một nước, điều chỉnh các yếu tố như mật độ dân số, chiến lược xét nghiệm Covid-19 và tự do thông tin.
Dữ liệu không chắc chắn là lý do Karlinsky và Kobak tránh ước tính tổng số người chết trên toàn cầu. Tuy nhiên, họ cho biết trung bình ở mỗi quốc gia, số ca tử vong thực tế có thể cao hơn 1,4 lần so với con số được báo cáo.
Trong khi đó, mô hình của Solstad - nhà báo chuyên về dữ liệu của Econmist - đưa ra con số tổng quát từ 9,9 triệu đến 18,5 triệu người chết - một phạm vi mà nhà dịch tễ học Simonsen thấy hợp lý.
Bên cạnh đó, để so sánh với lịch sử, các nhà dịch tễ học Simonsen và Viboud đã đưa ra ước tính về tỷ lệ tử vong thực tế cho những đại dịch trước đó và điều chỉnh chúng cho phù hợp với dân số thế giới vào năm 2020.
Họ ước tính 4 trận đại dịch cúm vào các năm 1918, 1957, 1968 và 2009 nếu xảy ra ở hiện tại thì sẽ có số người chết thực tế lần lượt là 75 triệu, 3,1 triệu, 2,2 triệu, và 0,4 triệu.
Họ kết luận rằng Covid-19 là đại dịch chết chóc nhất trong vòng một thế kỷ qua.
Những con số không đáng tin cậy
Tập dữ liệu về tỷ lệ tử vong thế giới chứa thông tin về hơn 100 quốc gia. Hầu hết quốc gia châu Phi và châu Á đều nằm trong danh sách đếm thiếu số ca tử vong.
Ví dụ, Ấn Độ không thường xuyên công bố dữ liệu quan trọng của quốc gia, nhưng một số nhà nghiên cứu ước tính số người chết do ảnh hưởng từ Covid-19 ở nước này có thể lên tới 4 triệu người, thay vì hơn 450.000 người như được công bố.
Tình nguyện viên cầu nguyện trước thi thể của nạn nhân Covid-19 tại một nghĩa trang ở Mandalay, Myanmar, ngày 14/7. Ảnh: Reuters. |
Bộ dữ liệu mới cũng cho thấy các quốc gia từng bùng dịch nghiêm trọng như Italy, Tây Ban Nha và Anh, không thực sự bị ảnh hưởng nặng nề nhất.
Theo tính toán của các nhà nghiên cứu, Mexico và Bolivia, và một số quốc gia ở Đông Âu - những nước có tỷ lệ tử vong cao hơn 50% so với báo cáo - nằm trong số những nước bị tàn phá nhiều nhất vì đại dịch. Bị ảnh hưởng nặng nề nhất có thể là Peru, ghi nhận mức tăng 150%.
Tập dữ liệu trở nên chính xác hơn theo thời gian vì một số quốc gia bắt đầu công bố một cách nhỏ giọt các dữ liệu mới.
Một số nước đã yêu cầu cơ quan thống kê quốc gia của họ đẩy nhanh việc thu thập và công bố dữ liệu quan trọng của đầu năm 2020, nhưng một số nước khác vẫn chưa thể làm được.
Thổ Nhĩ Kỳ dự kiến công bố dữ liệu quan trọng hàng tháng của năm 2020 vào đầu mùa hè năm nay. Thế nhưng hiện tại, vẫn chưa có công bố nào mới được ra.
Karlinsky nói: “Thổ Nhĩ Kỳ là một ví dụ điển hình. Họ đã tính toán được những con số mới nhưng không công bố vì không muốn giải thích sự khác biệt”.
Tháng 2, trên tạp chí Significance do Hiệp hội Thống kê Hoàng gia Anh xuất bản, Kobak giải thích rằng tỷ lệ tử vong do Covid-19 thực tế của Nga có thể cao hơn 6,5 lần so với con số được công bố. Số người chết được báo cáo của nước này có thể là một trong những con số ít đáng tin cậy nhất trên thế giới.
Hồi tháng 2, Tổ chức Y tế Thế giới (WHO) đã thực hiện bước đầu tiên hướng tới việc xác định tỷ lệ tử vong thực tế khi thành lập một ủy ban chuyên gia để đánh giá tỷ lệ tử vong do Covid-19.