Chuyên mục

Thế giới vi diệu Cảm nhận Tham khảo Giải trí Hình ảnh Danh ngôn truyên cười Tư tưởng Cảm nghỉ Các bài viết Gương Bác

Thứ Năm, 3 tháng 5, 2012

sai sót trong NCKH (bài 1)


Sai sót trong NCKH (Gs NVT)
Bắt đầu từ tuần này, tôi sẽ cố gắng trình bày những sai sót phổ biến trong phân tích dữ liệu y khoa. Hi vọng rằng chúng ta cùng nhau học những sai sót này để chất lượng nghiên cứu trong tương lai được nâng cao.



Phân tích thống kê là một phần không thể thiếu được trong các nghiên cứu y khoa, nhất là nghiên cứu lâm sàng và dịch tễ học.  Thống kê đã được ứng dụng trong y học từ những năm trong thập niên 1930s, nhưng thật ra từ thế kỉ 19 người ta cũng đã nghĩ đến việc sử dụng các thuật phân tích thống kê trong thử nghiệm lâm sàng.  Mặc dù đã trải qua hơn 1 thế kỉ ứng dụng, nhưng cho đến ngày nay vẫn còn rất nhiều sai sót về phân tích thống kê trong các công trình nghiên cứu y học.  Một số sai sót không ảnh hưởng gì đến kết luận của nghiên cứu, nhưng nhiều sai sót mang tính hệ thống thì có khi làm cho công trình nghiên cứu có một ý nghĩa hoàn toàn khác với kết luận của tác giả.
Để khắc phục tình trạng sai sót về phân tích thống kê trong nghiên cứu y học, nhiều nhóm trên thế giới đã xuất bản những “phác đồ”, những hướng dẫn trong cách phân tích và trình bày kết quả phân tích dữ liệu.  Đây là một nỗ lực trong thực hành y học thực chứng, bởi vì y học thực chứng dựa vào những công trình nghiên cứu có chất lượng và chứng cứ phải chính xác.  Trong bối cảnh nghiên cứu y học ở Việt Nam, y học thực chứng vẫn còn trong giai đoạn đầu, và nhìn qua những bài báo khoa học rất dễ nhận ra nhiều sai sót về phân tích dữ liệu trong mỗi bài báo.  Đó cũng là một trong những nguyên nhân dẫn đến chất lượng nghiên cứu y học ở Việt Nam không có phẩm chất cao.  Chúng ta cần phải khắc phục tình trạng yếu kém này.
Phân tích thống kê có thể chia thành hai lĩnh vực chính: phân tích mô tả và phân tích suy luận.  Phân tích mô tả quan tâm đến cách mô tả dữ liệu từ một mẫu hoặc từ một công trình nghiên cứu.  Phân tích suy luận bao gồm các phương pháp phân tích cách ước tính, suy luận, kiểm định giả thuyết khoa học.  Trong loạt bài này, tôi sẽ trình bày những sai sót phổ biến nhất về phân tích mô tả và phân tích suy luận trong các nghiên cứu y học trên thế giới và Việt Nam, với hi vọng rằng những sai sót này sẽ giảm đi trong tương lai, và chất lượng nghiên cứu khoa học sẽ được nâng cao.
Tôi sẽ lần lượt (hai ngày một lần) trình bày những sai sót này để chúng ta cùng tham khảo và bàn luận.  Nếu bạn đọc phát hiện những thiếu sót gì mới, xin cung cấp thông tin cho chúng tôi để bình luận.  Dĩ nhiên, theo qui ước y khoa, chúng tôi sẽ giữ kín thông tin các bạn cung cấp.
Sai sót 1: Không định nghĩa biến phân tích rõ ràng
Đặc tính của khoa học là cân, đo, đong, đếm.  Nhà nghiên cứu cần phải nói cho người đọc (và công chúng) biết những biến lâm sàng mà họ đo lường là gì, và phải cung cấp định nghĩa của những biến đó sao cho người đọc có thể hiểu được.  Chẳng hạn như khi nói đến mật độ xương (bone mineral density - BMD), nhà nghiên cứu phải định nghĩa BMD là gì, đo ở vị trí nào trong cơ thể, đơn vị đo lường là gì, và đo bằng phương pháp hay phương tiện gì.  Hay như huyết áp, nhà nghiên cứu phải cung cấp định nghĩa ngưỡng giá trị nào là “cao huyết áp” và  ngưỡng nào là “bình thường”.  Tương tự, khi đề cập đến béo phì (obesity), nhà nghiên cứu phải định nghĩa thế nào là béo phì, và dùng chỉ số nào để định nghĩa.  Chẳng hạn như BMI trên 27.5 (ở người Á châu) hay trên 30 (ở người Âu châu) được xem là béo phì.
Đối với các biến liên quan đến khái niệm hoặc hành vi (behavior) vấn đề định nghĩa có thể khó hơn vì khó đo lường.  Chẳng hạn như trầm cảm được định nghĩa bằng thang điểm Zung Depression Inventory (ZDI) trên 50, nhưng biến số này phản ảnh trầm cảm chính xác độ nào thì là một vấn đề còn trong vòng tranh cãi. Trong một cuộc điều tra qui mô ở Mĩ, một cá nhân được xem là “đang hút thuốc lá” là người hút thuốc lá trong vòng 30 ngày trước khi tham gia cuộc điều tra.  Mặc dù định nghĩa này không hiển nhiên như chúng ta mong muốn, nhưng đó là một định nghĩa mang tính “operational”, và nhà nghiên cứu phải phát biểu, cho dù chúng ta có thể không đồng ý với định nghĩa đó.
Sai sót 2: Không cung cấp độ đo lường cho từng biến số
Độ đo lường (level of measurement) là một thông tin quan trọng cho phân tích thống kê.  Trong lí thuyết đo lường, người ta phân biệt ba loại biến số: định danh (nominal), định cấp độ (ordinal), và liên tục (continuous).
Ở mức độ thấp nhất là những dữ liệu mang tính định danh, tức những biến bao gồm hai hay hơn hai loại (nam hay nữ), hoặc tên (đạo Phật, đạo Công giáo), phân loại nhưng không có tính thứ tự cao thấp (như nghề nghiệp). Loại máu A, B, AB, hoặc O cũng được xem là dữ liệu định danh.
Các dữ liệu định cấp bao gồm thể loại có thứ tự cao thấp và có thể xếp hạng.  chẳng hạn như một cá nhân có thể là thấp, trung bình, hay cao.  Chúng ta có thể không biết chính xác chiều cao của bệnh nhân, nhưng chúng ta biết bệnh nhân đó thuộc nhóm cao, trung bình hay thấp.
Các biến liên tục có giá trị chính xác hơn các biến định cấp và định danh.  Những biến số như chiều cao (đo bằng cm), cân nặng (kg), huyết áp (mmHg), mật độ xương (g/cm2), v.v. được xem là những dữ liệu liên tục.  Dữ liệu liên tục là những dữ liệu có độ chính xác cao nhất trong 3 nhóm đo lường.
Nhà nghiên cứu cần phải nói rõ biến phân tích thuộc loại nào trong bài báo khoa học. Chẳng hạn như huyết áp của một bệnh nhân có thể chia thành hai nhóm (tăng hay không tăng), hoặc như là một biến phân cấp (hypotensive, normotensive, và hypertensive), hoặc như là một biến liên tục.  Đây là vấn đề quan trọng, bởi vì đặc tính của biến số quyết định phương pháp phân tích.  Do đó, nếu nhà nghiên cứu không định nghĩa và không mô tả biến phân tích rõ ràng, thì người đọc sẽ không lĩnh hội được kết quả nghiên cứu có ý nghĩa gì.
NVT
Related Posts Plugin for WordPress, Blogger...

Không có nhận xét nào: