Lợi ích to lớn của big data trong nghiên cứu y khoa

Thứ Sáu, 11/03/2016, 07:05
Mỗi ngày, có thêm nhiều dữ liệu hơn về cuộc sống của bạn được tạo ra. Các chuyên gia ước tính có đến 90% dữ liệu trên thế giới được tạo ra chỉ trong 2 năm qua, và lý do của con số này là sự tiến bộ ngày càng vượt trội của công nghệ.

Internet, smartphone, camera, thiết bị cảm biến, các loại thẻ ngân hàng và mạng xã hội chỉ là một số trong rất nhiều sản phẩm giúp làm phình to “big data” (dữ liệu lớn) theo mỗi giây. Công nghệ tiến bộ mang lại nhiều cơ hội cho các nhà khoa học, trong đó đáng kể nhất là ngành y.

Việc giải mã trình tự bộ gene người, gồm khoảng 3 tỷ phân tử ADN, thường phải mất đến vài năm để hoàn thành. Nhưng hiện nay chỉ cần chưa đến 1 tuần để làm việc đó. Thông tin mà bộ gene cung cấp giúp cho các nhà khoa học nhằm hiểu rõ hơn về cơ sở gene của nhiều loại bệnh tật con người mắc phải.

Giáo sư Martin Landray.

Một số dự án quy mô lớn như là Dự án bản đồ 100.000 bộ gene người – trong đó các nhà khoa học sẽ tiến hành phân tích mã gene của khoảng 75.000 của bệnh nhân ung thư và các căn bệnh hiếm, cũng như họ hàng gần nhất của họ -  được chính phủ Anh tài trợ 300 triệu bảng Anh (khoảng 507 triệu USD) và dự kiến hoàn thành vào năm 2017 sẽ đem lại cơ hội cho một số gia đình chẩn đoán căn bệnh bí ẩn của con cái. Tổ chức Genomics England do Bộ Y tế Anh thành lập chịu trách nhiệm giám sát dự án.

Trong y khoa, bệnh án điện tử (hay số hóa) giúp tạo thành nguồn dữ liệu lớn trong đó chứa đựng mọi dữ liệu về bệnh nhân cho đến thông tin về bệnh học, xét  nghiệm (scan, X-quang…).

Harry Hemingway - Giáo sư khoa dịch tễ học lâm sàng và Giám đốc Viện Nghiên cứu tin học y tế Farr – là người đang khai thác dữ  liệu lớn để mang lại lợi ích cho bệnh nhân cũng như cộng đồng. Nói cách khác, Giáo sư Hemingway muốn cải thiện sức khỏe con người và chất lượng chăm sóc y tế dành cho họ bằng cách phân tích mọi loại thông tin đã vô danh hóa (lọc bỏ các thông tin cá nhân). Ví dụ, với sự liên kết dữ liệu từ các bệnh viện, Giáo sư Hemingway có thể “xác định tiến trình thời gian quan trọng của bệnh”. Ở Anh, có quá nhiều bệnh nhân ung thư được chẩn đoán  muộn khi bệnh tình thường đã tiến triển đến mức không thể chữa trị được.

Nghiên cứu bộ gene người để thành lập”dữ liệu lớn”.

Thế nhưng, nguồn dữ liệu từ những bệnh nhân này có thể giúp chẩn đoán bệnh sớm hơn cho những người khác. Vấn đề cũng tương tự với một trong những bệnh giết người nguy hiểm nhất thế giới như bệnh tim mạch và ung thư buồng trứng vốn rất khó phát hiện. Giáo sư Hemingway giải thích: “Chúng ta có thể sử dụng dữ liệu và máy tính để quan sát mọi triệu chứng và xác định dấu hiệu của những bệnh này”.

Mối lo ngại chính của Giáo sư Hemingway là sự gây tổn hại không cần thiết và cái chết xảy ra quá thường xuyên ở Anh bởi vì nguồn dữ liệu chưa được phân tích. Giáo sư nhận định: “Chúng ta không thể có được một chương trình cải thiện tính hiệu quả của y khoa nếu không có dữ liệu”. Do đó, “dữ liệu lớn” có sức mạnh để trả lời cho rất nhiều câu hỏi trong ngành y. Đó là lý do mà giáo sư dịch tễ học Đại học Oxford (Anh) Martin Landray đang giúp phân tích dữ liệu từ UK Biobank – một dự án bắt đầu từ năm 2006, trong đó tuyển mộ khoảng 500.000 người tuổi từ 40 đến 90 ở khắp nơi trên nước Anh.

Tất cả những người được chọn này được yêu cầu cung cấp mẫu máu, nước tiểu và nước bọt dành để phân tích trong tương lai; cũng như bao gồm cả thông tin chi tiết về cơ thể, chế độ ăn và lối sống của họ. Mỗi người trong số này đều được theo dõi suốt đời cho đến khi qua đời. Mục đích của dự án là tạo lập “dữ liệu lớn” cho ngành y.

Mới đây, một số nhóm người tham gia được thử nghiệm chức năng nhận thức, trong khi các nhóm khác được xác định kiểu gene và những hình ảnh não bộ của họ cũng được chụp. Dữ liệu thu thập được sẽ giúp các nhà khoa học khám phá tại sao một số người mắc phải những bệnh đặc biệt trong khi số khác thì không. Tuy nhiên, đây không phải là công việc dễ dàng.

Giáo sư Landray nói: “Anh không thể chỉ đặt một bác sĩ X-quang ngồi trước hàng chục ngàn hình ảnh scan cộng hưởng từ MRI để phân tích. Anh phải đơn giản hóa chúng và sau đó cùng làm việc với các nhà nghiên cứu”. Bởi vì, dữ liệu có những lỗ hổng bên trong và vô cùng rối rắm. Sắp tới, Viện Dữ liệu lớn ở Oxford sẽ đi vào hoạt động, với hơn 500 nhà khoa học để xử lý phân tích nguồn dữ liệu từ UK Biobank.

Trước đây, các nhà nghiên cứu có rất nhiều câu hỏi đặt ra về sức khỏe con người, song họ phải chờ nhiều năm mới tìm thấy câu trả lời. Nhưng, Giáo sư Landray cho rằng hiện nay họ đã có cơ hội nhận được câu trả lời trong thời gian nhanh nhất. Đó là lợi ích to lớn mà “dữ liệu lớn” mang lại cho khoa học. Nghiên cứu chỉ dựa vào một số nhỏ bệnh nhân sẽ dẫn đến nhiều sai lầm, đặc biệt khi phải phân tích các yếu tố nguy cơ của bệnh. Do đó, hiện nay nhiều nước trên thế giới đang chạy đua sử dụng dữ liệu để cứu mạng bệnh nhân.

Ở Mỹ, mới đây Tổng thống Barack Obama đã cho khởi động chương trình “Sáng kiến y khoa chính xác” với mục đích thu thập “dữ liệu lớn” phục vụ yêu cầu chữa bệnh. Ở Trung Quốc, một nghiên cứu tiến hành với 500.000 người cũng để tiến tới thành lập nguồn “dữ liệu lớn”.

Di An (tổng hợp)
.
.