Ngành công nghiệp thu thập dữ liệu trị giá tỷ USD

Thứ Ba, 17/04/2018, 08:20
Trong khi Facebook cố gắng thắt chặt kiểm soát hành vi truy cập dữ liệu người dùng của bên thứ 3 nhằm phục hồi danh tiếng, dư luận tập trung chú ý vào vấn đề dữ liệu bị thu thập cũng như mối đe dọa quyền riêng tư phát sinh từ đó.

Thu thập dữ liệu được đánh giá là ngành công nghiệp trị giá hàng tỷ USD và sự thật đáng lo ngại là người dùng không bao giờ biết mình có bao nhiêu dữ liệu bị những công ty trong lĩnh vực này nắm giữ hay làm thế nào để xóa những dữ liệu đó. Đó là kết luận gây sửng sốt mà một số nhà hoạt động về quyền riêng tư và các công ty công nghệ vừa công bố.

Frederike Kaltheuner, nữ lãnh đạo chương trình dữ liệu cho nhóm vận động hành lang Privacy International, nhận định: “Hàng ngàn công ty đang âm thầm thu thập dữ liệu đồng thời theo dõi hành vi trực tuyến của người dùng. Bởi vì, đây là lĩnh vực kinh doanh toàn cầu. Và không chỉ trực tuyến mà còn cả ngoài đời thực thông qua thẻ khách hàng trung thành và tính năng dò sóng wifi của điện thoại di động. Trong khi đó người dùng gần như không biết được những gì đang xảy ra với dữ liệu của mình”.

Ủy ban Thương mại liên bang Mỹ (FTC) ở Washington tiết lộ các công ty môi giới dữ liệu lớn - như là Acxiom, Experian, Quantium, Corelogic, eBureau, ID Analytics - có thể nắm giữ đến 3.000 điểm dữ liệu ở mỗi người dùng. Theo Kaltheuner, khoảng 600 ứng dụng âm thầm truy cập vào dữ liệu điện thoại iPhone của bà trong vòng 6 năm qua. Đó là lý do thôi thúc Kaltheuner thực hiện nhiệm vụ khó khăn là tìm hiểu chính xác các ứng dụng này đã biết được những gì về cá nhân bà.

Bạn có thể không bao giờ biết bao nhiêu dữ liệu cá nhân bị thu thập.

Kaltheuner cho rằng công việc “có thể phải mất 1 năm” do cần xem xét lại mọi chính sách bảo mật và sau đó liên hệ với nhà cung cấp ứng dụng để tra vấn. Dĩ nhiên, bà sẽ không chấp nhận câu trả lời "không" từ họ. Đối với Kaltheuner, không chỉ khó mà biết được các công ty đang nắm giữ dữ liệu nào, mà còn khó biết dữ liệu đó chính xác hay không.

Pamela Dixon, nữ giám đốc điều hành nhóm vận động hành lang về quyền riêng tư Diễn đàn Bảo mật thế giới (WPF), tiết lộ sự thật của bản thân: “Dữ liệu họ có được về mức thu nhập của tôi là hoàn toàn sai, tình trạng hôn nhân của tôi cũng sai”. Bà Dixon khám phá ra điều này khi kiểm tra hồ sơ của mình với một trong những công ty thu thập và bán dữ liệu cá nhân trên toàn cầu.

Susan Bidel, chuyên gia phân tích  làm việc về các nhà môi giới dữ liệu cho Forrester Research - công ty nghiên cứu thị trường của Mỹ cung cấp dịch vụ tư vấn về tác động tiềm tàng và tiềm ẩn của công nghệ tới khách hàng và công chúng - ở thành phố New York (Mỹ), bình luận rằng thật ra chỉ “50% dữ liệu thu thập là chính xác”.

Dữ liệu của người tiêu dùng - những điều thích hay không thích, thói quen mua hàng, mức thu nhập, thói quen giải trí, tính cách v.v... - chắc chắn sẽ giúp các thương hiệu biết phải đổ tiền quảng cáo vào các mục tiêu nào cho có hiệu quả hơn. Thế nhưng “mục đích sử dụng chính của các công ty này là để giảm thiểu nguy cơ nào đó, chứ không phải để nhắm vào quảng cáo” - theo giải thích từ John Deighton, giáo sư Trường Kinh doanh Harvard và tác giả về ngành công nghiệp thu thập dữ liệu.

Giáo sư Deighton cho biết nếu thông tin về bạn tốt, thẻ tín dụng và mức thế chấp của bạn sẽ rẻ hơn rất nhiều, đồng thời bạn sẽ dễ được nhà tuyển dụng chấp nhận hơn. Tuy nhiên, Pamela Dixon cho rằng những điểm số nói trên có thể không những không chính xác; mà còn có tính phân biệt đối xử, ẩn chứa thông tin về chủng tộc, tình trạng hôn nhân và tôn giáo.

Frederike Kaltheuner.

WPF kết luận trong một báo cáo: “Một cá nhân có thể không bao giờ nhận ra rằng họ không được phỏng vấn, tuyển dụng, giảm giá, hay bị lỡ cơ hội do điểm tín dụng thấp”.

Từ năm 1841, Dun & Bradstreet đã thu thập thông tin tín dụng và dữ liệu riêng tư về cá nhân đang muốn vay tiền. Trong thập niên 1970, các nhà môi giới cung cấp băng từ chứa nhiều dữ liệu một cách đáng kinh ngạc: giấy phép đi câu, danh sách tạp chí mua dài hạn, hoặc những người có cơ hội kế thừa tài sản. Nhưng ngày nay, dữ liệu thu thập trực tuyến đã lấn át thống kê truyền thống và dữ liệu cử tri danh sách cử tri. Nhiều người trong chúng ta hầu như không hề biết đã và đang chia sẻ bao nhiêu dữ liệu bản thân bởi vì chúng ta thường hay dễ dàng chấp nhận những điều khoản hay yêu cầu trên Internet mà không đọc kỹ chúng. Song, điều đó có thể hiểu và thông cảm được.

Hai nhà nghiên cứu Đại học Carnerfie Mellon (Mỹ) giải thích người dùng phải mất 8 giờ/ngày để chỉ đọc từng chính sách về quyền riêng tư trực tuyến và kéo dài trong 76 ngày như thế! Do đó, Frederike Kaltheuneur cho rằng: “Các công ty cần bảo vệ dữ liệu chúng ta theo cách mặc định”. Các chuyên gia cũng khuyến cáo không chỉ có các công ty và nhà quảng cáo thu thập dữ liệu người dùng mà còn có cả đám hacker.

Vậy thì chúng ta làm thế nào để kiểm soát dữ liệu cá nhân? Có nhiều cách giúp chúng ta hạn chế được số lượng dữ liệu chia sẻ cho các bên thứ 3: ví dụ như thay đổi cài đặt trình duyệt để chặn các cookie, sử dụng phần mềm chặn quảng cáo, truy cập nặc danh hay các mạng riêng tư ảo. Các cỗ máy tìm kiếm như DuckDuckGo giới hạn lượng thông tin tiết lộ cho các hệ thống truy cập trực tuyến.

Tuy nhiên, John Deakins - người sáng lập và giám đốc điều hành công ty tiếp thị CitizenMe - tin rằng người dùng nên chi tiền để sử dụng dịch vụ bảo vệ dữ liệu cá nhân.

An Di (tổng hợp)
.
.