Việc công ty phân tích dữ liệu Cambridge Analytica mua thông tin của 50 triệu người dùng Facebook Mỹ từ một giảng viên Đại học đã gây rúng động suốt một tuần qua. Trong khảo sát của giảng viên Đại học Cambridge năm 2014, có tất cả 270.000 người đăng ký, nhưng kết quả là có 50 triệu người dùng – là bạn bè của người tham gia – cũng trở thành nạn nhân mà họ không hề hay biết.

Giới bảo mật cho hay, chuyện thu thập và khai thác thông tin tương tự đã được biết đến từ lâu, còn vụ Cambridge Analytica gây chấn động đơn giản vì  Cambridge Analytica tham gia phân tích dữ liệu cho chiến dịch tranh cử Tổng thống Mỹ của ông Donald Trump năm 2016. 50 triệu người dùng tương đương với 25% số cử tri của Mỹ trước đợt bầu cử, tức dữ liệu bị thu thập kia có thể đã được khai thác để tác động đến kết quả bầu cử.

Ảnh minh họa: Verge

Ảnh minh họa: Verge

Trang Verge đã đăng chia sẻ của Alexandra Samuel với góc nhìn của dân “trong nghề”:
“Thời điểm Cambridge Analytica mua dữ liệu, tôi đang là Phó giám đốc phụ trách mạng xã hội của Vision Critical – một công ty chuyên cung cấp phần mềm tùy biến thông minh, hỗ trợ quản lý các phản hồi từ người dùng cho hơn một phần ba các công ty trong danh sách Fortune 100. Các khách hàng doanh nghiệp của chúng tôi muốn có thêm dữ liệu từ mạng xã hội để bổ sung thông tin cho các khảo sát người dùng và công việc của tôi là tìm ra cách để tích hợp dữ liệu mạng xã hội với dữ liệu khảo sát.

Chúng tôi được rất nhiều nhà cung cấp chào bán các giải pháp thu thập dữ liệu. Năm 2012, công ty phân tích Microstrategy giới thiệu công cụ “Wisdom” trên Facebook với cơ sở dữ liệu của 12 triệu người dùng Facebook. Nhưng khi tôi nói chuyện lại với một chuyên gia của Microstrategy vào tháng 12 vừa qua, ông ta cho biết kho dữ liệu thực ra lên tới 17,5 triệu người dùng, dù chỉ dựa trên số lượt người cài đặt công cụ là 52.600. Có nghĩa, mỗi người cài đặt ứng dụng đã ‘cấp quyền’ cho nhà phát triển ứng dụng tiếp cận thông tin của trung bình 332 bạn bè của họ. Những bạn bè đó – không hề cài đặt ứng dụng và rất nhiều trong số đó có thể có ý thức bảo mật rất cao – vẫn trở thành nạn nhân chỉ vì sự vô ý của người dùng.”

Những gì Microstrategy thực hiện không có gì là bất bình thường. Thủ thuật này cũng giống như chuyện diễn ra trong vụ Cambridge Analytica – 270.000 người tham gia khảo sát, dẫn đến 50 triệu người bị thu thập thông tin và là mục tiêu của những quảng cáo cá nhân hóa.

Nói cách khác, nếu bạn chưa từng tham gia khảo sát, trắc nghiệm… nào trên Facebook, nhưng đã thấy bạn bè của mình thực hiện và chia sẻ trên News Feed thì không loại trừ khả năng, dữ liệu của bạn cũng rơi vào tay nhà phát triển và được bán toàn cầu nếu ứng dụng đó được viết ra để thu thập thông tin. 

“Tôi đã biết từ 10 năm trước rằng API của Facebook cho phép thu thập dữ liệu của bạn bè. Nhưng tôi cũng không ngạc nhiên khi mọi người bị sốc trước thông tin này bởi 95% người dùng Facebook không biết điều đó. Họ chỉ nghĩ rằng, nếu Facebook hay ai đó bán thông tin của bạn, thì bạn là nạn nhân. Họ không biết rằng bạn đã kéo theo cả bạn bè, người thân của bạn theo nữa”, Mary Hodder, cố vấn bảo mật của Identity Ecosystem Steering Group, cho hay.

Nếu Facebook “hào phóng” trong việc cho tiếp cận thông tin thành viên đến vậy, thì các nhà tiếp thị, quảng cáo, các chuyên gia phát triển phần mềm chẳng khó gì xây dựng ứng dụng kiểu “vô thưởng vô phạt” để thu thập dữ liệu qua những trò đố vui, ứng dụng hài hước hay trắc nghiệm như “Tính cách nổi bật của vợ tương lai”, “Ai hay vào Facebook của bạn nhất”, “Ai là người đang thầm thương trộm nhớ bạn”, “Bạn sẽ chết năm bao nhiêu tuổi”, “Năm 50 tuổi bạn sẽ có bao nhiêu tiền”…

Từ năm 2015, báo Telegraph đã đặt câu hỏi: Giả sử một người lạ gặp bạn trên phố, đề nghị bạn cung cấp tất cả dữ liệu cá nhân của mình và của bạn bè, từ ảnh, video, ngày sinh, nơi ở cho đến các thông tin về chồng/người yêu, con cái… ngược lại, họ sẽ mời họ chơi một trò chơi, bạn có đồng ý không?

Thông thường, đa số sẽ từ chối lời đề nghị, thế nhưng có đến hàng triệu người đang thực hiện điều tương tự trên mạng. Chẳng hạn, công ty Vonvon đã phát triển ứng dụng với khả năng tổng hợp status, chú thích ảnh, video… của người dùng để xem những từ nào họ hay sử dụng nhất. Để thực hiện điều này, Vonvon yêu cầu người tham gia cho phép họ tiếp cận mọi thông tin trên Facebook như tên, giới tính, học vấn, địa chỉ nhà, địa chỉ IP, danh sách bạn bè, status và những thứ người dùng “like”. Gần 18 triệu người đã chấp nhận.

Công ty này cho biết dữ liệu sẽ được lưu trên máy chủ “ở nhiều nước trên toàn thế giới” và họ có thể bán các thông tin về cho bên thứ ba vì người dùng đã đọc các chính sách về bảo mật và đã đồng ý cho Vonvon làm điều đó. Cách đây 3 năm, hãng Western Digital công bố kết quả nghiên cứu cho thấy dữ liệu cá nhân của mỗi người dùng Facebook có giá trung bình lên tới gần 5.000 USD tại Mỹ.

Mục tiêu của các vụ thu thập dữ liệu này là để phân loại người dùng như giới tính, độ tuổi, vị trí địa lý, sở thích, thói quen, các mối quan hệ cá nhân… để phục vụ cho các nhà quảng cáo hiển thị những nội dung phù hợp. Còn vụ Cambridge Analytica gây sốc bởi dữ liệu có thể tác động đến kết quả bầu cử Tổng thống Mỹ năm 2016.

Nhiều người dùng mạng xã hội không hiểu rằng các ứng dụng ra đời chẳng phải chỉ để “cho vui”. “Khi bạn thực hiện một bài trắc nghiệm nho nhỏ, ai đó ở đầu bên kia đang rất mãn nguyện với dữ liệu mà họ nhận về”, Susanne Yad, một chuyên gia về quảng cáo Facebook, nói.