reCaptcha với câu "I'm not a robot" hay bắt bạn tìm ra vạch kẻ đường, cột chữa cháy, đèn tín hiệu giao thông ... sẽ không còn xuất hiện để quấy rối chúng ta mỗi khi đăng nhập tài khoản hay điền biểu mẫu trên một trang web nữa. Google đã cập nhật hệ thống reCaptcha này lên version 3, chỉ chờ các nhà phát triển web triển khai rộng rãi nhưng từ đây, vấn đề về sự riêng tư của người dùng một lần nữa bị đặt dấu chấm hỏi?
reCaptcha V3 hoạt động dựa trên phân tích hành vi duyệt web, từ đó xác định là người hay máy:
Cy Khormaee - trưởng bộ phận reCaptcha của Google cho hay: "reCaptcha V3 sẽ mang lại trải nghiệm tốt hơn cho người dùng. Ai cũng từng xác thực thất bại với Captcha". Theo đó với phiên bản thứ 3 của công nghệ xác thực reCaptcha thì Google sẽ tiến hành phân tích cách mà người dùng chuyển hướng trên các trang web, từ đó thiết lập một thang điểm gọi là điểm rủi ro (risk score) dựa vào hành vi. Khormaee không tiết lộ về loại thông tin hay tín hiệu nào được Google sử dụng để chấm điểm hành vi vì cho rằng những kẻ tấn công sẽ có thể dễ dàng bắt chước hành vi của người dùng bình thường. Tuy nhiên anh tỏ ra tự tin về hệ thống reCaptcha mới khi nó sẽ khiến những ai đang dùng bot để đánh lừa Google vượt hệ thống Captcha phải nản lòng.
Theo các thống kê của trang Built With thì hơn 650.000 trang web đang sử dụng reCaptcha V3 trong tổng số 4,5 triệu trang ứng dụng reCaptcha các phiên bản. 25% trong số 10.000 trang web top đầu đang sử dụng công nghệ xác thực này. Google cũng đang thử nghiệm một phiên bản dành cho doanh nghiệp của reCaptcha V3 với các tính năng tùy biến để doanh nghiệp có thể bảo vệ trang web của họ trước mã độc hay bot.
Tuy nhiên, hệ thống xác thực dựa trên điểm rủi ro này lại đi cùng với một nhược điểm lớn đó là: sự riêng tư của người dùng!
Theo 2 nhà nghiên cứu bảo mật chuyên nghiên cứu về reCaptcha thì một trong những cách mà Google dùng để xác định người dùng có hành vi đáng ngờ hay không là dựa trên Google cookie được cài trên trình duyệt. Đây cũng là cookie cho phép bạn mở các thẻ mới trên trình duyệt mà không cần phải đăng nhập vào tài khoản Google trở lại (bạn mở Gmail và đăng nhập, mở Google Search hay YouTube vẫn tài khoản đó không cần đăng nhập lại).
Tuy nhiên theo Mohamed Akrout - nghiên cứu sinh tiến sĩ ngành khoa học máy tính tại đại học Toronto thì khả năng Google cũng sử dụng các cookie này để xác định yếu tố con người với reCaptcha V3. Akrout đã viết một báo cáo và công bố hồi tháng 4 về cách reCaptcha V3 mô phỏng những gì chạy trên một trình duyệt với tài khoản Google đã kết nối và kết quả là điểm rủi ro của của tài khoản Google này luôn thấp hơn so với các trình duyệt không đăng nhập. Anh nói: "Nếu bạn có tài khoản Google thì khả năng bạn là con người cao hơn"
. Google vẫn không phản hồi trước các câu hỏi về vai trò của Google cookie đối với công nghệ reCaptcha.
Nhà cố vấn bảo mật Marcos Perona cũng xác nhận điều này khi nói điểm rủi ro reCaptcha luôn thấp hơn khi lướt trang web thử nghiệm bằng trình duyệt có đăng nhập tài khoản Google. Ngược lại, nếu mở trang web thử nghiệm trên một trình duyệt bảo mật riêng tư như Tor Browser hay thông qua VPN thì điểm số này luôn cao.
Khormaee không nói về cách Google sử dụng dữ liệu cho reCapcha mà chỉ nhắc đến nội dung điều khoản dịch vụ của Google nhúng trong logo reCaptcha có mặt trên hầu hết các trang web. Dù vậy, không có thông tin tham khảo nào về reCaptcha trong các điều khoản này. Sau khi thông tin trên được công bố thì Google đã tiếp cận với trang Fast Company và cho biết hàm API của reCaptcha sẽ gởi thông tin phần mềm và phần cứng bao gồm dữ liệu thiết bị và ứng dụng về cho Google để phân tích và dịch vụ này chỉ được sử dụng để chống spam cũng như các hình thức lạm dụng khác.
Tăng cường bảo mật và trải nghiệm hay là một công cụ để moi dữ liệu người dùng?
Google vẫn đang khuyến khích các trang web sử dụng reCaptcha trên toàn trang từ đó Google sẽ có thể chia sẻ thông tin về điểm rủi ro cho các quản trị viên nhằm mục đích bảo mật. Theo Perona thì đây là mục đích tốt bởi nó sẽ mang lại cho người sở hữu trang web quyền điều khiển và nhận thức rõ ràng hơn về những gì đang xảy ra trước nguy cơ bị tấn công bởi scammer hay bot. Quản trị viên trang web cũng có được hệ thống điểm rủi ro chính xác hơn thay vì chỉ dựa vào dữ liệu reCaptcha ở một trang duy nhất chẳng hạn như trang đăng nhập. Và dù mang lại cho người dùng sự tiện lợi nhưng đổi lại Google sẽ thu thập nhiều dữ liệu hơn. Google không nói rõ họ sẽ làm gì với dữ liệu lấy được về hành vi của người dùng thông qua reCaptcha, liệu chăng chỉ sử dụng để cải tiến reCaptcha và các mục đích bảo mật nói chung?
Perona cho rằng reCaptcha V3 là một công cụ giúp Google củng cố sự thống trị của mình trên Internet. reCaptcha cũng giống như nhiều sản phẩm khác của Google như Accelerated Mobile Pages (AMP) - một chương trình giúp các trang web mới tải nhanh hơn trên thiết bị di động nhưng cũng là thứ giúp Google lấy lưu lượng truy cập từ các trang này. Tương tự với trình duyệt Chrome - trang Washington Post đã gọi trình duyệt này là một công cụ giám sát và khuyên người dùng nên từ bỏ.
Perona nói: "Nó luôn là một con dao hai lưỡi. Bạn có được thứ gì đó và bạn phải cho Google quyền kiểm soát mọi thứ trên Internet." Nó có thể tăng độ bảo mật và trải nghiệm người dùng nhưng ảnh hưởng đến sự riêng tư.
Google vẫn không nói đến các vấn đề vi phạm quyền riêng tư và một mực cho rằng reCaptcha V3 là một vấn đề thuộc trách nhiệm của công ty. Google nhìn nhận công nghệ này là một cách để đảm bảo trải nghiệm trực tuyến an toàn, không gây trở ngại cho người dùng. Khormaee còn nói: "Google đã được tích hợp rất sâu vào Internet và chúng tôi muốn làm mọi thứ có thể để bảo vệ nó."
Google nâng cấp công nghệ reCaptcha V3: bảo mật và thuận tiện hơn hay là công cụ lấy dữ liệu?
Theo: Fast Company