Nhập thông tin
  • Lỗi: Email không hợp lệ

Đóng

Lộ ảnh nhạy cảm vì sử dụng robot hút bụi thông minh

14:59 14/02/2023 AI
(VTC News) -

Dù trường hợp trên chỉ là sự cố hy hữu đến từ robot hút bụi thông minh nhưng nó gióng hồi chuông cảnh báo với việc lạm dụng công nghệ trí tuệ nhân tạo.

Theo Technology Review, iRobot – hãng chế tạo robot hút bụi thông minh của Mỹ cuối năm ngoái vướng vào bê bối nghiêm trọng khi mẫu robot Roomba J7 của hãng này chụp những bức ảnh riêng tư về sinh hoạt hàng ngày của một gia đình.

Trong đó, đáng chú ý có ảnh một người phụ nữ đang đi vệ sinh và ảnh một đứa trẻ đang chơi trong nhà. Đây chỉ là hai trong nhiều bức ảnh bị chia sẻ trên các mạng xã hội.

Một trong những hình ảnh nhạy cảm bị rò rỉ từ dữ liệu do một robot hút bụi của iRobot ghi lại năm 2020. (Ảnh: Technology Review)

Bị quay lén bởi robot hút bụi

Trên thực tế Roomba J7 không thể tự đăng tải những bức ảnh trên mà chúng bị rò rỉ bởi một bên thứ ba. Dữ liệu từ robot hút bụi thông minh này đều được tải lại máy chủ của Scale AI - một công ty công nghệ chuyên về trí tuệ nhân tạo.

Dữ liệu từ những robot như Roomba J7 được gửi đến Scale AI bao gồm các tệp âm thanh, ảnh và video trong quá trình nó hoạt động. Sau đó chúng sẽ được sử dụng như một nguồn tư liệu để các AI tự học. Điều này tạo nên những con robot hút bụi thông minh biết tránh né mọi đồ vật.

Về cơ bản Scale AI thuê lao động tự do trên khắp thế giới để "dán nhãn" dữ liệu ảnh và video như tivi, cây cối, đèn trần, sofa, bàn ghế… Dữ liệu này sẽ được sử dụng để đào tạo trí tuệ nhân tạo.

Tuy hầu hết các công ty đều có những rào cản kỹ thuật để kiểm soát quyền truy cập và lưu trữ trên nhưng robot hút bụi như Roomba J7 nhưng đôi khi vẫn có những lỗ hỏng, Technology Review nhận định.

Điều đáng nói là hầu hết người dùng đều không hề hay biết hình ảnh của mình có thể bị robot hút bụi chụp lại.

iRobot, nhà cung cấp robot hút bụi lớn nhất thế giới mới đang được Amazon tìm cách mua lại với giá 1,7 tỷ USD, đã xác nhận rằng những hình ảnh này được chụp bởi robot Roomba của họ vào năm 2020.

"Tất cả ảnh đều đến từ các robot phiên bản phát triển, với các sửa đổi phần cứng và phần mềm chưa bao giờ có mặt trên các sản phẩm thương mại”, công ty cho biết trong một tuyên bố.

Những người sử dụng robot này đã ký thỏa thuận bằng văn bản chấp nhận gửi các luồng dữ liệu, bao gồm cả video, về công ty cho mục đích đào tạo robot, theo iRobot.

Theo iRobot, các thiết bị được dán nhãn dán màu xanh lá cây sáng có nội dung “đang quay video” và những người sử dụng thiết bị có quyền “xóa bất kỳ thứ gì họ cho là nhạy cảm khỏi robot”.

Robot hút bụi thông minh Roomba J7 của iRobot được tích hợp camera có độ phân giải cao ở phía trước phục vụ cho việc điều hướng. (Ảnh: Expert Reviews)

Nói cách khác, bất kỳ ai có ảnh hoặc video bị lộ đều đã đồng ý để Roombas ghi hình họ. iRobot từ chối công khai các thỏa thuận chấp nhận cung cấp dữ liệu giữa họ và những người dùng robot hút bụi này.

Bằng cách sử dụng sản phẩm, người tiêu dùng các thiết bị điện tử đồng ý cho các công ty thu thập và tùy nghi xử lý dữ liệu ở nhiều cấp độ khác nhau từ iPhone cho đến máy giặt. Tất cả những điều này đều có trong các điều khoản và chính sách quyền riêng tư khi bạn bắt đầu sử dụng thiết bị.

Đó là một thực tế phổ biến trong 10 năm trở lại gần đây qua, khi trí tuệ nhân tạo ngày càng được tích hợp vào sản phẩm và những ngành dịch vụ hoàn toàn mới. Phần lớn công nghệ này dựa trên máy học, một kỹ thuật sử dụng kho dữ liệu lớn bao gồm cả giọng nói, khuôn mặt, nhà cửa của chúng ta và thông tin cá nhân khác để đào tạo các thuật toán nhận dạng các mẫu.

Lộ dữ liệu nhạy cảm

Dữ liệu được thu thập bởi robot hút bụi đặc biệt nhạy cảm, bởi chúng có hệ thống phần cứng và cảm biến mạnh, thường xuyên di chuyển quanh nhà, theo Dennis Giese, nhà nghiên cứu các lỗ hổng bảo mật của thiết bị thông minh tại Đại học Northeastern.

Để thu thập dữ liệu phục vụ cho học máy, camera cần độ nét cao và nhiều công ty đã tích hợp camera trước vào robot hút bụi của họ để điều hướng vận hành và nhận dạng vật thể, cũng như giám sát người dùng.

Trong số đó 3 nhà sản xuất robot hút bụi hàng đầu theo thị phần: iRobot, chiếm 30% thị trường và đã bán được hơn 40 triệu thiết bị kể từ năm 2002, Ecovacs với khoảng 15% và Roborock với khoảng 15%, theo Strategy Analytics. Các nhà sản xuất thiết bị gia dụng quen thuộc như Samsung, LG và Dyson, cũng đều phát triển thiết bị theo hướng tương tự.

Dữ liệu thu được từ người dùng sẽ giúp tạo ra robot thông minh hơn nữa. Nhưng để các bộ dữ liệu này có thể trở thành "thức ăn" cho các thuật toán máy học, chúng phải được phân loại, đánh dấu và chú thích ngữ cảnh. Quá trình này được gọi chung là "dán nhãn" dữ liệu.

“Có hàng loạt lao động tự do chỉ ngồi thực hiện một loạt thao tác trỏ và nhấp, xác định xem vật thể trong ảnh hay video là gì", Matt Beane, nhà nghiên cứu về lực lượng lao động công nghệ tại Đại học California, cho biết. Thao tác này gần giống như các mã captcha hay trắc nghiệm chọn hình ảnh mà đôi khi Google hay các trang web yêu cầu người dùng thực hiện.

Hình ảnh do robot hút bụi chụp nhà bếp và đã được "dán nhãn" một số vật thể, lan truyền trên mạng dưới dạng ảnh chụp lại màn hình. (Ảnh: Technology Review)

“Khi đồng ý với thỏa thuận chia sẻ dữ liệu, người dùng thường không nghĩ rằng hình ảnh của họ sẽ bị xem và dán nhãn bởi những người khác", Justin Brookman, chuyên gia chính sách công nghệ tại Consumer Reports và cựu giám đốc chính sách của Văn phòng Nghiên cứu và điều tra công nghệ của Ủy ban Thương mại Liên bang Mỹ, lưu ý.

Người dùng có thể biết họ đang bị theo dõi bởi robot hút bụi, nhưng thực tế họ đang bị theo dõi bởi nhiều người khác.

Những hình ảnh bị tiết lộ từ những người làm công việc dán nhãn dữ liệu cho Scale AI chỉ là một phần nhỏ của hệ sinh thái dữ liệu rộng lớn khai thác được từ người dùng các thiết bị thông minh. Chỉ riêng iRobot đã chia sẻ hơn 2 triệu hình ảnh môi trường thực với Scale AI và một số lượng chưa xác định nữa với các nền tảng dán nhãn dữ liệu khác, chưa tính đến các nhà sản xuất thiết bị thông minh khác.

Trà Khánh (Nguồn: Technology Review)

Tin mới