Các nhà nghiên cứu Canada tạo ra công cụ loại bỏ dấu thủy vân chống deepfake khỏi nội dung AI

Các nhà nghiên cứu của Đại học Waterloo đã chế tạo một công cụ có thể nhanh chóng loại bỏ các dấu thủy vân nhận diện nội dung được tạo ra bằng trí tuệ nhân tạo (AI) – và họ nói rằng điều đó chứng minh rằng những nỗ lực toàn cầu nhằm chống lại deepfake rất có thể đang đi sai hướng.

Giới học thuật và công nghiệp đã tập trung vào việc tạo dấu thủy vân như là cách tốt nhất để chống lại deepfake và "về cơ bản đã từ bỏ tất cả các cách tiếp cận khác," Andre Kassis, một nghiên cứu sinh tiến sĩ khoa học máy tính, người đã dẫn đầu nghiên cứu cho biết.

Tại một sự kiện của Nhà Trắng vào năm 2023, các công ty AI hàng đầu – bao gồm OpenAI, Meta, Google và Amazon – đã cam kết thực hiện các cơ chế như tạo dấu thủy vân để xác định rõ ràng nội dung do AI tạo ra.

Kassis giải thích, các hệ thống của các công ty AI nhúng một dấu thủy vân, đó là một chữ ký hoặc mẫu ẩn không thể nhìn thấy bằng mắt thường nhưng có thể được một hệ thống khác nhận diện.

Ông nói rằng nghiên cứu cho thấy việc sử dụng dấu thủy vân rất có thể không phải là một lá chắn khả thi chống lại các mối nguy hiểm do nội dung AI gây ra.

Ông nói: "Điều đó cho chúng ta biết rằng nguy hiểm của deepfake là một điều mà chúng ta thậm chí còn chưa có công cụ để bắt đầu giải quyết ở thời điểm này."

Công cụ được phát triển tại Đại học Waterloo, có tên là UnMarker, nối tiếp các nghiên cứu học thuật khác về việc loại bỏ dấu thủy vân. Điều đó bao gồm công việc tại Đại học Maryland, sự hợp tác giữa các nhà nghiên cứu tại Đại học California và Carnegie Mellon, và công việc tại ETH Zürich.

Kassis nói rằng nghiên cứu của ông đi xa hơn những nỗ lực trước đây và là "lần đầu tiên phơi bày một lỗ hổng hệ thống làm suy yếu chính tiền đề của việc tạo dấu thủy vân như một biện pháp phòng thủ chống lại deepfake."

Trong một tuyên bố qua email sau đó, ông nói rằng "điều làm cho UnMarker khác biệt là nó không yêu cầu kiến thức về thuật toán tạo dấu thủy vân, không cần truy cập vào các tham số nội bộ và hoàn toàn không cần tương tác với bộ phát hiện."

Một thông cáo báo chí của trường đại học cho biết, khi được thử nghiệm, công cụ này hoạt động thành công hơn 50% thời gian trên các mô hình AI khác nhau.

Kassis cho biết các hệ thống AI có thể bị lạm dụng để tạo deepfake, truyền bá thông tin sai lệch và thực hiện các vụ lừa đảo – tạo ra nhu cầu về một cách đáng tin cậy để xác định nội dung là do AI tạo ra.

Sau khi các công cụ AI trở nên quá tiên tiến khiến các bộ phát hiện AI không hoạt động tốt, sự chú ý đã chuyển sang việc tạo dấu thủy vân.

Kassis nói rằng ý tưởng là nếu chúng ta không thể "hiểu hoặc phát hiện cái gì là thật và cái gì không phải" sau đó, thì có thể "chèn một loại chữ ký ẩn hoặc một loại mẫu ẩn" sớm hơn, khi nội dung được tạo.

Đạo luật AI của Liên minh Châu Âu yêu cầu các nhà cung cấp hệ thống tạo ra số lượng lớn nội dung tổng hợp phải triển khai các kỹ thuật và phương pháp để làm cho nội dung do AI tạo ra hoặc bị thao túng có thể nhận diện được, chẳng hạn như dấu thủy vân.

Ở Canada, một bộ quy tắc ứng xử tự nguyện do chính phủ liên bang ban hành vào năm 2023 yêu cầu những người đứng sau các hệ thống AI phải phát triển và triển khai "một phương pháp đáng tin cậy và có sẵn miễn phí để phát hiện nội dung được tạo bởi hệ thống, với trọng tâm gần đây là nội dung nghe nhìn (ví dụ: tạo dấu thủy vân)."

Kassis nói rằng UnMarker có thể loại bỏ dấu thủy vân mà không cần biết bất cứ điều gì về hệ thống đã tạo ra nó, hoặc bất cứ điều gì về chính dấu thủy vân đó.

Ông nói: "Chúng ta chỉ cần áp dụng công cụ này và trong vòng tối đa hai phút, nó sẽ xuất ra một hình ảnh giống hệt hình ảnh có dấu thủy vân" sau đó có thể được phân phối.

"Thật trớ trêu khi có hàng tỷ đô la đang được đổ vào công nghệ này và sau đó, chỉ với hai nút bạn nhấn, bạn có thể có được một hình ảnh không có dấu thủy vân."

Kassis nói rằng trong khi các công ty AI lớn đang chạy đua để triển khai công nghệ tạo dấu thủy vân, cần phải nỗ lực hơn nữa để tìm kiếm các giải pháp thay thế.

Ông nói: Dấu thủy vân đã "được tuyên bố là tiêu chuẩn mặc định để bảo vệ trong tương lai chống lại các hệ thống này."

"Tôi nghĩ đây là lời kêu gọi mọi người hãy lùi lại một bước và sau đó cố gắng suy nghĩ lại về vấn đề này."

The Canadian Press