Khám phá mới

Tại sao âm thanh giả do AI tạo ra lại rất khó phát hiện?

Tại sao âm thanh giả do AI tạo ra lại rất khó phát hiện?

Nội dung giả mạo và gây hiểu lầm do AI tạo ra đang trở thành mối đe dọa lớn đối với con người khi mà nó ngày càng tinh vi và gần như không thể phân biệt thật giả. 

Nội dung giả mạo và gây hiểu lầm do trí tuệ nhân tạo tạo ra đã nhanh chóng chuyển từ mối đe dọa về mặt lý thuyết thành hiện thực đáng kinh ngạc. Vào tháng 1, một cuộc gọi tự động giả giọng Tổng thống Joe Biden tới các cử tri Đảng Dân chủ ở New Hampshire đã khiến dư luận Mỹ không khỏi hoang mang. Roger Stone gần đây đã sử dụng một chương trình phát hiện AI nhằm phân biệt giọng nói thật với giọng nói do AI tạo ra nhưng các chương trình phát hiện AI đều vô cùng hạn chế. 

Ảnh minh họa

Hệ thống phát hiện deepfake hoạt động rất khác với cách con người lắng nghe. Nó phân tích các mẫu âm thanh để tìm các thành phần giả như tần số bị thiếu thường bị bỏ lại khi âm thanh được lập trình sẵn. Thông thường, hệ thống sẽ tập trung vào các khía cạnh cụ thể của lời nói, như cách người nói thở hoặc cường độ giọng nói của họ lên xuống như thế nào.

Ảnh minh họa

Reality Defender, một công ty phát hiện deepfake nổi tiếng, cho biết họ sử dụng AI để phát hiện AI. Giống như trí tuệ nhân tạo tổng hợp hoạt động bằng cách đào tạo các thuật toán trên lượng lớn dữ liệu thực. Ben Colman, Giám đốc điều hành của công ty, cho biết công ty dán nhãn rõ ràng đâu là thật và đâu là giả với hy vọng rằng hệ thống có thể học cách phát hiện một thứ gì đó được tạo ra bởi AI. "Chúng tôi không bao giờ khẳng định 100%. Xác suất cao nhất của chúng tôi là 99%", ông thẳng thắn thừa nhận. Colman cũng cho biết, sự đa dạng về giọng nói và ngôn ngữ của con người khiến công việc phân biệt trở nên khó khăn. 

Ảnh minh họa

Neil Zhang, một nhà nghiên cứu về máy học tại Đại học Rochester, cho biết rất khó để đánh giá các công cụ phát hiện AI hoạt động tốt như thế nào do thiếu các tiêu chuẩn, nhưng việc có đươc các lựa chọn sẽ “tốt hơn là không có gì”. Sự chênh lệch trong nguồn tài trợ của các công tu đối với việc nghiên cứu các sản phẩm phát hiện AI. Điều đó cũng được phản ánh trong nghiên cứu học thuật, tiến triển chậm đến mức không thể theo kịp tốc độ phát triển của ngành AI. Ông nói, nhiều công cụ để phát hiện deepfake - đặc biệt là trong các lĩnh vực học thuật - dựa vào dữ liệu cũ không phù hợp với các công cụ sản xuất deepfake hiện tại.

Mặc dù nhiều chuyên gia không coi các phương pháp phát hiện là đáng tin cậy nhưng vẫn có những dấu hiệu mà con người có thể lắng nghe để biết liệu bản ghi âm có phải là do AI tạo ra hay không. Các tác phẩm deepfake hiện tại hiếm khi có sự hít thở giữa các từ và chúng thường giãn cách đều đặn từng từ một cách bất thường, không giống như cách người thật nói chuyện.