Thuật ngữ phát hiện AI & pháp y số toàn diện TruthScan

Tài liệu tham khảo đầy đủ về thuật ngữ phát hiện AI và pháp y kỹ thuật số. Tìm kiếm hoặc duyệt mọi thuật ngữ để hiểu công nghệ đằng sau tính xác thực nội dung.

A
B
C
D
E
F
G
H
I
K
L
M
N
O
P
S
T

A

Artifact nâng cấp độ phân giải (Upscaling artifacts)

Biến dạng khi AI tăng độ phân giải ảnh nhỏ hoặc mờ. Mô hình tìm chi tiết mâu thuẫn, ví dụ mi mắt rất sắc cạnh cạnh lỗ chân lông mờ—gợi ý AI “bịa” chi tiết trên nền chất lượng thấp.

Artifact nén (Compression artifacts)

Biến dạng khi ảnh hoặc video bị nén và giải nén (ví dụ JPEG, MPEG). Khác artifact sinh ảnh—nén gây khối hình, răng cưa hoặc dải màu. Phân tích pháp y có thể phát hiện nén lại hoặc nén không đồng nhất giữa các vùng.

Artifact thời gian (Temporal artifacts)

Không nhất quán theo thời gian, không chỉ một khung. Trong video AI, da, kính hoặc nền có thể nhấp nháy, rung hoặc dịch chuyển khi AI khó duy trì nhất quán thời gian.

B

Băm (Hashing)

Phương pháp tạo dấu vân tay duy nhất cho file. Chỉ cần đổi một pixel là giá trị băm đổi hoàn toàn. TruthScan dùng băm để so khớp file với cơ sở deepfake đã biết hoặc bản gốc xác nhận.

Bản đồ nhiệt phát hiện (Detection heatmap)

Công cụ báo cáo trực quan phủ gradient màu lên ảnh hoặc khung video đã phân tích. Thay vì chỉ nhãn Giả đơn giản, heatmap làm nổi các vùng phát hiện được chỉnh sửa (ví dụ tô đỏ khuôn mặt để báo deepfake, nền xanh).

Bảng lượng tử hóa (Quantization tables)

Công thức toán học máy ảnh hoặc phần mềm dùng để nén ảnh. Nếu ảnh tuyên bố từ Nikon nhưng dùng bảng lượng tử của Photoshop, đó là dấu ảnh đã chỉnh hoặc sinh sau khi chụp.

Bóng ma JPEG (JPEG ghosts)

Viền mờ khó thấy khi ảnh lưu nhiều lần ở mức chất lượng khác nhau. Mô hình phát hiện chữ ký nén không khớp để tìm vật chèn hoặc vùng sửa.

C

Chỉnh sửa kỹ thuật số (Digital manipulation)

Mọi thay đổi file phương tiện bằng phần mềm (như Photoshop) hoặc thuật toán AI. Chỉnh độ sáng đơn giản là phổ biến; chỉnh sửa pháp y là thay đổi lớn—xóa vật thể, bóp mặt, chèn yếu tố giả—làm sai ngữ cảnh hoặc sự thật. Mô hình tìm không nhất quán ánh sáng, bóng không khớp nguồn sáng hoặc mẫu nhân bản.

Chuỗi bảo quản chứng cứ (Chain of custody)

Quy trình ghi chép theo dõi ai xử lý chứng cứ số và khi nào, đảm bảo toàn vẹn từ thu thập đến phân tích. Trong điều tra pháp y, duy trì chuỗi bảo quản là cần thiết để chứng minh file phương tiện không bị sửa giữa lúc thu và phát hiện.

Chuyển phong cách (Style transfer)

Kỹ thuật AI áp phong cách một ảnh (ví dụ tranh) lên nội dung ảnh khác. Có thể che chỉnh sửa. Phát hiện nhận ranh giới phong cách bất thường hoặc dấu vân mô hình style transfer.

Điểm tin cậy (Confidence score)

Giá trị phần trăm (0–100%) thể hiện mức chắc chắn của hệ thống rằng nội dung do AI tạo. Điểm cao (ví dụ 99%) là phát hiện rõ ràng dựa trên bằng chứng mạnh; điểm trung bình (ví dụ 55%) gợi ý mơ hồ hoặc dữ liệu không đủ.

D

Dấu vân âm thanh (Acoustic fingerprint)

Đặc trưng đo được, duy nhất của tín hiệu âm thanh. Giống dấu vân tay người, giọng nói có hình dạng sóng âm riêng. TruthScan phân tích các đặc trưng này để phát hiện nhân bản giọng, tìm thiếu tiếng thở tự nhiên hoặc độ phẳng thường thấy ở lời nói tổng hợp.

Dấu vân giọng (Voiceprint)

Đặc trưng sinh trắc học từ đặc điểm duy nhất của giọng nói—tương tự dấu vân âm thanh. Dấu vân giọng dùng xác thực hoặc phát hiện lời nói tổng hợp giả mạo giọng đã biết.

Dấu vân mô hình (Model fingerprinting)

Xác định mô hình AI hoặc công cụ nào tạo nội dung. Mỗi mô hình để lại chữ ký thống kê hoặc cấu trúc khác nhau. Công cụ pháp y đôi khi gán nội dung tổng hợp cho nhà cung cấp cụ thể như Midjourney, DALL-E, Stable Diffusion.

Deepfake

Phương tiện mà ngoại hình người (mặt hoặc giọng) bị hoán đổi hoặc chỉnh sửa thực tế bằng AI. Khác với nghệ thuật AI thông thường, deepfake nhằm bắt chước người thật, thường khiến họ nói hoặc làm điều chưa từng xảy ra.

Dương tính giả (False positive)

Hệ thống gán nhầm nội dung người thật là do AI tạo. Hệ thống cố giảm tình huống này; dương tính giả đôi khi do nén nặng, lọc mạnh hoặc file độ phân giải thấp.

E

ELA (Phân tích mức lỗi)

Kỹ thuật pháp y lưu lại ảnh ở mức chất lượng đã biết và so sánh nén. Vùng chỉnh sửa hoặc do AI tạo thường có mức lỗi khác vùng gốc—vùng thêm hoặc sửa nổi bật sáng hoặc tối hơn trong phân tích.

F

Âm tính giả (False negatives)

Lỗi khi hệ thống không nhận ra ảnh do AI hoặc bị chỉnh, gán nhầm là Thật hoặc Người. Thường gặp với mô hình AI thế hệ mới rất tinh vi hoặc ảnh nén mạnh để che dấu vết số.

G

GAN (Mạng đối kháng sinh)

Kiến trúc AI với hai mạng nơ-ron cạnh tranh: bộ sinh tạo nội dung giả và bộ phân biệt cố phát hiện. Nhiều deepfake và ảnh tổng hợp sớm dùng GAN. Mô hình phát hiện được huấn luyện nhận artifact đặc trưng GAN thường tạo ra.

Gán nguồn (Source attribution)

Xác định thiết bị, phần mềm hoặc mô hình AI tạo nội dung: siêu dữ liệu, dấu nén hoặc artifact theo mô hình. Gán nguồn giúp xác minh và truy vết chỉnh sửa.

Ghép nối (Splicing)

Giả mạo ảnh khi ghép vùng từ nguồn khác nhau thành một ảnh. Còn gọi compositing hoặc cắt-dán. Phát hiện tìm không nhất quán ánh sáng, phối cảnh hoặc kết cấu giữa các vùng.

Giả mạo / can thiệp (Tampering)

Cố ý thay đổi phương tiện số để lừa người xem. Rộng hơn chỉnh sửa kỹ thuật số: mọi thay đổi nhằm bóp méo thực tế—từ ghép ảnh đến sửa siêu dữ liệu. Hệ thống phát hiện dấu can thiệp.

Giả mạo copy-move

Loại giả mạo ảnh khi một vùng được sao chép từ phần này và dán sang phần khác trong cùng ảnh. Copy-move dùng để che vật thể, nhân đôi chi tiết hoặc dựng cảnh giả. Công cụ pháp y phát hiện bằng cách tìm khối pixel thống kê giống nhau.

H

Ảo giác (Hallucination)

Khi mô hình AI tạo chi tiết trông hợp lý nhưng sai thực tế, mâu thuẫn hoặc vô nghĩa. Trong ảnh có thể là ngón thừa, vật không thể tồn tại hoặc nền phi logic. Phát hiện có thể nhận bất khả thể ngữ nghĩa hoặc cấu trúc.

Hiện tượng tạo ảnh (Artifacts)

Biến dạng kỹ thuật số, răng cưa pixel hoặc lỗi hình ảnh trong file ảnh hoặc video. Trong phát hiện AI, thường là artifact do sinh ảnh—chi tiết phi lý như kết cấu méo, mờ lạ hoặc khối độ phân giải không khớp, cho thấy ảnh được tổng hợp chứ không chụp bằng ống kính.

Hoa văn khuếch tán (Diffusion patterns)

Kết cấu giống nhiễu đặc trưng mô hình khuếch tán (công cụ sinh ảnh như Midjourney, DALL-E, Stable Diffusion). Các mô hình tạo ảnh bằng cách tinh chỉnh nhiễu tĩnh, thường để lại hoa văn lưới siêu nhỏ không thấy bằng mắt thường nhưng thuật toán pháp y phát hiện được.

Hoán đổi khuôn mặt (Face swap)

Loại deepfake thay mặt người này bằng mặt người khác trong video hoặc ảnh. Khác tổng hợp mặt hoàn toàn, face swap ghép mặt có sẵn lên thân hoặc cảnh khác. Phát hiện tập trung ranh giới artifact, lệch ánh sáng và chuyển động mặt không tự nhiên.

I

Inpainting

Quá trình AI chỉ sinh hoặc thay thế một phần ảnh có sẵn, giữ vùng xung quanh. Công cụ phát hiện tìm đường nối hoặc không nhất quán thống kê giữa mảnh AI và ảnh gốc.

K

Kết cấu bề mặt (Texture)

Chất lượng bề mặt và chi tiết mịn của vật trong ảnh: lỗ chân lông, sợi vải, thớ giấy, từng sợi tóc. Mô hình tìm độ mịn bất thường hoặc bề mặt nhựa vì AI thường đồng nhất hóa quá mức chi tiết phức tạp.

Kết xuất nơ-ron (Neural rendering)

Kỹ thuật AI tổng hợp hoặc chỉnh ảnh và video bằng biểu diễn học được, gồm NeRF, tổng hợp kết cấu nơ-ron. Phát hiện tìm artifact đặc trưng của các phương pháp này.

Không nhất quán cấp pixel

Bất thường quan hệ giữa pixel lân cận, thường không thấy bằng mắt thường. Máy ảnh tạo nhiễu tự nhiên; bộ sinh AI thường sắp pixel với độ chính xác hoặc dấu vân thống kê khác quang học thật.

Khung khóa (Keyframe)

Ảnh đầy đủ độc lập trong file video. Hầu hết khung chỉ ghi thay đổi so với khung trước để tiết kiệm dung lượng; keyframe lưu toàn cảnh. Phân tích keyframe để thấy artifact độ phân giải cao có thể bị làm mờ ở phần còn lại của video.

Kỹ thuật né tránh (Evasion techniques)

Cách tránh hoặc giảm khả năng bị phát hiện bởi detector nội dung AI: nén ảnh, chỉnh màu, thêm nhiễu hoặc nhiễu đối kháng. Hiểu né tránh giúp cải thiện độ bền của detector.

L

Làm mịn quá mức (Over-smoothing)

Đặc điểm kết cấu da, vải thiếu chi tiết tự nhiên, trông nhựa hoặc sáp. Mô hình AI thường làm trung bình chi tiết phức tạp, khiến da như được làm mịn quá mức.

Lệch đồng bộ môi (Lip-sync drift)

Artifact thời gian khi cử động miệng không khớp hoàn hảo với âm thanh. Lệch vài phần nghìn giây cũng có thể là dấu deepfake, khi âm điều khiển khuôn mặt máy tính.

M

Mô hình tập hợp (Ensemble model)

Chiến lược dùng nhiều mô hình AI khác nhau phân tích cùng nội dung. TruthScan dùng tập hợp để giảm lỗi; nếu một mô hình chuyên Midjourney và một mô hình chuyên chỉnh Photoshop, kết hợp giúp phủ sóng và độ chính xác rộng hơn.

N

Ảnh ma / ghosting

Bất thường hình ảnh khi vật thể có bản sao mờ, mờ ảo hoặc vệt gần kề. Thường gặp khi mô hình sinh ảnh render vật chuyển động hoặc hình học phức tạp, gây hiệu ứng phơi sáng kép mờ.

Nguồn gốc nội dung (Content provenance)

Thông tin truy vết nguồn gốc và lịch sử chỉnh sửa của phương tiện. Chuẩn như C2PA (Coalition for Content Provenance and Authenticity) và CAI (Content Authenticity Initiative) cho phép ký mật mã để người xem xác minh cách nội dung được tạo và sửa.

Nhân bản giọng (Voice cloning)

Dùng AI tạo giọng tổng hợp bắt chước ca độ, giọng và nhịp của một người. Mô hình tìm artifact máy trong nhịp thở hoặc khoảng tần số mà dây thanh người không tạo được.

Nhân tạo tổng hợp (Synthetic persona)

Danh tính kỹ thuật số photoreal gồm mặt và hồ sơ hoàn toàn do AI tạo. Khác deepfake bắt chước người thật, nhân tạo tổng hợp không tương ứng con người nào. Thường dùng cho bot mạng xã hội hoặc gian lận.

Nhiễu (Noise)

Kết cấu hạt ngẫu nhiên trong ảnh số, giống nhiễu TV. Ảnh thật do cảm biến và độ nhạy sáng tạo nhiễu theo mẫu nhất định. Mô hình tìm vùng quá sạch trong ảnh nhiễu hoặc mẫu lưới lặp đặc trưng sinh ảnh.

O

Outpainting

AI mở rộng ảnh ra ngoài viền gốc, sinh nội dung mới cho vùng thêm. Khác inpainting lấp lỗ trong ảnh. Phát hiện tìm đường nối hoặc mâu thuẫn giữa phần sinh và khung gốc.

P

Phân tích kênh Y (Y-channel analysis)

Phân tích lớp độ sáng (luminance) tách khỏi màu. AI thường đúng màu nhưng sai vật lý ánh sáng. Bỏ màu, chỉ xem thang xám kênh Y, các không nhất quán ánh sáng trở nên rõ hơn.

Phân tích tần suất chớp mắt (Blink rate analysis)

Kỹ thuật pháp y theo dõi mức độ và tự nhiên khi chủ thể chớp mắt trong video. Người có nhịp chớp sinh học tương đối ổn định. Deepfake, nhất là bản cũ hoặc chất lượng thấp, thường khiến chủ thể chớp quá ít, quá nhanh hoặc không chớp.

Phát hiện người thật (Liveness detection)

Quy trình bảo mật xác minh người trước camera là người thật, đang hiện diện. Mô hình tìm vi chuyển động như đỏ da theo nhịp tim và chớp mắt tự nhiên mà bộ sinh AI thường không tái hiện được.

Phát hiện nhân bản vùng (Clone detection)

Kỹ thuật pháp y xác định vùng ảnh bị sao chép từ chỗ khác trong cùng ảnh. Thuật toán so khối pixel và tìm vùng gần giống hệt hoặc gần trùng, cho thấy kẻ tấn công đã nhân bản vùng để che hoặc đổi nội dung.

Phát hiện zero-shot

Khả năng mô hình phát hiện nội dung giả từ bộ sinh AI mới mà chưa từng thấy khi huấn luyện. Mô hình tìm lỗi phổ quát—vi phạm vật lý ánh sáng—mà các mô hình AI hiện tại thường mắc, bất kể nhà phát triển.

S

Điểm phản chiếu (Specular highlights)

Phản chiếu nguồn sáng trên bề mặt bóng, đặc biệt ánh mắt. Ảnh thật có phản chiếu khớp môi trường (ví dụ cửa sổ vuông). AI thường vẽ sai, tạo phản chiếu không khớp hoặc phi hình học.

Siêu dữ liệu (Metadata)

Dữ liệu ẩn về file số: model máy, ngày chụp, GPS. Bộ sinh AI thường xóa hoặc chèn thẻ riêng. Phân tích pháp y xem cấu trúc siêu dữ liệu có khớp thiết bị nguồn hay không.

Siêu dữ liệu XMP

Extensible Metadata Platform — chuẩn phần mềm chỉnh sửa (như Adobe) dùng để lưu nhật ký lịch sử trong file ảnh. Mô hình tìm dấu vết như log “Created with Stable Diffusion” dù EXIF chính đã bị xóa.

T

Tấn công đối kháng (Adversarial attack)

Kỹ thuật nhằm đánh lừa hệ thống phát hiện AI bằng thay đổi nhỏ, có chủ đích lên ảnh hoặc âm thanh. Kẻ tấn công có thể thêm nhiễu khó nhận ra hoặc biến đổi để né detector. Mô hình phát hiện mạnh được huấn luyện để chống các nỗ lực né tránh đó.

Tấn công quay lại màn hình (Recapture attack)

Gian lận hiển thị deepfake hoặc ảnh tĩnh trên màn hình rồi quay bằng camera khác. Mô hình tìm họa moiré, chói màn hình hoặc lưới pixel của monitor.

Thông tin EXIF

Chuẩn lưu siêu dữ liệu trong file ảnh, như nhật ký kỹ thuật: hãng/mẫu máy, tốc độ màn trập, tiêu cự, ngày, đôi khi GPS. Mô hình tìm mâu thuẫn, ví dụ ảnh tuyên bố từ iPhone nhưng thiếu thẻ phần mềm đặc trưng iPhone luôn có.

Thủy ấn kỹ thuật số (Watermarking)

Tín hiệu vô hình nhúng vào file phương tiện bởi bộ sinh AI có trách nhiệm (như SynthID của Google) để đánh dấu nội dung do AI tạo. TruthScan quét các chữ ký nhà cung cấp ẩn xác nhận ảnh do AI tạo.

Trộn khuôn mặt (Face morphing)

Kỹ thuật pha hai hay nhiều khuôn mặt thành một chuyển tiếp mượt. Dùng trong gian lận danh tính và tạo nhân tạo tổng hợp; khuôn mặt trộn có thể qua mặt hệ thống nhận diện. Phát hiện tìm điểm mốc mặt không nhất quán hoặc artifact pha trộn.

TTS (Văn bản thành lời nói)

Công nghệ đổi văn bản thành lời nói tổng hợp. Nhân bản giọng bắt chước một người cụ thể; TTS tổng quát tạo giọng mới. Cả hai đều có thể là âm thanh tổng hợp. Phát hiện tìm nhịp máy, ngắt nghỉ không tự nhiên hoặc artifact tần số.