Biểu thị bằng hình ảnh về đặc điểm giọng nói của một cá nhân được in trên giấyđược gọi là giọng nói. Còn được gọi là quang phổ âm thanh, nó có thể được sử dụng để xác định một người nói vì các mẫu giọng nói là duy nhất đối với một cá nhân.
Thông tin nào trong giọng nói?
Được xác định là chữ ký dựa trên sinh trắc học, dấu giọng nói có thể được sử dụng đểxác định một cách tích cực người nói trên cơ sở các đặc điểm vật lý, cụ thể là cấu hình cụ thể của các khoang thanh âm (cổ họng, hải sâu răng và miệng) và bộ phận khớp (môi, răng, lưỡi và vòm miệng mềm).
Bản in có được chấp nhận tại tòa án không?
Quang phổ của một người nói không xác định được so sánh với quang phổ của một người nói đã được xác định để tìm ra các mẫu tương tự. Phần lớn các tòa án đã xem xét câu hỏi đã phán quyết rằng bằng chứng giọng nóicó thể chấp nhận được. Xem United States v.… Bị từ chối 439 U. S. 1117 (1979).
Giọng nói được tạo ra như thế nào?
Để tạo giọng nói riêng lẻ, người dùngcung cấp một hoặc nhiều mẫu giọng nói đăng ký cho mô hình DNN, sau đó DNN được tinh chỉnh để tìm hiểu các đặc điểm giọng nói riêng của từng cá nhân. Quá trình tạo mô hình DNN xảy ra trực tiếp với các mẫu giọng nói (tức là các tệp WAV thô) - không cần trích xuất tính năng.
Nhận dạng giọng nói hoạt động như thế nào?
Nhận dạng giọng nói hoạt độngbằng cách phân tích hơn 100 hành vi và thể chấtcác yếu tố để tạo ra một giọng nói duy nhất cho mỗi cá nhân. Những yếu tố này bao gồm cách phát âm, cách nhấn mạnh, tốc độ nói và trọng âm, cũng như các đặc điểm thể chất như đường thanh âm, miệng và đường mũi.