การประมวลผลคำพูด
หน้าตา
บทความนี้ไม่มีการอ้างอิงจากแหล่งที่มาใด |
การประมวลผลคำพูด (อังกฤษ: speech processing) เป็นการศึกษาสัญญาณเสียงพูด และ วิธีในการประมวลผลสัญญาณประเภทนี้
การประมวลผลสัญญาณเสียงพูดในปัจจุบัน จะอยู่ในรูปของสัญญาณดิจิทัล โดยสาขานี้มีเนื้อหาร่วมระหว่างการประมวลผลสัญญาณดิจิทัลกับการประมวลภาษาธรรมชาติ กล่าวคือมีการประมวลผลทั้งสองส่วน ทั้งตัวสัญญาณเสียง (พาหะนำสาร) และภาษา (สาร)
การประมวลผลคำพูด อาจแบ่งเป็นหัวข้อย่อยได้ดังนี้
- การจดจำคำพูด (speech recognition) เป็นการวิเคราะห์ และ จดจำ เนื้อความคำพูด จากสัญญาณเสียงพูด
- การจดจำเสียงผู้พูด (speaker recognition) เป็นการใช้เสียงในการระบุตัวผู้พูด
- การปรับแต่งเสียงพูด (speech signal enhancement)
- การเข้ารหัสเสียงพูด (speech coding) เพื่อการบีบอัดข้อมูล
- การวิเคราะห์เสียงพูด (voice analysis) เพื่อใช้ประโยชน์ในทางการแพทย์ เช่นการวิเคราะห์ความผิดปกติของสายเสียง
- การสังเคราะห์เสียงพูด (speech synthesis) โดยทั่วไปหมายถึงการใช้คอมพิวเตอร์ในการสร้างเลียนเสียงพูดของมนุษย์