การสังเคราะห์เสียงพูด

จากวิกิพีเดีย สารานุกรมเสรี

ซอฟต์แวร์สังเคราะห์เสียง เป็นเทคโนโลยีที่สามารถสร้างเสียงคำพูดใด ๆ ได้ตามความต้องการ ซึ่งในการใช้งานส่วนใหญ่จะต้องใช้งานร่วมกับเทคโนโลยีด้านการประมวลผลภาษา (language processing technology) ทำให้ได้เทคโนโลยีสังเคราะห์เสียงจากข้อความ (text-to-speech synthesis: TTS) ที่สามารถนำไปประยุกต์ใช้กับข้อความภาษาไทย เพื่อหาวิธีอ่านข้อความแล้วแปลงข้อความจากตัวหนังสือภาษาไทยให้เป็นเสียงพูดภาษาไทย ซอฟต์แวร์สังเคราะห์เสียงพูดภาษาไทยคุณภาพสูงสามารถสังเคราะห์เสียงพูดภาษาไทยได้ทุกคำ เนื่องจากมีส่วนวิเคราะห์คำอ่านที่สามารถวิเคราะห์ได้แม้แต่คำที่ไม่เคยปรากฏในพจนานุกรม นอกจากนี้ผู้ใช้สามารถเพิ่มคำเฉพาะเช่นชื่อบุคคล พร้อมทั้งกำหนดคำอ่านได้อย่างอิสระ เพื่อให้ซอฟต์แวร์สามารถแปลงข้อความมาเป็นเสียงพูดได้ตรงกับความต้องการของผู้ใช้ นอกจากนี้ยังสามารถสร้างเป็นซอฟต์แวร์ไลบรารี่ที่สะดวกสำหรับผู้นำไปพัฒนาต่อ

ประโยชน์[แก้]

ประโยชน์ของการประยุกต์ใช้เทคโนโลยีสังเคราะห์เสียงพูด ได้แก่

  1. สามารถนำเทคโนโลยีสังเคราะห์เสียงพูดมาแปลงข่าวสารอิเล็กทรอนิกส์ที่มีปริมาณมากและมีการปรับเปลี่ยนตลอดเวลา เช่น การส่งข่าวสารผ่านข้อความเสียง (voice message) การรายงานข่าว การวิเคราะห์หุ้น มาเป็นเสียงพูด เพื่อให้ผู้รับข่าวสารได้รับข่าวทันทีโดยสะดวก
  2. สามารถเผยแพร่ข่าวสารผ่านเครือข่ายพื้นฐานที่มีอยู่แล้ว เช่น เครือข่ายโทรศัพท์บ้าน โทรศัพท์มือถือ และอินเทอร์เน็ต ซึ่งการเผยแพร่ทางเสียงเป็นวิธีการพื้นฐานที่เข้าถึงได้ทุกเครือข่ายโดยไม่ต้องการอุปกรณ์เพิ่มเติม
  3. ผู้รับข่าวสารสามารถรับข่าวสารโดยไม่ต้องละจากกิจกรรมที่ทำอยู่ โดยเฉพาะอย่างยิ่งในกรณีที่ผู้รับอยู่ในภาวะที่ก่อให้เกิดอันตรายได้ เช่น ขณะขับขี่รถยนต์
  4. สามารถประยุกต์ใช้กับอุปกรณ์สื่อสารอื่น ๆ เช่น ผู้ใช้บริการสามารถส่งข้อมูลโดยโทรสาร ในขณะที่ผู้รับปลายทางสามารถรับฟังข้อความบนเอกสารโดยโทรศัพท์ทั่วไป
  5. การเพิ่มโอกาสให้คนพิการ เช่น โปรแกรมอ่านข้อมูลเพื่อคนตาบอด หรืออุปกรณ์ช่วยพูดแทนคนใบ้

ซอฟต์แวร์สังเคราะห์เสียงพูดภาษาไทย[แก้]

ปัจจุบันซอฟต์แวร์สังเคราะห์เสียงพูดภาษาไทยคุณภาพสูงได้รับการถ่ายทอดสู่เชิงพาณิชย์แล้ว และยังได้รับการพัฒนาเป็นต้นแบบโปรแกรมประยุกต์เพื่อช่วยในการตรวจสอบอีเมล โดยซอฟต์แวร์จะแปลงข้อมูลในอีเมลเป็นเสียงอ่านส่งผ่านมาทางเครื่องโทรศัพท์เพื่อความสะดวกของผู้ใช้งาน อีกทั้งยังได้พัฒนาเป็นโปรแกรมต้นแบบสำหรับท่องเว็บ (web browser) ที่มีความพิเศษที่สามารถอ่านข้อความที่อยู่บนเว็บนั้นได้และรายงานสถานะการทำงานด้วยเสียง ซึ่งจะเป็นประโยชน์มากกับผู้ที่มีความบกพร่องทางด้านสายตา

ในประเทศไทย ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติได้พัฒนาซอฟต์แวร์สังเคราะห์เสียงพูด ชื่อว่า วาจา (Vaja)