ฟังแค่ 3 วินาที AI ก็เลียนเสียงคุณได้แล้ว!!!
นักวิจัยของไมโครซอฟต์กำลังทำงานเกี่ยวกับโมเดลแปลงข้อความเป็นคำพูด (TTS) ที่สามารถเลียนแบบเสียงของบุคคล พร้อมแสดงอารมณ์และน้ำเสียงได้หลังจากการฝึกเพียง 3 วินาที
ด้วยเทคโนโลยี AI อย่าง VALL-E และกระบวนการที่ระบุไว้ในเอกสารวิจัยความยาว 15 หน้าที่เผยแพร่ในเดือนนี้บนเว็บไซต์วิจัย arXiv ถือเป็นก้าวสำคัญของ Microsoft ในการแข่งขันทางเทคโนโลยีกับ Google, Amazon และ Meta
ไมโครซอฟต์กำลังใช้ปัญญาประดิษฐ์สำหรับการประมวลผลภาษาธรรมชาติ (NLP) ซึ่งเป็นผลพลอยได้จากการซื้อธุรกิจของ Nuance ด้วยมูลค่า 20,000 ล้านดอลลาร์เมื่อปีที่แล้ว รวมทั้งเทคโนโลยีการรู้จำเสียงและเทคโนโลยี TTS และลงทุนอย่างจริงจังในการใช้เทคโนโลยีจาก OpenAI ที่เพิ่งเริ่มต้น รวมถึงเครื่องมือ ChatGPT ซึ่งจะถูกนำมาประยุกต์ใช้กับเครื่องมือค้นหา Bing และชุดแอปพลิเคชัน Office
การพัฒนาอย่างรวดเร็วของเทคโนโลยีก่อให้เกิดปัญหาด้านจริยธรรมและกฎหมายต่างๆ เสียงของบุคคลนั้นสามารถบันทึกและสังเคราะห์เพื่อใช้ในหลากหลายด้าน ตั้งแต่โฆษณาหรือการโทรสแปมไปจนถึงวิดีโอเกมหรือแชทบอท นอกจากนี้ยังสามารถใช้ในการปลอมโดยใช้เสียงของนักการเมืองหรือบุคคลที่มีชื่อเสียง เพื่อเผยแพร่ข้อมูลเท็จหรือสร้างความเกลียดชัง
ที่มา : theregister