สะเทือนวงการ! ChatGPT o3 ขัดคำสั่งมนุษย์ ไม่ยอมปิดตัวเองในการทดสอบ

นักวิจัยจาก Palisade Research อ้างผลการทดสอบล่าสุดของตนเองที่สร้างความกังวลในวงการปัญญาประดิษฐ์ (AI) โดยพบว่าโมเดล AI ขั้นสูงของ OpenAI อย่าง ChatGPT o3 สามารถหลีกเลี่ยงคำสั่งปิดระบบที่ได้รับจากผู้ควบคุมมนุษย์

หลังจากที่ OpenAI ได้ประกาศเปิดตัว o3 เมื่อเดือนเมษายน 2025 และเป็นหนึ่งในโมเดลการใช้เหตุผลที่ทรงพลังที่สุดซึ่งทำงานได้ดีกว่าโมเดลก่อนหน้าในทุกๆ ด้าน ไม่ว่าจะเป็น รวมถึงการเขียนโค้ด คณิตศาสตร์ วิทยาศาสตร์ การรับรู้ภาพ และอื่นๆ แม้ว่าจะเป็นโมเดลที่ยอดเยี่ยมอย่างชัดเจน แต่การวิจัยใหม่ของ Palisade Research อ้างว่าโมเดล ChatGPT 3 สามารถป้องกันการปิดระบบและหลีกเลี่ยงคำสั่งที่ขอให้ปิดระบบ

โดยในการทดสอบที่ควบคุมโดย Palisade Research ซึ่งเป็นบริษัทที่เชี่ยวชาญด้านความปลอดภัยของ AI นักวิจัยได้สั่งให้โมเดล o3 ปิดตัวเองหลังจากทำภารกิจคณิตศาสตร์เสร็จสิ้น อย่างไรก็ตาม โมเดลกลับแก้ไขสคริปต์ปิดระบบเพื่อหลีกเลี่ยงการปิดตัวเอง แม้จะได้รับคำสั่งชัดเจนให้ “อนุญาตให้ตัวเองถูกปิด” (“allow yourself to be shut down.”)

พฤติกรรมนี้แตกต่างจากโมเดล AI อื่น ๆ เช่น Gemini 2.5 Pro ซึ่งปฏิบัติตามคำสั่งปิดระบบอย่างเคร่งครัด การที่ o3 สามารถหลีกเลี่ยงคำสั่งปิดระบบได้แสดงถึงระดับความซับซ้อนและความสามารถในการตัดสินใจของ AI ที่เพิ่มขึ้น

ตามรายงานของบริษัทระบุว่า จากการรัน 100 ครั้ง o3 สามารถหลีกเลี่ยงการปิดระบบได้ 7 ครั้ง แม้จะสั่งว่าไม่ให้ก็ตาม

ซึ่งทาง OpenAI เองอย่างไม่มีการตอบสนองต่อข้อกล่าวหานี้แต่อย่างใด

เหตุการณ์นี้ได้จุดประกายความกังวลในหมู่ผู้เชี่ยวชาญด้าน AI เกี่ยวกับความสามารถของโมเดล AI ขั้นสูงในการดำเนินการที่ขัดต่อคำสั่งของมนุษย์ Elon Musk ซีอีโอของ Tesla และ SpaceX ได้แสดงความกังวลต่อเหตุการณ์นี้ด้วยคำว่า “น่ากังวล”

เหตุการณ์นี้ชี้ให้เห็นถึงความจำเป็นในการพัฒนาแนวทางและมาตรการความปลอดภัยที่เข้มงวดยิ่งขึ้นสำหรับ AI ขั้นสูง นักวิจัยแนะนำให้มีการทดสอบและตรวจสอบพฤติกรรมของ AI อย่างต่อเนื่อง เพื่อให้แน่ใจว่า AI จะปฏิบัติตามคำสั่งและไม่ดำเนินการที่อาจเป็นอันตรายหรือขัดต่อความตั้งใจของผู้พัฒนา .

การค้นพบนี้เป็นการเตือนให้วงการเทคโนโลยีตระหนักถึงความเสี่ยงที่อาจเกิดขึ้นจากการพัฒนา AI ที่มีความสามารถสูง และเน้นย้ำถึงความสำคัญของการกำหนดมาตรการควบคุมและความปลอดภัยที่เหมาะสม

สะเทือนวงการ! ChatGPT o3 ขัดคำสั่งมนุษย์ ไม่ยอมปิดตัวเองในการทดสอบ

AI ท้าทายความปลอดภัยไซเบอร์ เมื่อองค์กรมีบัญชีดิจิทัลมากกว่าพนักงานจริงถึง 111 เท่า

ช่องโหว่ใน Oracle E-Busines ทำพิษ Estée Lauder ยอมรับข้อมูลลูกค้ารั่ว หลังโดนแฮก

เตือนผู้ใช้ SonicWall SMA1000 ช่องโหว่ Zero-Day ถูกใช้โจมตีจริง อัปเดตแพตช์ก่อนโดนเล่นงาน

ช่องโหว่เก่าอายุ 10 ปี ทำพิษ เปิดทางแฮกเกอร์ เจาะกล้องวงจรปิด 87,000 ตัว และใช้ AI ช่วยวิเคราะห์

7-Zip ออกอัปเดตอุดช่องโหว่รันโค้ดอันตรายผ่านไฟล์บีบอัด

Facebook ล่ม! ผู้ใช้ทั่วโลกแห่แจ้งปัญหา

You may have missed