Grok 4.1 มาแล้ว Elon Musk ใจป้ำ เปิดให้ลองใช้ได้ฟรีๆ
xAI ของ Elon Musk ได้เริ่มเปิดตัว Grok 4.1 อย่างเป็นทางการ ซึ่งเป็นการอัปเกรดจาก Grok 4 โดยมาพร้อมกับการปรับปรุงที่สำคัญหลายด้าน โดยเฉพาะการลดอาการหลอน (hallucination) ลงถึง 3 เท่า และความสามารถด้านอารมณ์ที่ดีที่สุดเท่าที่เคยมี
สองโมเดลพร้อมใช้งานฟรี
xAI เปิดตัว Grok 4.1 มาในสองเวอร์ชัน ได้แก่ Grok 4.1 แบบมาตรฐานและ Grok 4.1 Thinking ทั้งสองโมเดลสามารถใช้งานได้ฟรี แต่ลูกค้าที่เป็นสมาชิกจ่ายเงินจะได้รับขีดจำกัดการใช้งานที่สูงกว่า
Grok 4.1 แบบมาตรฐาน (non-thinking variant) ให้ความสำคัญกับความเร็วในการตอบสนอง เหมาะสำหรับการสนทนาทั่วไป ขณะที่ Grok 4.1 Thinking ใช้เวลาในการใช้เหตุผลมากขึ้นก่อนตอบ โดยแสดงขั้นตอนการคิดแบบ chain-of-thought ที่ชัดเจน ทำให้เหมาะกับงานที่ซับซ้อนหรือต้องการการวิเคราะห์เชิงลึก
การปล่อยแบบเงียบและทดสอบกับผู้ใช้จริง
xAI ได้ทำการ “silent rollout” อย่างค่อยเป็นค่อยไปตั้งแต่วันที่ 1-14 พฤศจิกายน 2025 โดยปล่อย Grok 4.1 ให้ผู้ใช้งานส่วนหนึ่งทดสอบก่อนเปิดตัวอย่างเป็นทางการ ผลการทดสอบพบว่าผู้ใช้มีความพอใจมากกว่าโมเดลเก่าถึง 65% ในการเปรียบเทียบแบบ blind test
ครองอันดับ 1 บน LMArena Text Arena
ตามข้อมูลจาก LMArena Text Arena ซึ่งเป็นเครื่องมือโอเพนซอร์สที่ให้ผู้ใช้เปรียบเทียบโมเดล LLM ต่างๆ แบบ side-by-side และสุ่มทดสอบแบบ blind test พบว่า Grok 4.1 Thinking ครองอันดับ 1 ด้วยคะแนน Elo สูงถึง 1,510 ส่วน Grok 4.1 แบบมาตรฐานอยู่ที่อันดับ 19 ด้วยคะแนน 1,437 ใน Arena Expert leaderboard
“นี่คือการปรับปรุงมากกว่า 40 คะแนนตั้งแต่ Grok 4 Fast ซึ่งเข้าสู่ Arena เพียงสองเดือนก่อนหน้านี้” แพลตฟอร์มเบนช์มาร์กระบุ
นอกจากนี้ Grok 4.1 ยังทำคะแนนสูงสุดใน EQ-Bench v3 ซึ่งวัดความสามารถด้านอารมณ์ผ่าน 45 สถานการณ์แบบ multi-turn roleplay โดยประเมินความเห็นอกเห็นใจ ความเข้าใจ และความละเอียดอ่อนระหว่างบุคคล
การปรับปรุงสี่มิติหลัก
Grok 4.1 มีการเปลี่ยนแปลงเชิงคุณภาพในสี่ด้านสำคัญ ได้แก่ ความคิดสร้างสรรค์ โดยแสดงสไตล์ภาษาและจินตนาการที่แข็งแกร่งขึ้นในการเขียน การเล่าเรื่อง และบริบททางสังคม ความฉลาดทางอารมณ์ สามารถจับน้ำเสียงและการเปลี่ยนแปลงทางอารมณ์ได้ ตอบสนองด้วยตลกทางอารมณ์ที่เหมือนมนุษย์ และสร้างการตอบสนองที่ให้กำลังใจและความเข้าใจ
ด้าน ความสอดคล้องของบุคลิกภาพ Grok 4.1 รักษาน้ำเสียงและบุคลิกที่สอดคล้องกันในการสนทนายาว ไม่แสดงพฤติกรรมที่ไม่สอดคล้องเหมือนโมเดลก่อนหน้านี้ และความสามารถในการทำงานร่วมกัน โดยรักษาความสอดคล้องและการตระหนักรู้เป้าหมายในการสนทนาหลายรอบหรือการทำงานร่วมกัน
xAI สรุปลักษณะของโมเดลในประโยคเดียวว่า “มันมีการรับรู้ที่ดีขึ้น มีความเห็นอกเห็นใจมากขึ้น และเหมือนคนที่มีความสอดคล้องมากขึ้น”
ลดอาการหลอนลง 3 เท่า
xAI อ้างว่า Grok 4.1 มีอาการหลอน (hallucination) น้อยกว่าโมเดลก่อนหน้าถึง 3 เท่า ทำให้เป็นหนึ่งในรุ่นที่ดีที่สุดของ xAI โดยบริษัทใช้การวิเคราะห์ข้อมูลการใช้งานจริงและการประเมินแบบ FActScore โดยเฉพาะในโหมด non-thinking ที่มีเครื่องมือค้นหาเว็บ ความสอดคล้องของข้อเท็จจริงมีเสถียรภาพมากขึ้น
วิศวกรบรรลุผลนี้ผ่านการฝึกอบรมหลังการเทรน (post-training) แบบเป้าหมายบนข้อมูลการใช้งานจริงและชุดข้อมูลคลาสสิกอย่าง FActScore ที่ประกอบด้วยคำถามชีวประวัติ 500 ข้อ นอกจากนี้โหมด non-thinking ยังเรียกใช้เครื่องมือค้นหาเว็บอย่างเชิงรุกเมื่อความมั่นใจต่ำกว่าเกณฑ์ภายใน เพื่อยึดคำตอบกับแหล่งข้อมูลที่ตรวจสอบได้
ประสิทธิภาพเมื่อเทียบกับคู่แข่ง
แม้เราจะยังไม่ทราบว่า Grok 4.1 จะเทียบกับคู่แข่งอย่าง GPT 5.1 ที่เพิ่งเปิดตัวพร้อมการปรับปรุงด้านประสิทธิภาพและความฉลาดทางอารมณ์ได้ดีเพียงใด แต่จากข้อมูลเบื้องต้นของ LMArena แสดงให้เห็นว่า Grok 4.1 ทั้งสองเวอร์ชันได้ทำคะแนนสูงขึ้นในตำแหน่งที่แข่งขันที่สุดของ Text Arena
การเปรียบเทียบโดยตรงกับโมเดลชั้นนำร่วมสมัยยังมีจำกัด แต่ LMArena Elo ratings ให้สัญญาณที่ชัดเจนที่สุด Grok 4.1 Thinking เหนือกว่าทุกเวอร์ชันที่เปิดตัวจาก OpenAI, Anthropic, Google และ Meta ด้วยช่วงห่างที่โดยปกติต้องใช้การกระโดดทางสถาปัตยกรรมแบบเต็มรูป
วิธีการเข้าถึง
Grok 4.1 พร้อมให้บริการสำหรับผู้ใช้ทุกคนผ่าน grok.com, X (เดิมคือ Twitter) และแอป Grok สำหรับ iOS และ Android โดยเปิดตัวทันทีในโหมด Auto และสามารถเลือกโมเดล “Grok 4.1” โดยตรงใน model picker ได้
สำหรับนักพัฒนา xAI API รองรับ Grok 4.1 endpoints ภายใต้ชื่อโมเดลมาตรฐานแล้ว โดย latency profiles ดีขึ้นอย่างเห็นได้ชัด โหมด non-thinking ใช้เวลาเฉลี่ยต่ำกว่า 400 milliseconds สำหรับ time-to-first-token ในคำขอทั่วไป ขณะที่โหมด thinking เพิ่มความลึกในการใช้เหตุผลที่สามารถควบคุมได้ผ่าน parameters เสริม

