ดาต้าเซ็นเตอร์ที่ใช้ชิป Nvidia Blackwell เจอปัญหาตู้แร็คร้อนเกินไป

รายงานว่าดาต้าเซ็นเตอร์ที่ใช้ชิปกราฟิกตัวแรงของ Nvidia อย่าง Blackwell กำลังเจอความท้าทายอย่างมากจากความร้อนสูงเกินไปเมื่อติดตั้งในตู้เซิร์ฟเวอร์ที่มี GPU จำนวนมาก ปัญหาเหล่านี้ส่งผลให้เกิดการเปลี่ยนแปลงการออกแบบและความล่าช้า และก่อให้เกิดความกังวลในหมู่ลูกค้า ทั้ง Google, Meta และ Microsoft ว่าสามารถติดตั้งเซิร์ฟเวอร์ Blackwell ได้ทันเวลาหรือไม่
ข้อมูลระบุว่า GPU Blackwell ของ Nvidia สำหรับ AI และ HPC ร้อนเกินไปเมื่อใช้ในตู้แร็คที่มีโปรเซสเซอร์ 72 ตัว คาดว่าเครื่องเหล่านี้จะใช้ไฟมากถึง 120kW ต่อแร็ค ปัญหาเหล่านี้ทำให้ Nvidia ต้องประเมินการออกแบบแร็คเซิร์ฟเวอร์ใหม่หลายครั้ง เนื่องจากความร้อนสูงเกินไปจำกัดประสิทธิภาพของ GPU และเสี่ยงต่อความเสียหายของส่วนประกอบ มีรายงานว่าลูกค้ากังวลว่าความล่าช้าเหล่านี้อาจขัดขวางระยะเวลาในการติดตั้งโปรเซสเซอร์ใหม่ในศูนย์ข้อมูลของตน
รายงานระบุว่า Nvidia ได้สั่งให้ซัพพลายเออร์ทำการเปลี่ยนแปลงการออกแบบแร็คหลายๆ ประการเพื่อแก้ไขปัญหาความร้อนสูงเกินไป บริษัทได้ทำงานอย่างใกล้ชิดกับซัพพลายเออร์และพันธมิตรในการพัฒนาการแก้ไขทางวิศวกรรมเพื่อปรับปรุงการระบายความร้อนของเซิร์ฟเวอร์ แม้ว่าการปรับเปลี่ยนเหล่านี้จะถือเป็นมาตรฐานสำหรับการเปิดตัวเทคโนโลยีขนาดใหญ่เช่นนี้ แต่อย่างไรก็ตาม การปรับเปลี่ยนเหล่านี้ก็ทำให้การล่าช้าเพิ่มขึ้น ส่งผลให้วันที่จัดส่งที่คาดไว้ต้องเลื่อนออกไปอีก
ที่มา : tomshardware