TII ฝึก Falcon 40B รุ่น LLM ที่ทันสมัยที่สุดบน AWS

บริษัท อะเมซอน เว็บ เซอร์วิสเซส (Amazon Web Services, Inc. : AWS) บริษัทในเครือของ Amazon.com, Inc. ประกาศว่าสถาบันนวัตกรรมเทคโนโลยี (Technology Innovation Institute, TII) ซึ่งเป็นศูนย์วิจัยวิทยาศาสตร์ชั้นนำระดับโลกในอาบูดาบี ได้เปิดตัว Falcon 40B แบบโอเพ่นซอร์สบน AWS

โดย Falcon 40B เป็นโมเดลภาษาขนาดใหญ่ (Large Language Model: LLM) ที่มีพารามิเตอร์ 40 พันล้านพารามิเตอร์ ที่พร้อมใช้งานภายใต้ใบอนุญาต Apache 2.0 และอยู่ในอันดับ 1 ใน Open LLM Leaderboard ของ Hugging Face ซึ่งเป็นเว็บไซต์ติดตาม จัดอันดับ และประเมิน LLM จากเกณฑ์มาตรฐานหลายรายการเพื่อระบุโมเดลที่มีประสิทธิภาพสูงสุด ลูกค้าสามารถใช้งาน Falcon 40B ผ่าน Amazon SageMaker JumpStart โดย SageMaker’s Machine Learning Hub มีโมเดลของ Falcon 40B ที่ฝึกฝนมาแล้ว (pre-trained) ทำให้ลูกค้าสามารถเข้าถึงประสิทธิภาพระดับแนวหน้าของอุตสาหกรรม โดยไม่ต้องสร้างโมเดลใหม่ขึ้นมาเอง หากต้องการเริ่มต้นใช้งาน Amazon SageMaker JumpStart โปรดไปที่ aws.amazon.com/sagemaker/jumpstart

LLM คือโมเดลแมชชีนเลิร์นนิ่งที่ถูกฝึกมาเพื่อสร้างคำหรือรูปประโยคที่มีความเป็นธรรมชาติ โมเดลชนิดนี้ถูกนำไปใช้ในหลากหลายประเภทเช่น การประมวลผลข้อความและสรุปข้อมูล ตอบคำถาม และอื่น ๆ แม้ว่า LLM เหล่านี้จะมีศักยภาพในการเปลี่ยนแปลงอุตสาหกรรม แต่กระบวนการสร้าง ฝึก และใช้งาน LLM อาจใช้เวลาหลายสัปดาห์หรือเป็นเดือน และมีค่าใช้จ่ายที่สูงถึงหลายสิบล้านเหรียญสหรัฐ ซึ่งทำให้หลายบริษัทไม่สามารถเข้าถึงได้ ลูกค้าจำนวนมาก อย่างเช่น Stability AIAI 21 LabsHugging Face และ LG AI จึงเลือกใช้ Amazon SageMaker ซึ่งเป็นบริการ ML แบบครบวงจรหรือ end-to-end ของ AWS เพื่อเพิ่มประสิทธิภาพที่ดีขึ้นและช่วยต้นทุนในกระบวนการพัฒนา ตั้งแต่การเพื่อสร้าง ฝึก และการนำ LLM ไปใช้งาน 

ความครบวงจรในการพัฒนาแมชชีนเลิร์นนิ่งโมเดลของ SageMaker จึงเป็นเหตุผลที่ TII เลือกใช้ Amazon SageMaker ในการสร้าง Falcon 40B TII จึงสามารถมุ่งเน้นไปที่การพัฒนากลไกการฝึกอบรมที่กำหนดเองและการเพิ่มประสิทธิภาพโดยที่ไม่ต้องจัดการโครงสร้างพื้นฐาน ML ด้วยตนเองเพื่อลดต้นทุนการฝึกและลดเวลาในการออกสู่ตลาด TII ได้ดำเนินการเพิ่มประสิทธิภาพหลายอย่าง เช่น การเขียนการคูณเมทริกซ์แบบกำหนดเองเพื่อเพิ่มความเร็วในการฝึก ตลอดกระบวนการฝึก AWS ยังได้ร่วมงานกับ TII เพื่อเพิ่มความเสถียรโดยใช้ SageMaker เพื่อให้การฝึกดำเนินไปอย่างราบรื่นและลดการหยุดชะงักต่าง ๆ ที่อาจรบกวนเวลาการพัฒนา

TII ได้เปิดตัวโมเดล Falcon 40B ในเดือนพฤษภาคม 2566 ภายใต้ลิขสิทธิ์ Apache 2.0 ซึ่งตั้งแต่เปิดตัวมานั้น Falcon 40B ได้แสดงประสิทธิภาพการทำงานที่ดีกว่าโมเดลที่คล้ายคลึงกันในเกณฑ์มาตรฐานต่าง ๆ แสดงให้เห็นถึงประสิทธิภาพที่ยอดเยี่ยมโดยไม่ต้องปรับแต่งรายละเอียดเฉพาะใด ๆ นอกจากนี้ AWS ยังเปิดให้ลูกค้าได้ใช้งาน Falcon 40B ผ่าน Amazon SageMaker Jumpstart เพื่อให้ลูกค้าเข้าถึงโมเดลที่ทันสมัยนี้ได้ง่ายขึ้น ปัจจุบัน ลูกค้าทุกขนาดและทุกอุตสาหกรรมสามารถใช้งานและปรับใช้โมเดล Falcon 40B ให้เป็นโมเดลของตนเองได้อย่างรวดเร็วและง่ายดายเพื่อตอบสนองความต้องการเฉพาะ เช่น การแปลภาษา การตอบคำถาม การสรุปข้อมูล หรือการระบุรูปภาพ

ดร. เอ็บเตซัม อัลมาซรูอีย์ กรรมการผู้บริหาร AI-Cross Center Unit และ Project Lead ทางด้าน LLM Projects ที่สถาบัน TII กล่าวว่า “การที่ Falcon 40B นั้นได้ถูกเผยแพร่แบบ open source ทำให้องค์กรต่าง ๆ สามารถใช้ประโยชน์อันล้นหลามของโมเดลนี้ได้ เพื่อต่อยอดและพัฒนา AI Solution ให้กับธุรกิจของตนเอง จึงถือเป็นความสำเร็จอย่างยิ่งในความมุ่งมั่นของเราที่จะส่งเสริมนวัตกรรม AI และเป็นอีกหนึ่งผลงานโดดเด่นทางวิทยาศาสตร์ของสหรัฐอาหรับเอมิเรตส์ การที่เราเปิดให้ Falcon LLM เป็น open source ทำให้องค์กรต่าง ๆ และนักวิจัยจากทั่วทุกมุมโลกสามารถเข้าถึงเทคโนโลยีสุดล้ำสมัยนี้ได้ สำหรับขั้นตอนต่อไป เราต้องการที่จะส่งเสริมพัฒนาความก้าวหน้าด้าน AI โดยการสร้างโมเดลใหม่ ๆ เพื่อให้องค์กรและธุรกิจต่าง ๆ ในสหรัฐอาหรับเอมิเรตส์ได้ใช้ประโยชน์ร่วมกัน”

เพื่อให้ลูกค้าเริ่มต้นใช้งาน ML ได้อย่างสะดวกรวดเร็วขึ้น สามารถเริ่มใช้โมเดล Falcon ได้อย่างง่ายดายผ่าน SageMaker Studio หรือผ่านโปรแกรม SageMaker Python SDK Falcon 40B เริ่มเปิดสู่สาธารณชนแล้วผ่านช่องทาง Amazon SageMaker JumpStart ในรัฐโอไฮโอ (สหรัฐอเมริกา) รัฐเวอร์จิเนีย (สหรัฐอเมริกา) รัฐออริกอน (สหรัฐอเมริกา) ซิดนีย์ (เอเชียแปซิฟิก) กรุงโซล (เอเชียแปซิฟิก) ลอนดอน (ยุโรป) และประเทศแคนาดา โดย AWS พื้นที่อื่น ๆ จะทยอยตามมาเร็ว ๆ นี้

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับโครงการ Falcon LLM สามารถอ่านบทความของ Dr. Almazrouei ได้ที่นี่