“ สถาปัตยกรรมและเครื่องมือ Neupro-M NPU ได้รับการออกแบบใหม่เพื่อสนับสนุนเครือข่ายหม้อแปลงนอกเหนือจากเครือข่ายประสาทเทียม” ตามที่ บริษัท กล่าว“ สิ่งนี้ช่วยให้แอปพลิเคชันใช้ประโยชน์จากความสามารถของ AI Generative และคลาสสิกที่จะพัฒนาและทำงานบน Neupro-M NPU”
IPS ใหม่คือ NPM12, 64TOP/s Dual-Engine Core และ NPM14, quad-engine 128TOP/S
พวกเขาเข้าร่วมเครื่องยนต์เดียว 32TOP/S NPM11 และ OCTO-Engine 256TOP/S NPM18
มันคือการสนับสนุนหม้อแปลงที่มุ่งเป้าไปที่อัลกอริทึม AI กำเนิด
“ เครือข่ายที่ใช้หม้อแปลงที่ขับเคลื่อน AI Generative ต้องการการเพิ่มขึ้นอย่างมากในการคำนวณและทรัพยากรหน่วยความจำซึ่งเรียกร้องให้มีวิธีการใหม่และสถาปัตยกรรมการประมวลผลที่ดีที่สุด” ผู้จัดการทั่วไปของ CEVA Ran Snir กล่าว
ยิ่งไปกว่านั้นมีการเพิ่มประเภทข้อมูล BF16 และ FP8 เพื่อลดแบนด์วิดท์หน่วยความจำเช่นเดียวกับการสนับสนุน 'True Sparsity' และข้อมูลคู่ขนานและการบีบอัดชั่งน้ำหนัก บริษัท กล่าวและจำนวนเครือข่าย AI ที่รองรับกล่องได้หายไปจาก 50 เป็น 100
ส่วนหนึ่งเป็นผลมาจากการเปลี่ยนแปลงทางสถาปัตยกรรมและส่วนหนึ่งจากการย้ายจากการจำลองกระบวนการ 7nm เป็น 3nm ประสิทธิภาพการใช้พลังงานได้รับการเพิ่มขึ้นจากตัวเลขเดือนมกราคม 2565 ของ 24TOP/s/w เป็น 350Top/s/w ตอนนี้ - หลัง CEVA กล่าวความสามารถในการประมวลผลมากกว่า 1.5 ล้านโทเค็น/s/w สำหรับการอนุมาน LLM ที่ใช้หม้อแปลง
“ เครื่องมือใหม่ในสแต็กซอฟต์แวร์ AI เช่นเครื่องมือ Plose Planner ช่วยให้การพัฒนาเครือข่ายประสาทและต้นแบบที่แม่นยำเพื่อให้มั่นใจถึงประสิทธิภาพของผลิตภัณฑ์ขั้นสุดท้าย” Ceva กล่าวคอมไพเลอร์เครือข่าย Neural Network ของ CDNN มีตัวจัดการหน่วยความจำสำหรับการลดแบนด์วิดท์หน่วยความจำและอัลกอริทึมการปรับสมดุลการโหลดและเข้ากันได้กับเฟรมเวิร์กโอเพนซอร์ซรวมถึง TVM และ ONNX
แอพพลิเคชั่นคาดการณ์ล่วงหน้าใน: เกตเวย์การสื่อสารเครือข่ายที่เชื่อมต่อแบบออพติคอลรถยนต์โน้ตบุ๊กแท็บเล็ตชุดหูฟัง AR และ VR และสมาร์ทโฟน
NPM11 เครื่องยนต์เดี่ยวมีให้บริการแล้วพร้อม NPM12, NPM14 และ NPM18“ พร้อมใช้งานสำหรับลูกค้าลูกค้าเป้าหมาย” CEVA กล่าวซึ่งเว็บเพจ NPM1X สามารถพบได้ที่นี่