Arm Cortex-A77 - ทุกสิ่งที่คุณจำเป็นต้องรู้

ผู้เขียน: Randy Alexander
วันที่สร้าง: 2 เมษายน 2021
วันที่อัปเดต: 1 กรกฎาคม 2024
Anonim
What is the ARM Cortex-A75? - Gary explains
วิดีโอ: What is the ARM Cortex-A75? - Gary explains

เนื้อหา


นอกเหนือจากโปรเซสเซอร์กราฟิก Mali-G77 ใหม่และหน่วยประมวลผลดิสเพลย์ Mali-D77 แล้ว Arm ยังได้เปิดตัวซีพียูประสิทธิภาพสูงรุ่นล่าสุด Cortex-A77 เช่นเดียวกับ Cortex-A76 ของปีที่แล้ว Cortex-A77 ได้รับการออกแบบสำหรับการใช้งานระดับพรีเมี่ยมที่ต้องการการสิ้นเปลืองพลังงานต่ำอันเป็นเอกลักษณ์ของ Arm ทุกอย่างตั้งแต่สมาร์ทโฟนไปจนถึงแล็ปท็อปและมีโอกาสมากกว่านั้น

ด้วย Cortex-A77 Arm ได้กำหนดเป้าหมายคำสั่งสูงสุดต่อรอบ / นาฬิกา (IPC) เพื่อเพิ่มประสิทธิภาพในการจัดการผ่าน Cortex-A76 ความถี่ของนาฬิกา, การใช้พลังงานและพื้นที่ทั้งหมดได้รับการออกแบบมาให้อยู่ใน ballpark เดียวกัน แต่แกนกลางใหม่สามารถกระทืบคำแนะนำเพิ่มเติมได้ในครั้งเดียว ในการทำเช่นนี้ Arm ได้ออกแบบคอร์ที่กว้างกว่าปีที่แล้วและได้ทำการปรับปรุงจำนวนมากเพื่อให้ซีพียูคอร์ป้อนด้วยสิ่งที่ต้องทำ แต่ก่อนที่เราจะไปถึงจุดนั้นลองดำดิ่งลงสู่ภาพรวมระดับสูงและหมายเลขประสิทธิภาพ

กดปุ่มเป้าหมายประสิทธิภาพ

ย้อนกลับไปในเดือนสิงหาคม 2018 Arm ได้แชร์ซีพียูแผนงานไปจนถึงปี 2020 โดยไม่เคยมีมาก่อนจนถึงปี 2020 จาก Cortex-A73 ถึงการออกแบบ“ Hercules” ของปี 2020 บริษัท มีแนวโน้มที่จะเพิ่มประสิทธิภาพการคำนวณ 2.5 เท่า ชิ้นงานอันสวยงามของการฉายภาพขนาดใหญ่นี้ประสบความสำเร็จด้วยการเปลี่ยนแปลงของสถาปัตยกรรมขนาดใหญ่ที่มี Cortex-A76, ความเร็วสัญญาณนาฬิกาที่สูงขึ้นและการย้ายจาก 16 เป็น 10 และตอนนี้ผลิต 7nm พร้อม 5nm เพื่อติดตาม ปีที่แล้วประมาณ 1.8 เท่าของแผนการดำเนินงานบรรลุผลสำเร็จในปีที่แล้วและ Cortex-A77 มอบการเพิ่ม IPC อีกประมาณ 20 เปอร์เซ็นต์ สิ่งนี้ทำให้เราไปถึงเป้าหมาย 2.5x ของ Arm ได้อย่างดีแม้ว่าอุปกรณ์มือถือที่มีพลังงาน จำกัด และงบประมาณด้านความร้อนก็ไม่คาดว่าจะเห็นกำไรทั้งหมดเหล่านี้


สำหรับการเปรียบเทียบ Cortex-A76 ของปีที่แล้วมีการเพิ่มขึ้นประมาณ 30-35 เปอร์เซ็นต์เมื่อเทียบกับ Cortex-A75 ในปีนี้เรากำลังมองหาการเพิ่มขึ้นของ IPC ระหว่าง A77 และ A76 ที่เงียบลง แต่ยังคงมีนัยสำคัญ 20 เปอร์เซ็นต์ นี่เป็นข่าวดีเพราะมันหมายถึงประสิทธิภาพที่มากขึ้นในขณะที่ยึดติดกับข้อ จำกัด ด้านความร้อนและพลังงานเหมือนก่อน การแลกเปลี่ยนคือ A77 มีขนาดใหญ่กว่า A76 ประมาณ 17 เปอร์เซ็นต์ดังนั้นจะเสียค่าใช้จ่ายมากขึ้นในแง่ของพื้นที่ซิลิกอน หากคุณต้องการเปรียบเทียบกับผู้นำเดสก์ท็อป AMD จะจัดการการเพิ่ม IPC 15% ระหว่าง Zen2 และ Zen + ในขณะที่ IPC ของ Intel ยังคงมีเสถียรภาพเป็นเวลาหลายปีแน่นอนว่าเรากำลังพูดถึงกลุ่มตลาดที่แตกต่างกันที่นี่ แต่นี่แสดงให้เห็นว่าทีมออกแบบ CPU ของ Arm สร้างผลกำไรที่น่าประทับใจในรุ่นล่าสุดได้อย่างไร

การเพิ่มประสิทธิภาพ 20% นั้นมีให้สำหรับ SoCs รุ่น Cortex-A77 ในอนาคต

ที่นี่คือที่ A76 ทำเครื่องหมายการเปลี่ยนแปลงทางสถาปัตยกรรมขนาดใหญ่ที่มีประสิทธิภาพเพิ่มขึ้นอย่างมากในขณะที่เรากลับไปที่การปรับปรุงระดับการเพิ่มประสิทธิภาพด้วย A77 เมื่อออกนอกเส้นทางลองดำดิ่งสู่สิ่งใหม่ใน Arm Cortex-A77


Cortex-A77 สร้างจากสถาปัตยกรรมไมโคร A76

กุญแจสำคัญในการทำความเข้าใจความแตกต่างระหว่าง Cortex-A77 และ A76 คือการเข้าใจสิ่งที่มีความหมายโดยการออกแบบหลัก "กว้าง" โดยพื้นฐานแล้วเรากำลังพูดถึงความสามารถในการประมวลผลคำแนะนำเพิ่มเติมสำหรับแต่ละรอบสัญญาณนาฬิกาซึ่งจะเพิ่มปริมาณงานหลักของ มีสองส่วนที่สำคัญในการได้รับสิทธินี้ - เพิ่มจำนวนหน่วยดำเนินการเพื่อทำการประมวลผลและสร้างความมั่นใจว่าหน่วยเหล่านี้จะได้รับข้อมูลที่ดี มาเริ่มกันที่ส่วนหลังแล้วโฟกัสไปที่ส่วนการส่งแคชและตัวทำนายสาขาของ SoC

Cortex-A77 เห็นการเพิ่มขึ้น 50 เปอร์เซ็นต์ในการส่งความกว้างสูงสุดหกคำสั่งต่อรอบจากสี่ด้วย A76 นั่นหมายถึงคำแนะนำเพิ่มเติมที่มุ่งไปยังคอร์ประมวลผลสำหรับแต่ละรอบสัญญาณนาฬิกาเพื่อประสิทธิภาพที่ดียิ่งขึ้น หน้าต่างการดำเนินการที่ไม่เป็นไปตามใบสั่งจะมีขนาดใหญ่ขึ้นเช่นกันซึ่งเพิ่มขึ้นเป็น 160 รายการเพื่อให้มีความเท่าเทียมมากขึ้น มีคำแนะนำแคช 64K ที่คุ้นเคยในขณะที่ Branch Target Buffer (BTB) ซึ่งเก็บที่อยู่สำหรับตัวทำนายสาขานั้นใหญ่กว่า 33 เปอร์เซ็นต์ก่อนที่จะรองรับการเติบโตในคำแนะนำแบบขนาน ไม่มีอะไรผิดปกติที่นี่เป็นรุ่นที่กว้างขึ้นของปีที่แล้ว

การเพิ่มส่วนหน้าที่น่าสนใจยิ่งขึ้นคือแคช 1.5K MOP ใหม่ทั้งหมดซึ่งเก็บ macro-Ops (MOPs) ที่ป้อนกลับจากหน่วยถอดรหัส สถาปัตยกรรมซีพียูของ Arm จะถอดรหัสคำแนะนำจากแอปพลิเคชันของผู้ใช้ไปสู่การทำงานของแมโครที่มีขนาดเล็กลง คุณสามารถเห็นสิ่งนี้ในแผนภาพด้านบนในส่วนถอดรหัส แคช MOP ถูกใช้เพื่อลดค่าใช้จ่ายที่เกิดจากสาขาที่ไม่ได้รับและฟลัชในขณะที่คุณถือมาโครแทนการถอดรหัสอีกครั้งและเพิ่มปริมาณงานโดยรวมของแกน ดึงข้อมูลจาก MOP แทน i-cache บายพาสสเตจการถอดรหัสหนึ่งรอบ Arm ระบุว่าแคช MOP สามารถเข้าถึงอัตราการเข้าชม 85 เปอร์เซ็นต์หรือมากกว่านั้นในเวิร์กโหลดที่หลากหลายทำให้เป็นส่วนเสริมที่มีประโยชน์อย่างมากกับ i-cache มาตรฐาน

ย้ายลงไปยังส่วนหลักของการประมวลผลของ CPU ให้สังเกตการเพิ่ม ALU ตัวที่สี่และหน่วยสาขาที่สอง ALU ที่สี่นี้ช่วยเพิ่มแบนด์วิดท์หมายเลขทั่วไปของโปรเซสเซอร์โดยเพิ่ม 50 เปอร์เซ็นต์ ALU เพิ่มเติมนี้มีความสามารถในคำสั่งรอบเดียวพื้นฐาน (เช่น ADD และ SUB) บวกกับการดำเนินการจำนวนเต็มสองรอบเช่นการคูณ อีกสอง ALUs สามารถจัดการคำแนะนำรอบเดียวขั้นพื้นฐานเท่านั้นในขณะที่หน่วยสุดท้ายจะถูกเรียกเก็บเงินด้วยการดำเนินการทางคณิตศาสตร์ขั้นสูงเช่นการหารการคูณทวีคูณเป็นต้นหน่วยสาขาที่สองภายในแกนการดำเนินการสองเท่าของจำนวนสาขาพร้อมกัน แกนกลางสามารถจัดการได้ซึ่งมีประโยชน์ในกรณีที่คำสั่งที่ส่งมาสองในหกคำสั่งนั้นถูกข้ามไปยังสาขา ฟังดูแปลกไปเล็กน้อย แต่การทดสอบภายในที่ Arm เปิดเผยประโยชน์ด้านประสิทธิภาพจากการใช้หน่วยที่สองนี้

Cortex-A77 นำเสนอการขนานที่ดีขึ้นและรับสิ่งใหม่ในการดึงข้อมูลแคชล่วงหน้า

การปรับแต่งอื่น ๆ ให้กับซีพียูคอร์รวมถึงการเพิ่มการเข้ารหัส AES ที่สอง ไปป์ไลน์ที่เก็บข้อมูลตอนนี้มีพอร์ตปัญหาเฉพาะเพื่อเพิ่มแบนด์วิดท์ปัญหาหน่วยความจำเป็นสองเท่า ก่อนหน้านี้พอร์ตเหล่านี้ใช้ร่วมกับ ALUs ซึ่งบางครั้งอาจกลายเป็นคอขวด นอกจากนี้ยังมีข้อมูลรุ่นต่อไปที่สมบูรณ์แบบเพื่อปรับปรุงประสิทธิภาพการใช้พลังงานในขณะที่เพิ่มแบนด์วิดท์ให้กับระบบ DRAM

ส่วนหนึ่งของระบบนี้ใน Cortex-A77 ยังมีระบบ prefetch ที่“ รู้เท่าทันระบบ” ใหม่ทั้งหมด สิ่งนี้จะปรับปรุงประสิทธิภาพหน่วยความจำโดยพิจารณาจากจำนวนคอร์ CPU ที่หลากหลายความจุแคชและเวลาแฝงและการกำหนดค่าระบบย่อยหน่วยความจำภายในอุปกรณ์ขั้นสุดท้าย ฮาร์ดแวร์เฉพาะสำหรับพูดคุยกับ Dynamic Scheduling Unit (DSU) ซึ่งเป็นส่วนหนึ่งของคลัสเตอร์ CPU DynamIQ ซึ่งตรวจสอบการใช้งานแคช L3 ที่ใช้ร่วมกัน แกนกลางมีคุณสมบัติระยะทางแบบไดนามิกและระดับความก้าวร้าวเพื่อลดการใช้แคชในสถานการณ์ที่แบนด์วิดธ์ L3 ถูก จำกัด โดยแกนประมวลผล CPU อื่น คอร์ที่มีประสิทธิภาพสูงกว่าเช่น Cortex-A77 มีแนวโน้มที่จะทำให้การเข้าถึงหน่วยความจำ DSU ในขณะที่คอร์พลังงานต่ำเช่น A55 ไม่น่าจะเป็นไปได้

เหมาะสมทั้งหมดเข้าด้วยกัน

มีการเปลี่ยนแปลงเล็กน้อยมากมายสำหรับ Cortex-A77 ซึ่งเพิ่มความแตกต่างอย่างมากให้กับรุ่นก่อน สั้น ๆ แคช MOP ใหม่ของ A77 รวมกับหน้าต่างคำแนะนำที่กว้างและยาวขึ้นช่วยให้ ALU, สาขาและหน่วยความจำที่ใช้งานง่ายขึ้น การออกแบบโรงไฟฟ้า Cortex-A76 ได้รับการขยายเพื่อปรับปรุงทรูพุตให้ดียิ่งขึ้นด้วย A77 โดยไม่ต้องพึ่งพาความเร็วสัญญาณนาฬิกาที่สูงขึ้น

ประสิทธิภาพที่ใหญ่ที่สุดช่วยเพิ่ม Cortex-A77 มาในรูปของเลขจำนวนเต็มและเลขทศนิยม สิ่งนี้ได้รับการยืนยันโดยการวัดประสิทธิภาพภายในของ Arm ซึ่งแสดงการเพิ่มประสิทธิภาพ 20 ถึง 35 เปอร์เซ็นต์ในจำนวนเต็ม SPEC และการวัดจุดลอยตัวตามลำดับ การปรับปรุงแบนด์วิดท์หน่วยความจำอยู่ที่ระหว่าง 15 ถึง 20 เปอร์เซ็นต์โดยเน้นย้ำอีกครั้งว่าผลกำไรที่ยิ่งใหญ่ที่สุดนั้นมาในรูปของการบีบอัดตัวเลข โดยรวมแล้วการปรับปรุงเหล่านี้ทำให้ A77 มีค่าเฉลี่ยเพิ่มขึ้น 20% เมื่อเทียบกับรุ่นก่อนหน้า เราอาจเห็นผลกำไรที่เพิ่มขึ้นเล็กน้อยซึ่งเป็นผลมาจากกระบวนการผลิต 7nm ขั้นสูงในปลายปีนี้หรือต้นปี 2563

ในแง่ของสมาร์ทโฟน SoCs ที่ใช้พลังงาน Cortex-A77 นั้นถูกกำหนดไว้สำหรับผลิตภัณฑ์เรือธงที่มีประสิทธิภาพสูง แขนเต็มคาดว่าจะเห็นการออกแบบโรงไฟฟ้าใช้ 4 + 4 บิตการจัดเรียงแกนเล็ก ๆ น้อย ๆ เมื่อพิจารณาถึงปริมาณงานที่เพิ่มขึ้นและการชนเล็กน้อยกับขนาดพื้นที่ของ A77 เราจะเห็นว่านักออกแบบ SoC ยังคงแนวโน้ม 1 + 3 + 4 หรือ 2 + 2 + 4 ด้วยแกนขนาดใหญ่หนึ่งหรือสองแกนที่มีแคชขนาดใหญ่และนาฬิกาที่สูงกว่าสำรองโดย A77 2 หรือ 3 คอร์ที่มีขนาดแคชที่เล็กกว่าและนาฬิกาที่ต่ำกว่าเพื่อประหยัดพลังงานและพื้นที่ ท้ายที่สุด Cortex-A77 สะกดสิ่งที่ดีสำหรับชิปสมาร์ทโฟนและตลาดที่กำลังเติบโตสำหรับแล็ปท็อปที่ใช้แขนที่เชื่อมต่ออยู่เสมอ จับตามองการประกาศของซิลิคอนในปลายปีนี้

โดยรวมแล้ว amung Galaxy A70 เป็นโทรศัพท์ที่ยอดเยี่ยมเลยทีเดียวเพราะประสิทธิภาพของกล้องธรรมดา ๆ ที่สามารถเปลี่ยนแปลงได้ในเดือนนี้โดย amung พร้อมที่จะเปิดตัวอุปกรณ์รุ่นอัพเกรด: amung Galaxy A70...

ซัมซุงได้เปิดตัวโทรศัพท์ซีรีย์ใหม่สองรุ่นและในขณะที่คุณสามารถอ่านรายละเอียดสเปคที่น่าเบื่อความพร้อมใช้งานและรายละเอียดอื่น ๆ ได้ที่นี่สิ่งเดียวที่คุณต้องเห็นคือกล้อง GIF หมุนวนของ Galaxy A80...

น่าสนใจ