กลับไปหน้าบทความ

อ่าน 14 นาที

การคำนวณจุดลอยตัวต่อวินาที

การคำนวณจุดลอยตัวต่อวินาที ( FLOPS , flops หรือ flop/s ) เป็นการวัด ประสิทธิภาพ หรือ การคำนวณ ของ คอมพิวเตอร์ ซึ่งมีประโยชน์ในสาขาการคำนวณทางวิทยาศาสตร์ที่ต้องการการคำนวณ...

การคำนวณจุดลอยตัวต่อวินาที

การคำนวณจุดลอยตัวต่อวินาที ( FLOPS , flopsหรือflop/s ) เป็นการวัดประสิทธิภาพหรือการคำนวณของคอมพิวเตอร์ซึ่งมีประโยชน์ในสาขาการคำนวณทางวิทยาศาสตร์ที่ต้องการการคำนวณจุดลอยตัว[ 1 ] [ 2 ]

ในกรณีเช่นนี้ การวัดด้วยจำนวนคำสั่งต่อวินาทีจะมีความแม่นยำ กว่า

เลขคณิตจุดลอยตัว

ตัวคูณสำหรับฟล็อป
ชื่อ หน่วย ค่า
กิโลฟล็อป kFLOPS 10 3
เมกะฟล็อปส์ MFLOPS 10 6
กิกะฟล็อปส์ GFLOPS [ 3 ]10 9
เทรา ฟล็อปส์ ทีเอฟแอลโอพี 10 12
เพต้าฟล็อปส์ ฟล็อปส์ 10 15
เอ็กซาฟล็อปส์ อีเอฟโลปส์ 10 18
เซ็ตต้าฟล็อปส์ ZFLOPS 10 21
yotta FLOPS วายฟล็อปส์ 10 24
รอนน่าล้มเหลว อาร์เอฟโลปส์ 10 27
เควตตาฟลอปส์ คิวฟลอปส์ 10:30 น.

การคำนวณเลขทศนิยมแบบลอยตัว มีความจำเป็นสำหรับ จำนวนจริงขนาดใหญ่มากหรือเล็กมากหรือการคำนวณที่ต้องการช่วงไดนามิกขนาดใหญ่ การแสดงผลเลขทศนิยมแบบลอยตัวคล้ายกับสัญกรณ์วิทยาศาสตร์ ยกเว้นว่าคอมพิวเตอร์ใช้ฐานสอง (โดยมีข้อยกเว้นที่หายาก) แทนที่จะเป็นฐานสิบรูปแบบการเข้ารหัสจะเก็บเครื่องหมายเลขชี้กำลัง (ในฐานสองสำหรับ Cray และVAXฐานสองหรือสิบสำหรับ รูปแบบ เลขทศนิยมแบบลอยตัวของ IEEEและฐาน 16 สำหรับสถาปัตยกรรมเลขทศนิยมแบบลอยตัวของ IBM ) และตัวเลขสำคัญ (ตัวเลขหลังจุดทศนิยม ) แม้ว่าจะมีรูปแบบที่คล้ายกันหลายรูปแบบที่ใช้กันอยู่ แต่รูปแบบที่ใช้กันมากที่สุดคือANSI/IEEE Std. 754-1985มาตรฐานนี้กำหนดรูปแบบสำหรับตัวเลข 32 บิตที่เรียกว่าความแม่นยำเดี่ยวเช่นเดียวกับตัวเลข 64 บิตที่เรียกว่าความแม่นยำคู่และตัวเลขที่ยาวกว่าที่เรียกว่าความแม่นยำแบบขยาย (ใช้สำหรับผลลัพธ์ระดับกลาง) การแสดงผลเลขทศนิยมแบบลอยตัวสามารถรองรับช่วงค่าที่กว้างกว่าเลขทศนิยมแบบคงที่มาก โดยมีความสามารถในการแสดงตัวเลขขนาดเล็กมากและตัวเลขขนาดใหญ่มาก[ 4 ]

ช่วงไดนามิกและความแม่นยำ

การยกกำลังที่มีอยู่ในการคำนวณจุดลอยตัวช่วยให้มั่นใจได้ถึงช่วงไดนามิกที่ใหญ่ขึ้นมาก – ตัวเลขที่ใหญ่ที่สุดและเล็กที่สุดที่สามารถแสดงได้ – ซึ่งมีความสำคัญอย่างยิ่งเมื่อประมวลผลชุดข้อมูลที่ข้อมูลบางส่วนอาจมีช่วงค่าตัวเลขที่กว้างมาก หรือช่วงอาจคาดเดาไม่ได้ ด้วยเหตุนี้ โปรเซสเซอร์จุดลอยตัวจึงเหมาะอย่างยิ่งสำหรับแอปพลิเคชันที่ต้องใช้การคำนวณอย่างหนัก[ 5 ]

ประสิทธิภาพการคำนวณ

FLOPS และMIPSเป็นหน่วยวัดประสิทธิภาพการคำนวณเชิงตัวเลขของคอมพิวเตอร์ การดำเนินการจุดลอยตัวมักใช้ในสาขาต่างๆ เช่น การวิจัยเชิงคำนวณทางวิทยาศาสตร์ รวมถึงการเรียนรู้ของเครื่องอย่างไรก็ตาม ก่อนช่วงปลายทศวรรษ 1980 ฮาร์ดแวร์จุดลอยตัว (สามารถใช้งานเลขคณิต FP ในซอฟต์แวร์บนฮาร์ดแวร์จำนวนเต็มใดๆ ก็ได้) มักเป็นคุณสมบัติเสริม และคอมพิวเตอร์ที่มีคุณสมบัตินี้เรียกว่า "คอมพิวเตอร์วิทยาศาสตร์" หรือมีความสามารถในการ " คำนวณทางวิทยาศาสตร์ " ดังนั้น หน่วย MIPS จึงมีประโยชน์ในการวัดประสิทธิภาพจำนวนเต็มของคอมพิวเตอร์ใดๆ รวมถึงคอมพิวเตอร์ที่ไม่มีความสามารถดังกล่าว และเพื่อพิจารณาความแตกต่างของสถาปัตยกรรม จึงมีการใช้ MOPS (ล้านการดำเนินการต่อวินาที) ที่คล้ายกันตั้งแต่ปี 1970 [ 6 ]เช่นกัน โปรดทราบว่านอกเหนือจากเลขคณิตจำนวนเต็ม (หรือจุดคงที่) แล้ว ตัวอย่างของการดำเนินการจำนวนเต็ม ได้แก่ การเคลื่อนย้ายข้อมูล (A ไป B) หรือการทดสอบค่า (ถ้า A = B แล้ว C) นั่นเป็นเหตุผลที่ MIPS เหมาะสมที่จะใช้เป็นเกณฑ์วัดประสิทธิภาพเมื่อคอมพิวเตอร์ถูกใช้ในการสืบค้นฐานข้อมูล การประมวลผลคำ สเปรดชีต หรือเพื่อเรียกใช้ระบบปฏิบัติการเสมือนหลายระบบ[ 7 ] [ 8 ]ในปี พ.ศ. 2517 David Kuckได้บัญญัติศัพท์ flops และ megaflops เพื่ออธิบายประสิทธิภาพของซูเปอร์คอมพิวเตอร์ในยุคนั้นโดยนับจำนวนการคำนวณจุดลอยตัวที่ทำได้ต่อวินาที[ 9 ]ซึ่งดีกว่าการใช้ MIPS ที่แพร่หลายในการเปรียบเทียบคอมพิวเตอร์ เนื่องจากสถิตินี้มักไม่ค่อยมีผลต่อความสามารถในการคำนวณทางคณิตศาสตร์ของเครื่องในงานทางวิทยาศาสตร์

จำนวนการคำนวณ FLOPS ของซูเปอร์คอมพิวเตอร์ ที่ใหญ่ที่สุด เมื่อเวลาผ่านไป

FLOPS บนระบบ HPC สามารถคำนวณได้โดยใช้สมการนี้: [ 10 ]

สามารถสรุปให้เข้าใจง่ายขึ้นได้โดยใช้กรณีที่พบได้บ่อยที่สุด นั่นคือ คอมพิวเตอร์ที่มีซีพียูเพียง 1 ตัว:

FLOPS สามารถบันทึกได้ในหน่วยวัดความแม่นยำที่แตกต่างกัน ตัวอย่างเช่น รายชื่อซูเปอร์คอมพิวเตอร์ TOP500จัดอันดับคอมพิวเตอร์ตามการดำเนินการ 64 บิต ( รูปแบบจุดลอยตัวความแม่นยำสองเท่า ) ต่อวินาที ซึ่ง ย่อเป็นFP64 [ 11 ]มีหน่วยวัดที่คล้ายกันสำหรับ การดำเนินการ 32 บิต ( FP32 ) และ16 บิต ( FP16 )

จำนวนการคำนวณจุดลอยตัวต่อรอบสัญญาณนาฬิกาสำหรับโปรเซสเซอร์ต่างๆ

การดำเนินการจุดลอยตัวต่อรอบสัญญาณนาฬิกาต่อคอร์[ 12 ]
สถาปัตยกรรมไมโคร สถาปัตยกรรมชุดคำสั่งเอฟพี64 เอฟพี32 เอฟพี16
ซีพียู Intel
อินเทล 80486x87 (80 บิต) ? 0.128 [ 13 ]?
x87 (80 บิต) ? 0.5 [ 13 ]?
x87 (80 บิต) ? 1 [ 14 ]?
อินเทลพี6 เพนเทียม IIISSE (64 บิต) ? 2 [ 14 ]?
Intel NetBurst Pentium 4 (Willamette, Northwood) SSE2 (64 บิต) 2 4 ?
อินเทลพี6 เพนเทียมเอ็มSSE2 (64 บิต) 1 2 ?
SSE3 (64 บิต) 2 4 ?
48?
อินเทลอะตอม ( บอนเนลล์ , ซอลท์เวลล์ , ซิลเวอร์มอนต์และโกลด์มอนต์ )SSE3 (128 บิต) 24?
อินเทลแซนดี้บริดจ์ ( แซนดี้บริดจ์ , ไอวี่บริดจ์ )AVX (256 บิต) 8160
AVX2และFMA (256 บิต) 16320
Intel Xeon Phi ( Knights Corner )IMCI (512 บิต) 16320
AVX-512และFMA (512 บิต) 32640
ซีพียู AMD
เอดีเอ็มบ็อบแคทAMD64 (64 บิต)240
AVX (128 บิต) 480
เอดีเอ็มเค10SSE4/4a (128 บิต)480
รถดันดิน AMD [ 15 ] ( เครื่องตอกเสาเข็ม , รถบดถนน , รถขุด )
  • AVX (128 บิต) (Bulldozer, Steamroller)
  • AVX2 (128 บิต) (รถขุด)
  • FMA3 (รถดันดิน) [ 16 ]
  • FMA3/4 (เครื่องตอกเสาเข็ม, รถขุด)
480
  • AMD Zen (ซีรี่ส์ Ryzen 1000, ซีรี่ส์ Threadripper 1000, Epyc Naples )
  • AMD Zen+ [ 15 ] [ 17 ] [ 18 ] [ 19 ] (ซีรี่ส์ Ryzen 2000, ซีรี่ส์ Threadripper 2000)
AVX2และFMA (การถอดรหัส 128 บิต, 256 บิต) [ 20 ]8160
  • AMD Zen 2 [ 21 ] (ซีรี่ส์ Ryzen 3000, ซีรี่ส์ Threadripper 3000, Epyc Rome )
  • AMD Zen 3 (ซีรีส์ Ryzen 5000, Epyc Milan )
AVX2และFMA (256 บิต) 16320
AVX-512และFMA (256 บิต) 16320
  • AMD Zen 5 [ 22 ] (ซีรี่ส์ Ryzen 9000, ซีรี่ส์ Threadripper 9000, Epyc Turin )
AVX-512และFMA (512 บิต) 32640
ซีพียู ARM
อาร์เอ็ม คอร์เท็กซ์ A7, A9, A15อาร์เอ็มวี7180
อาร์เอ็ม คอร์เท็กซ์ A32, A35อาร์เอ็มวี8280
แขน Cortex-A53 , A55 , A57 , [ 15 ] A72 , A73อาร์เอ็มวี88160
แขน Cortex-A75 , A76 , A77 , A78อาร์เอ็มวี881632
อาร์เอ็ม คอร์เท็กซ์-เอ็กซ์1อาร์เอ็มวี8163264
ควอลคอมม์ไครต์อาร์เอ็มวี8180
Qualcomm Kryo (1xx - 3xx)อาร์เอ็มวี8280
Qualcomm Kryo (4xx - 5xx)อาร์เอ็มวี88160
ซัมซุงเอ็กไซโนส M1 และ M2อาร์เอ็มวี8280
Samsung Exynos M3 และ M4อาร์เอ็มวี83120
ซีพียูอื่นๆ
IBM PowerPC A2 (Blue Gene/Q)พาวเวอร์ อิซา เวอร์ชัน 2.0688 (ในรูปแบบ FP64)0
ฮิตาชิ SH-4 [ 23 ] [ 24 ]เอช-4170
การ์ดจอ Nvidia
Nvidia Curie ( ซีรี่ส์ GeForce 6และซีรี่ส์ GeForce 7 ) พีทีเอ็กซ์?8?
Nvidia Tesla 2.0 (GeForce GTX 260–295) พีทีเอ็กซ์?2?
เอ็นดีโอเฟอร์มิ

(เฉพาะ GeForce GTX 465–480, 560 Ti, 570–590 เท่านั้น)

พีทีเอ็กซ์1/4 (ล็อกโดยไดรเวอร์,1 ในฮาร์ดแวร์ )20
เอ็นดีโอเฟอร์มิ

(เฉพาะ Quadro 600–2000)

พีทีเอ็กซ์1/820
เอ็นดีโอเฟอร์มิ

(เฉพาะ Quadro 4000–7000, Tesla)

พีทีเอ็กซ์120
โนวิโดเคปเลอร์

(GeForce (ยกเว้น Titan และ Titan Black), Quadro (ยกเว้น K6000), Tesla K10)

พีทีเอ็กซ์1/12 (สำหรับ GK110 :ล็อกโดยไดรเวอร์ , 2/3ในฮาร์ดแวร์)20
โนวิโดเคปเลอร์

(GeForce GTX Titan และ Titan Black, Quadro K6000, Tesla (ยกเว้น K10))

พีทีเอ็กซ์2320
พีทีเอ็กซ์1/1621/32
Nvidia Pascal (เฉพาะ Quadro GP100 และ Tesla P100)พีทีเอ็กซ์124
Nvidia Volta [ 25 ]พีทีเอ็กซ์12 ( FP32 ) + 2 ( INT32 )16
Nvidia Turing (เฉพาะ GeForce 16XX )พีทีเอ็กซ์1/162 (FP32) + 2 (INT32)4
Nvidia Turing (ยกเว้น GeForce 16XX )พีทีเอ็กซ์1/162 (FP32) + 2 (INT32)16
Nvidia Ampere [ 26 ] [ 27 ] (เฉพาะ Tesla A100/A30)พีทีเอ็กซ์22 (FP32) + 2 (INT32)32
พีทีเอ็กซ์1/322 (FP32) + 0 (INT32) หรือ1 (FP32) + 1 (INT32)8
โนวิโดฮอปเปอร์พีทีเอ็กซ์22 (FP32) + 1 (INT32)32
การ์ดจอ AMD
AMD TeraScale 1 ( Radeon HD 4000 ซีรีส์ ) เทราสเกล 10.42?
AMD TeraScale 2 ( Radeon HD 5000 ซีรี่ส์ ) เทราสเกล 212?
AMD TeraScale 3 ( Radeon HD 6000 ซีรี่ส์ ) เทราสเกล 314?
AMD GCN (เฉพาะ Radeon Pro W 8100–9100) จีซีเอ็น12?
AMD GCN (ยกเว้น Radeon Pro W 8100–9100 และ Vega 10–20) จีซีเอ็น1/824
AMD GCN Vega 10จีซีเอ็น1/824
AMD GCN Vega 20 (เฉพาะ Radeon VII)จีซีเอ็น1/2 (ล็อกโดยไดรเวอร์,1 ในฮาร์ดแวร์ )24
AMD GCN Vega 20 (เฉพาะ Radeon Instinct MI50 / MI60 และ Radeon Pro VII) จีซีเอ็น124
อาร์ดีเอ็นเอ1/824
เอดีเอ็ม อาร์ดีเอ็นเอ3อาร์ดีเอ็นเอ1/8 ?48?
เอ ดีเอ็ ม ซี ดีเอ็นเอดีเอ็นเอ14 (เทนเซอร์) [ 30 ]16
AMD CDNA 2ซีดีเอ็นเอ 24 (เทนเซอร์)4 (เทนเซอร์)16
หน่วยประมวลผลกราฟิก Intel
Intel Xe-LP (ไอริส Xe MAX) [ 31 ]ซี 1/2 ?24
อินเทล Xe-HPG (อาร์ค อัลเคมิสต์) [ 31 ]ซี0216
Intel Xe-HPC (ปอนเต เวคคิโอ) [ 32 ]ซี2232
อินเทล Xe2 (อาร์ค แบทเทิลเมจ)ซีอี21/8216
หน่วยประมวลผลกราฟิก Qualcomm
Qualcomm Adreno 5x0 อะดรีโน 5xx124
Qualcomm Adreno 6x0 อะดรีโน 6xx124
กราฟคอร์
Graphcore Colossus GC2 [ 33 ] [ 34 ]?01664
  • Graphcore Colossus GC200 Mk2 [ 35 ]
  • กราฟคอร์ โบว์-2000 [ 36 ]
?032128
ซูเปอร์คอมพิวเตอร์
ENIACที่ความถี่ 100 kHz ในปี 1945 0.00385 [ 37 ] (~2.6 × 10 −3  FLOPS/ W ) [ 38 ]
โปรเซสเซอร์ 48 บิต @ 208 kHzในมาตรฐาน CDC 1604ในปี 1960
โปรเซสเซอร์ 60 บิต ความเร็ว 10 เมกะเฮิร์ตซ์ ในCDC 6600ในปี 1964 0.3 (FP60)
โปรเซสเซอร์ 60 บิต ความเร็ว 10 เมกะเฮิร์ตซ์ ในCDC 7600ในปี 1967 1.0 (FP60)
Cray-1ที่ความเร็ว 80 MHz ในปี 1976 2 (700 ฟลอป/วัตต์)
CDC Cyber ​​205 ที่ความถี่ 50 MHz ในปี 1981

คอมไพเลอร์ FORTRAN (ANSI 77 พร้อมส่วนขยายเวกเตอร์)

8 16
เครื่องประมวลผลสัญญาณ Transputer IMS T800-20 ที่ความถี่ 20 MHz ในปี 1987 0.08 [ 39 ]
Parallella E16 @ 1,000 MHz ในปี 2555 2 [ 40 ] (5.0 GFLOPS/W) [ 41 ]
Parallella E64 @ 800 MHz ในปี 2555 2 [ 42 ] (50.0 GFLOPS/W) [ 41 ]
สถาปัตยกรรมไมโคร สถาปัตยกรรมชุดคำสั่งเอฟพี64 เอฟพี32 เอฟพี16

บันทึกผลการปฏิบัติงาน

บันทึกคอมพิวเตอร์เครื่องเดียว

NEC SX-2ซึ่งเป็นซูเปอร์คอมพิวเตอร์ที่พัฒนาโดยNECในปี 1983 สามารถทำประสิทธิภาพระดับกิกะฟลอปส์ (GFLOPS) ได้ถึง 1.3 พันล้านฟลอปส์[ 43 ]

ในเดือนมิถุนายน พ.ศ. 2540 ASCI RedของIntelเป็นคอมพิวเตอร์เครื่องแรกของโลกที่สามารถทำความเร็วได้ถึง 1 teraFLOPS และสูงกว่านั้น Bill Camp ผู้อำนวยการ Sandia กล่าวว่า ASCI Red มีความน่าเชื่อถือสูงสุดในบรรดาซูเปอร์คอมพิวเตอร์ที่เคยสร้างมา และ "ถือเป็นจุดสูงสุดของซูเปอร์คอมพิวเตอร์ในด้านอายุการใช้งาน ราคา และประสิทธิภาพ" [ 44 ]

ซูเปอร์คอมพิวเตอร์ SX-9ของNEC เป็น โปรเซสเซอร์เวกเตอร์เครื่องแรกของโลกที่มีประสิทธิภาพเกิน 100 กิกะฟลอปส์ต่อคอร์เดี่ยว

ในเดือนมิถุนายน ปี 2006 สถาบันวิจัยRIKEN ของญี่ปุ่นได้ประกาศเปิดตัวคอมพิวเตอร์รุ่นใหม่ ชื่อMDGRAPE-3คอมพิวเตอร์รุ่นนี้มีประสิทธิภาพสูงสุดถึง 1 เพตาฟลอปส์ ซึ่งเร็วกว่า Blue Gene/L เกือบสองเท่า แต่ MDGRAPE-3 ไม่ใช่คอมพิวเตอร์อเนกประสงค์ จึงไม่ปรากฏอยู่ใน รายชื่อ Top500.org เนื่องจากมี หน่วยประมวลผลเฉพาะทางสำหรับการจำลองพลศาสตร์โมเลกุล

ในปี 2550 บริษัท Intel Corporation ได้เปิดตัวชิป POLARIS แบบมัลติคอร์รุ่น ทดลองซึ่งสามารถทำประสิทธิภาพได้ 1 teraFLOPS ที่ความถี่ 3.13 GHz ชิป 80 คอร์นี้สามารถเพิ่มประสิทธิภาพได้ถึง 2 teraFLOPS ที่ความถี่ 6.26 GHz แม้ว่าการระบายความร้อนที่ความถี่นี้จะเกิน 190 วัตต์ก็ตาม[ 45 ]

ในเดือนมิถุนายน พ.ศ. 2550 Top500.org รายงานว่าคอมพิวเตอร์ที่เร็วที่สุดในโลกคือ ซูเปอร์คอมพิวเตอร์ IBM Blue Gene/Lซึ่งวัดได้สูงสุด 596 teraFLOPS [ 46 ] Cray XT4อยู่ในอันดับที่สองด้วย 101.7 teraFLOPS

เมื่อวันที่ 26 มิถุนายน พ.ศ. 2550 IBMได้ประกาศเปิดตัวซูเปอร์คอมพิวเตอร์รุ่นที่สอง ซึ่งมีชื่อว่า Blue Gene/P และได้รับการออกแบบให้ทำงานอย่างต่อเนื่องด้วยความเร็วเกิน 1 เพตาฟลอปส์ ซึ่งเร็วกว่า Blue Gene/L เมื่อกำหนดค่าให้เป็นเช่นนั้น จะสามารถทำความเร็วได้เกิน 3 เพตาฟลอปส์[ 47 ]

เมื่อวันที่ 25 ตุลาคม พ.ศ. 2550 บริษัท NEC Corporation ของญี่ปุ่นได้ออกข่าวประชาสัมพันธ์ประกาศเปิดตัวรุ่น SX -9 [ 48 ]โดยอ้างว่าเป็นซูเปอร์คอมพิวเตอร์เวกเตอร์ที่เร็วที่สุดในโลกSX-9มี CPU ตัวแรกที่สามารถประมวลผลเวกเตอร์ได้สูงสุด 102.4 กิกะฟลอปส์ต่อคอร์เดียว

เมื่อ วันที่ 4 กุมภาพันธ์ พ.ศ. 2551 NSFและมหาวิทยาลัยเท็กซัสที่ออสตินได้เปิดการวิจัยเต็มรูปแบบบน ซูเปอร์คอมพิวเตอร์ AMD Sun ที่ชื่อ Ranger [ 49 ] ซึ่งเป็น ระบบซูเปอร์คอมพิวเตอร์ที่ทรงพลังที่สุดในโลกสำหรับการวิจัยวิทยาศาสตร์แบบเปิด ซึ่งทำงานด้วยความเร็วคงที่ 0.5 เพตาฟลอปส์

เมื่อวันที่ 25 พฤษภาคม พ.ศ. 2551 ซูเปอร์คอมพิวเตอร์อเมริกันที่สร้างโดยIBMชื่อ ' Roadrunner ' บรรลุเป้าหมายการคำนวณที่ 1 petaFLOPS โดยติดอันดับ 1 ใน รายชื่อ TOP500ของซูเปอร์คอมพิวเตอร์ที่ทรงพลังที่สุดประจำเดือนมิถุนายน พ.ศ. 2551 และพ.ย. พ.ศ. 2551 (ไม่รวมคอมพิวเตอร์แบบกริด ) [ 50 ] [ 51 ] คอมพิวเตอร์เครื่องนี้ตั้งอยู่ที่ห้องปฏิบัติการแห่งชาติลอสอะลาโมสในนิวเม็กซิโก ชื่อของคอมพิวเตอร์นี้มาจาก นกประจำรัฐนิวเม็กซิโกคือ นก โรดรันเนอร์ใหญ่ ( Geococcyx californianus ) [ 52 ]

ในเดือนมิถุนายน ปี 2008 AMD ได้เปิดตัวการ์ดจอ ATI Radeon HD 4800 ซีรีส์ ซึ่งมีรายงานว่าเป็น GPU รุ่นแรกที่สามารถทำความเร็วได้ถึง 1 เทราฟลอปส์ ต่อมาในวันที่ 12 สิงหาคม ปี 2008 AMD ได้เปิดตัวการ์ดจอ ATI Radeon HD 4870X2 ซึ่งประกอบด้วย GPU Radeon R770 สองตัว รวมกันแล้วทำความเร็วได้ถึง 2.4 เทราฟลอปส์

ในเดือนพฤศจิกายนปี 2008 การอัปเกรดซูเปอร์คอมพิวเตอร์ Cray Jaguarที่ห้องปฏิบัติการแห่งชาติ Oak Ridge (ORNL) สังกัดกระทรวงพลังงาน (DOE) ทำให้กำลังการประมวลผลของระบบเพิ่มขึ้นสูงสุดถึง 1.64 เพตาฟลอปส์ ทำให้ Jaguar เป็นระบบเพตาฟลอปส์ระบบแรกของโลกที่อุทิศให้กับการวิจัยแบบเปิดในช่วงต้นปี 2009 ซูเปอร์คอมพิวเตอร์นี้ได้รับการตั้งชื่อตามสัตว์ในตำนานว่าKraken Kraken ได้รับการประกาศให้เป็นซูเปอร์คอมพิวเตอร์ที่บริหารจัดการโดยมหาวิทยาลัยที่เร็วที่สุดในโลก และเร็วที่สุดเป็นอันดับที่ 6 โดยรวมในรายชื่อ TOP500 ปี 2009 ในปี 2010 Kraken ได้รับการอัปเกรดและสามารถทำงานได้เร็วขึ้นและมีประสิทธิภาพมากขึ้น

ในปี 2552 Cray Jaguar ทำงานได้ 1.75 เพตาฟลอปส์ เอาชนะ IBM Roadrunner ขึ้นเป็นอันดับหนึ่งในรายชื่อTOP500 [ 53 ]

ในเดือนตุลาคม พ.ศ. 2553 จีนได้เปิดตัวTianhe-1ซึ่งเป็นซูเปอร์คอมพิวเตอร์ที่ทำงานด้วยอัตราการประมวลผลสูงสุด 2.5 เพตาฟลอปส์[ 54 ] [ 55 ]

ณ ปี 2010 โปรเซสเซอร์ พีซีที่เร็วที่สุด ทำได้ถึง 109 กิกะฟลอปส์ (Intel Core i7 980 XE ) [ 56 ]ในการคำนวณความแม่นยำสองเท่าGPUมีประสิทธิภาพมากกว่ามาก ตัวอย่างเช่น โปรเซสเซอร์ประมวลผล GPU Nvidia Tesla C2050 ทำงานได้ประมาณ 515 กิกะฟลอปส์[ 57 ]ในการคำนวณความแม่นยำสองเท่า และ AMD FireStream 9270 ทำได้สูงสุดถึง 240 กิกะฟลอปส์[ 58 ]

ในเดือนพฤศจิกายน พ.ศ. 2554 มีการประกาศว่าญี่ปุ่นประสบความสำเร็จในการประมวลผล 10.51 เพตาฟลอปส์ด้วยคอมพิวเตอร์K [ 59 ]ประกอบด้วยโปรเซสเซอร์SPARC64 VIIIfx จำนวน 88,128 ตัว ในแร็ค 864 แร็ค โดยมีประสิทธิภาพตามทฤษฎีอยู่ที่ 11.28 เพตาฟลอปส์ ชื่อนี้มาจากคำภาษาญี่ปุ่นว่า " kei " ซึ่งหมายถึง 10 ควอดริลเลียน [ 60 ] ซึ่งสอดคล้องกับความเร็วเป้าหมายที่ 10 เพตาฟลอปส์

เมื่อวันที่ 15 พฤศจิกายน 2011 Intel ได้สาธิตโปรเซสเซอร์ x86 ตัวเดียวที่มีชื่อรหัสว่า "Knights Corner" ซึ่งสามารถรักษาประสิทธิภาพการทำงานได้มากกว่า teraFLOPS ใน การดำเนินการ DGEMM ที่หลากหลาย Intel เน้นย้ำในระหว่างการสาธิตว่านี่คือประสิทธิภาพการทำงานที่ teraFLOPS อย่างต่อเนื่อง (ไม่ใช่ "teraFLOPS ดิบ" ที่ผู้อื่นใช้เพื่อให้ได้ตัวเลขที่สูงขึ้นแต่มีความหมายน้อยกว่า) และเป็นโปรเซสเซอร์อเนกประสงค์ตัวแรกที่สามารถรักษาประสิทธิภาพการทำงานได้ถึง teraFLOPS [ 61 ] [ 62 ]

เมื่อวันที่ 18 มิถุนายน พ.ศ. 2555 ระบบซูเปอร์คอมพิวเตอร์ Sequoia ของ IBMซึ่งตั้งอยู่ที่ห้องปฏิบัติการแห่งชาติ Lawrence Livermore ของสหรัฐอเมริกา (LLNL) สามารถทำความเร็วได้ถึง 16 petaFLOPS สร้างสถิติโลกและครองอันดับหนึ่งในรายการ TOP500 ล่าสุด[ 63 ]

เมื่อวันที่ 12 พฤศจิกายน 2012 รายชื่อ TOP500 รับรอง ว่า Titanเป็นซูเปอร์คอมพิวเตอร์ที่เร็วที่สุดในโลกตามเกณฑ์มาตรฐาน LINPACK ที่ 17.59 petaFLOPS [ 64 ] [ 65 ]ได้รับการพัฒนาโดย Cray Inc. ที่ห้องปฏิบัติการแห่งชาติ Oak Ridgeและรวมโปรเซสเซอร์ AMD Opteron เข้ากับเทคโนโลยีหน่วยประมวลผลกราฟิก (GPU) NVIDIA Tesla "Kepler" [ 66 ] [ 67 ]

เมื่อวันที่ 10 มิถุนายน พ.ศ. 2556 Tianhe-2ของจีนได้รับการจัดอันดับให้เป็นเครื่องที่เร็วที่สุดในโลกด้วยความเร็ว 33.86 เพตาฟลอปส์[ 68 ]

เมื่อวันที่ 20 มิถุนายน 2559 Sunway TaihuLight ของจีน ได้รับการจัดอันดับให้เป็นเครื่องประมวลผลที่เร็วที่สุดในโลกด้วยประสิทธิภาพ 93 petaFLOPS ในการทดสอบ LINPACK (จากประสิทธิภาพสูงสุด 125 petaFLOPS) ระบบนี้ติดตั้งอยู่ที่ศูนย์ซูเปอร์คอมพิวเตอร์แห่งชาติในเมืองอู๋ซี และมีประสิทธิภาพมากกว่าระบบที่มีประสิทธิภาพสูงสุด 5 อันดับถัดไปในรายการ TOP500 ในขณะนั้นรวมกัน[ 69 ]

ในเดือนมิถุนายน พ.ศ. 2562 Summitซึ่งเป็นซูเปอร์คอมพิวเตอร์ที่สร้างโดย IBM และปัจจุบันทำงานอยู่ที่ห้องปฏิบัติการแห่งชาติ Oak Ridge (ORNL) ของกระทรวงพลังงาน (DOE) ได้รับตำแหน่งอันดับหนึ่งด้วยประสิทธิภาพ 148.6 petaFLOPS บน High Performance Linpack (HPL) ซึ่งเป็นเกณฑ์มาตรฐานที่ใช้ในการจัดอันดับ TOP500 Summit มีโหนด 4,356 โหนด แต่ละโหนดติดตั้งซีพียู Power9 22 คอร์สองตัว และ GPU NVIDIA Tesla V100 หกตัว[ 70 ]

ในเดือนมิถุนายน พ.ศ. 2565 Frontierของสหรัฐอเมริกาเป็นซูเปอร์คอมพิวเตอร์ที่ทรงพลังที่สุดใน TOP500 โดยทำคะแนนได้ถึง 1,102 เพตาฟลอป (1,102 เอ็กซาฟลอป) ในเกณฑ์มาตรฐาน LINPACK [ 71 ]

ในเดือนพฤศจิกายน พ.ศ. 2567 ซูเปอร์ คอมพิวเตอร์El Capitan ระดับเอ็กซาสเกล ของสหรัฐอเมริกาซึ่งตั้งอยู่ที่ห้องปฏิบัติการแห่งชาติลอว์เรนซ์ลิเวอร์มอร์ใน เมือง ลิเวอร์มอร์ได้แซงหน้า Frontier ขึ้นเป็นซูเปอร์คอมพิวเตอร์ที่เร็วที่สุดในโลกในการจัดอันดับTop500 ครั้งที่ 64 (พ.ย. พ.ศ. 2567)และยังคงอยู่ในรายชื่อในเดือนมิถุนายน พ.ศ. 2568 [ 72 ]

บันทึกการประมวลผลแบบกระจาย

การประมวลผลแบบกระจายใช้การเชื่อมต่ออินเทอร์เน็ตเพื่อเชื่อมโยงคอมพิวเตอร์ส่วนบุคคล และบางครั้งก็ใช้ซูเปอร์คอมพิวเตอร์ เพื่อให้ได้ประสิทธิภาพการประมวลผล (FLOPS) ที่สูงขึ้น:

  • ณ เดือนตุลาคม พ.ศ. 2555 กลุ่มนักวิทยาศาสตร์คอมพิวเตอร์และนักดาราศาสตร์ได้ทำการจำลองการก่อตัวของดาวฤกษ์บนโครงข่ายเวิร์กสเตชันแบบเฮเทอโรจีนัสจำนวน 5 เครื่องที่กระจายอยู่ทั่วประเทศเนเธอร์แลนด์ ซึ่งหลายเครื่องมี GPU [ 73 ] การคำนวณดำเนินการโดยการรวมAMUSE [ 74 ]เข้ากับIbis [ 75 ]
  • ณ เดือนเมษายน พ.ศ. 2556 การจำลอง CosmoGrid [ 76 ]ซึ่งเป็นการจำลองสสารมืดแบบจักรวาลวิทยาที่มีอนุภาค 8589934592 อนุภาค ได้ถูกดำเนินการพร้อมกันบนซูเปอร์คอมพิวเตอร์ 3 เครื่อง เพื่อตอบคำถามเกี่ยวกับปัญหาดาวเทียมที่หายไปของกาแล็กซี โดยใช้ซูเปอร์คอมพิวเตอร์ในเมืองเอสปู (ฟินแลนด์) เอดินบะระ (สหราชอาณาจักร) และอัมสเตอร์ดัม (เนเธอร์แลนด์) ซึ่งมีคอร์ประมวลผล 19644 คอร์ ทำให้ได้ประสิทธิภาพสูงสุด 80% ของฮาร์ดแวร์
  • ณ เดือนเมษายน พ.ศ. 2563 เครือข่าย Folding@homeมีกำลังการประมวลผลรวมมากกว่า 2.3 exaFLOPS [ 77 ] [ 78 ] [ 79 ] [ 80 ]นับเป็นเครือข่ายคอมพิวเตอร์แบบกระจายที่มีประสิทธิภาพสูงสุด และเป็นเครือข่ายแรกที่ทำลายสถิติ 1 exaFLOPS ของกำลังการประมวลผลรวม ประสิทธิภาพในระดับนี้เกิดขึ้นได้จากความพยายามร่วมกันของหน่วยประมวลผลกราฟิก(GPU)และหน่วย ประมวลผลกลาง (CPU) จำนวนมาก [ 81 ]
  • ณ เดือนธันวาคม 2020 เครือข่าย BOINC ทั้งหมด มีประสิทธิภาพเฉลี่ยประมาณ 31 เพตาฟลอปส์[ 82 ]
  • ณ เดือนมิถุนายน พ.ศ. 2561 SETI@homeซึ่งใช้ แพลตฟอร์มซอฟต์แวร์ BOINCมีประสิทธิภาพเฉลี่ย 896 teraFLOPS [ 83 ]
  • ณ เดือนมิถุนายน พ.ศ. 2561 โครงการEinstein@Home ซึ่งใช้เครือข่าย BOINCกำลังประมวลผลที่ 3 เพตาฟลอปส์[ 84 ]
  • ณ เดือนมิถุนายน พ.ศ. 2561 MilkyWay@homeซึ่งใช้ โครงสร้างพื้นฐาน BOINCสามารถประมวลผลได้ 847 teraFLOPS [ 85 ]
  • ณ เดือนมิถุนายน พ.ศ. 2563 GIMPSซึ่งค้นหาจำนวนเฉพาะเมอร์เซนน์สามารถรองรับได้ 1,354 เทราฟลอปส์[ 86 ]

ต้นทุนการคำนวณ

ต้นทุนฮาร์ดแวร์

วันที่ ราคาโดยประมาณ (ดอลลาร์สหรัฐ) ต่อ GFLOPS แพลตฟอร์มที่ให้ต้นทุนต่อ GFLOPS ต่ำที่สุด ความคิดเห็น
ไม่ได้ปรับแต่ง 2025 [ 87 ]
พ.ศ. 2488 1.265 ดอลลาร์สหรัฐ22.623 ตัน ENIAC : 487,000 ดอลลาร์สหรัฐในปี 1945 และ 8,709,000 ดอลลาร์สหรัฐในปี 2023 487,000 ดอลลาร์สหรัฐ /0.000 000 385  GFLOPSคอมพิวเตอร์ดิจิทัลอิเล็กทรอนิกส์ รุ่นแรก ( ใช้ หลอดสุญญากาศ )
1961 18.672 ดอลลาร์สหรัฐ201.171 พันล้านเหรียญสหรัฐ ในขณะนั้น การติดตั้งระบบ IBM 7030 Stretchขั้นพื้นฐานมีราคาสูงถึง7.78 ล้านดอลลาร์สหรัฐต่อเครื่อง หน่วย ประมวล ผล IBM 7030 Stretchทำการคูณเลขทศนิยมหนึ่งครั้งทุกๆ2.4  ไมโครวินาที [ 88 ] คอมพิวเตอร์ รุ่น ที่สอง (แบบทรานซิสเตอร์ แยกส่วน)
พ.ศ. 2507 2.3 พันล้านดอลลาร์สหรัฐ 23.876 พันล้านดอลลาร์สหรัฐ ราคา เริ่มต้นของรุ่นพื้นฐานCDC 6600 : 6,891,300 ดอลลาร์สหรัฐ CDC 6600 ถือเป็นซูเปอร์คอมพิวเตอร์เครื่องแรก ที่ประสบความสำเร็จในเชิงพาณิชย์
1984 18.75 ล้านเหรียญสหรัฐ58.106 ล้านเหรียญสหรัฐเครย์ X-MP /48 15,000,000 ดอลลาร์สหรัฐ / 0.8 GFLOPS คอมพิวเตอร์รุ่นที่สาม (ใช้ชิป ประมวลผลแบบรวม )
พ.ศ. 2540 30,000 เหรียญสหรัฐ 60,168 เหรียญสหรัฐ คลัสเตอร์ Beowulf 16 โปรเซสเซอร์ 2 ชุดพร้อมไมโครโปรเซสเซอร์Pentium Pro [ 89 ]
เมษายน พ.ศ. 25431,000 เหรียญสหรัฐ 1,899 เหรียญสหรัฐ กลุ่มบันยิป บีโอวูล์ฟบุนยิปเป็นสัตว์เลี้ยงลูกด้วยนมชนิดแรกเทคโนโลยีการคำนวณ US$ 1/ MFLOPSได้รับรางวัล Gordon Bell Prize ในปี 2000
พฤษภาคม 2543640 เหรียญสหรัฐ 1,197 เหรียญสหรัฐ KLAT2KLAT2 เป็นเทคโนโลยีการประมวลผลแรกที่สามารถรองรับการใช้งานขนาดใหญ่ได้ ในขณะที่ยังคงมีประสิทธิภาพต่ำ1 ดอลลาร์สหรัฐ / MFLOPS [ 90 ]
สิงหาคม พ.ศ. 254683.86 เหรียญสหรัฐ 147 ดอลลาร์ คาซีโอ KASY0 เป็นเทคโนโลยีการประมวลผลแบบแรกที่มีต้นทุนต่ำกว่า100 ดอลลาร์สหรัฐ ต่อ GFLOPS KASY0 สามารถทำ GFLOPS ได้ 471 GFLOPS บน HPL 32 บิต ด้วยต้นทุนที่ต่ำกว่า 39,500 ดอลลาร์สหรัฐ ทำให้เป็นซูเปอร์คอมพิวเตอร์เครื่องแรกที่ทำต้นทุนต่ำกว่า 100 ดอลลาร์สหรัฐต่อ GFLOPS [ 91 ]
สิงหาคม 255048.31 เหรียญสหรัฐ 75.01 เหรียญสหรัฐ ไมโครวูล์ฟ ณ เดือนสิงหาคม พ.ศ. 2550 ข้อมูลนี้คลัสเตอร์ Beowulf "ส่วนตัว" ขนาด 26 GFLOPSสามารถสร้างได้ในราคา 1256 ดอลลาร์[ 92 ]
มีนาคม 25541.80 เหรียญสหรัฐ 2.58 ดอลลาร์ HPU4Science คลัสเตอร์ราคา 30,000 ดอลลาร์นี้สร้างขึ้นโดยใช้ฮาร์ดแวร์ระดับ "เกมเมอร์" ที่มีจำหน่ายทั่วไปเท่านั้น[ 93 ]
สิงหาคม 255575 เซ็นต์ 1.05 ดอลลาร์ ระบบ Quad AMD Radeon 7970คอมพิวเตอร์เดสก์ท็อป AMD Radeon 7970แบบควอดคอร์ ให้ประสิทธิภาพการประมวลผลแบบความแม่นยำเดี่ยว 16 TFLOPS และแบบความแม่นยำคู่ 4 TFLOPS ต้นทุนระบบทั้งหมดอยู่ที่ 3,000 ดอลลาร์ สร้างขึ้นโดยใช้ฮาร์ดแวร์ที่มีจำหน่ายทั่วไปเท่านั้น[ 94 ]
มิถุนายน 255621.68 เซ็นต์ 29.96 เซ็นต์ โซนี่ เพลย์สเตชั่น 4เครื่องเล่นเกม Sony PlayStation 4มีประสิทธิภาพสูงสุดอยู่ที่...1.84  TFLOPSในราคา 399 ดอลลาร์[ 95 ]
พฤศจิกายน 255616.11¢ 22.27 เซนต์ ระบบ AMD Sempron 145และGeForce GTX 760ระบบที่สร้างขึ้นโดยใช้ชิ้นส่วนที่มีจำหน่ายทั่วไป โดยใช้ AMD Sempron 145 หนึ่งตัวและNvidia GeForce GTX 760 สามตัว จะมีประสิทธิภาพโดยรวม6.771 TFLOPSสำหรับต้นทุนรวม1,090.66 ดอลลาร์สหรัฐ[ 96 ]
ธันวาคม 255612.41 เซนต์ 17.15¢ ระบบ Pentium G550และRadeon R9 290สร้างขึ้นโดยใช้ชิ้นส่วนที่มีจำหน่ายทั่วไปIntel Pentium G550และ AMD Radeon R9 290มีประสิทธิภาพสูงสุดที่...4.848 TFLOPSรวมเป็นเงิน681.84 ดอลลาร์สหรัฐ[ 97 ]
มกราคม 25587.85¢ 10.66 เซ็นต์ ระบบ Celeron G1830และRadeon R9 295X2สร้างขึ้นโดยใช้ชิ้นส่วนที่มีจำหน่ายทั่วไป Intel Celeron G1830และ AMD Radeon R9 295X2ให้ประสิทธิภาพสูงสุดที่มากกว่า11.5 TFLOPSในราคารวมทั้งสิ้น902.57 ดอลลาร์สหรัฐ[ 98 ] [ 99 ]
มิถุนายน 25607.88 เซ็นต์ ระบบ AMD Ryzen 7 1700และAMD Radeon Vega Frontier Editionสร้างขึ้นโดยใช้ชิ้นส่วนที่มีจำหน่ายทั่วไป CPU AMD Ryzen 7 1700 เมื่อรวมกับกราฟิกการ์ด AMD Radeon Vega FE ในโหมด CrossFire จะได้ประสิทธิภาพสูงสุดมากกว่า50 TFLOPSในราคาต่ำกว่า3,000 ดอลลาร์สหรัฐสำหรับระบบที่สมบูรณ์[ 100 ]
ตุลาคม 2560 2.73 เซ็นต์ 3.59 เซนต์ ระบบ Intel Celeron G3930และAMD RX Vega 64สร้างขึ้นโดยใช้ชิ้นส่วนที่มีจำหน่ายทั่วไป การ์ดกราฟิก AMD RX Vega 64 จำนวน 3 ตัว ให้ประสิทธิภาพการประมวลผลแบบ half precision มากกว่า 75 TFLOPS (38 TFLOPS SP หรือ 2.6 TFLOPS DP เมื่อรวมกับ CPU) ในราคาประมาณ 2,050 ดอลลาร์สหรัฐสำหรับระบบที่สมบูรณ์[ 101 ]
พฤศจิกายน 2020 3.14 เซนต์ 3.91¢ ระบบ AMD Ryzen 3600และNVIDIA RTX 3080 จำนวน 3 ตัวAMD Ryzen 3600 @ 484 GFLOPS & $199.99

การ์ดจอ NVIDIA RTX 3080 จำนวน 3 ตัว ประสิทธิภาพ 29,770 GFLOPS ต่อตัว ราคา 699.99 ดอลลาร์สหรัฐ

ประสิทธิภาพการประมวลผลรวมของระบบ (GFLOPS) = 89,794 / TFLOPS = 89.794

ต้นทุนระบบโดยรวมรวมถึงชิ้นส่วนที่มีต้นทุนต่ำแต่สมจริง เมื่อเทียบกับตัวอย่างอื่น = 2839 ดอลลาร์[ 102 ]

ดอลลาร์สหรัฐ /GFLOP = 0.0314

พฤศจิกายน 2020 3.88 เซนต์ 4.83 เซ็นต์ เพลย์สเตชั่น 5เครื่องเล่น เกม Sony PlayStation 5 Digital Edition ระบุว่ามีประสิทธิภาพสูงสุดที่ 10.28 TFLOPS (20.56 TFLOPS ที่ความแม่นยำครึ่งหนึ่ง) ในราคาขายปลีก 399 ดอลลาร์สหรัฐ[ 103 ]
พฤศจิกายน 2020 4.11¢ 5.11¢ เอ็กซ์ซีโอเอ็กซ์ ซีรีส์เอ็กซ์Microsoft Xbox Series Xระบุว่ามีประสิทธิภาพสูงสุดที่ 12.15 TFLOPS (24.30 TFLOPS ที่ความแม่นยำครึ่งหนึ่ง) ในราคาขายปลีก 499 ดอลลาร์สหรัฐ[ 104 ]
กันยายน 2565 1.94 เซนต์ 2.13 เซนต์ อาร์ทีเอ็กซ์ 4090การ์ด กราฟิก RTX 4090ของ Nvidia ระบุว่ามีประสิทธิภาพสูงสุดที่ 82.6 TFLOPS (1.32 PFLOPS ที่ความแม่นยำ 8 บิต) ในราคาขายปลีก 1599 ดอลลาร์สหรัฐ[ 105 ]
มีนาคม 2568 1.23 เซนต์ 1.23 เซนต์ การ์ดจอ Radeon RX 9070 XTการ์ดจอ AMD RX 9070 มีประสิทธิภาพสูงสุด 48.7 TFLOPS ในราคาขายปลีก 599 ดอลลาร์สหรัฐ

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Floating_point_operations_per_second&oldid=1358217754 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ การคำนวณจุดลอยตัวต่อวินาที

การคำนวณจุดลอยตัวต่อวินาที ( FLOPS , flops หรือ flop/s ) เป็นการวัด ประสิทธิภาพ หรือ การคำนวณ ของ คอมพิวเตอร์ ซึ่งมีประโยชน์ในสาขาการคำนวณทางวิทยาศาสตร์ที่ต้องการการคำนวณ...

ช่วงไดนามิกและความแม่นยำ

การยกกำลังที่มีอยู่ในการคำนวณจุดลอยตัวช่วยให้มั่นใจได้ถึงช่วงไดนามิกที่ใหญ่ขึ้นมาก – ตัวเลขที่ใหญ่ที่สุดและเล็กที่สุดที่สามารถแสดงได้ – ซึ่งมีความสำคัญอย่างยิ่งเมื่อประมวลผลชุดข้อมูลที่ข้อมูลบางส่วนอาจมีช่วงค่าตัวเลขที่กว้างมาก หรือช่วงอาจคาดเดาไม่ได้...

ประสิทธิภาพการคำนวณ

FLOPS และ MIPS เป็นหน่วยวัดประสิทธิภาพการคำนวณเชิงตัวเลขของคอมพิวเตอร์ การดำเนินการจุดลอยตัวมักใช้ในสาขาต่างๆ เช่น การวิจัยเชิงคำนวณทางวิทยาศาสตร์ รวมถึง การเรียนรู้ของเครื่อง อย่างไรก็ตาม ก่อนช่วงปลายทศวรรษ 1980 ฮาร์ดแวร์จุดลอยตัว (สามารถใช้งานเลขคณิต FP...

จำนวนการคำนวณจุดลอยตัวต่อรอบสัญญาณนาฬิกาสำหรับโปรเซสเซอร์ต่างๆ

(เฉพาะ GeForce GTX 465–480, 560 Ti, 570–590 เท่านั้น)