อ่าน 14 นาที
การคำนวณจุดลอยตัวต่อวินาที
การคำนวณจุดลอยตัวต่อวินาที ( FLOPS , flops หรือ flop/s ) เป็นการวัด ประสิทธิภาพ หรือ การคำนวณ ของ คอมพิวเตอร์ ซึ่งมีประโยชน์ในสาขาการคำนวณทางวิทยาศาสตร์ที่ต้องการการคำนวณ...
การคำนวณจุดลอยตัวต่อวินาที
การคำนวณจุดลอยตัวต่อวินาที ( FLOPS , flopsหรือflop/s ) เป็นการวัดประสิทธิภาพหรือการคำนวณของคอมพิวเตอร์ซึ่งมีประโยชน์ในสาขาการคำนวณทางวิทยาศาสตร์ที่ต้องการการคำนวณจุดลอยตัว[ 1 ] [ 2 ]
ในกรณีเช่นนี้ การวัดด้วยจำนวนคำสั่งต่อวินาทีจะมีความแม่นยำ กว่า
เลขคณิตจุดลอยตัว
| ชื่อ | หน่วย | ค่า |
|---|---|---|
| กิโลฟล็อป | kFLOPS | 10 3 |
| เมกะฟล็อปส์ | MFLOPS | 10 6 |
| กิกะฟล็อปส์ | GFLOPS [ 3 ] | 10 9 |
| เทรา ฟล็อปส์ | ทีเอฟแอลโอพี | 10 12 |
| เพต้าฟล็อปส์ | ฟล็อปส์ | 10 15 |
| เอ็กซาฟล็อปส์ | อีเอฟโลปส์ | 10 18 |
| เซ็ตต้าฟล็อปส์ | ZFLOPS | 10 21 |
| yotta FLOPS | วายฟล็อปส์ | 10 24 |
| รอนน่าล้มเหลว | อาร์เอฟโลปส์ | 10 27 |
| เควตตาฟลอปส์ | คิวฟลอปส์ | 10:30 น. |
การคำนวณเลขทศนิยมแบบลอยตัว มีความจำเป็นสำหรับ จำนวนจริงขนาดใหญ่มากหรือเล็กมากหรือการคำนวณที่ต้องการช่วงไดนามิกขนาดใหญ่ การแสดงผลเลขทศนิยมแบบลอยตัวคล้ายกับสัญกรณ์วิทยาศาสตร์ ยกเว้นว่าคอมพิวเตอร์ใช้ฐานสอง (โดยมีข้อยกเว้นที่หายาก) แทนที่จะเป็นฐานสิบรูปแบบการเข้ารหัสจะเก็บเครื่องหมายเลขชี้กำลัง (ในฐานสองสำหรับ Cray และVAXฐานสองหรือสิบสำหรับ รูปแบบ เลขทศนิยมแบบลอยตัวของ IEEEและฐาน 16 สำหรับสถาปัตยกรรมเลขทศนิยมแบบลอยตัวของ IBM ) และตัวเลขสำคัญ (ตัวเลขหลังจุดทศนิยม ) แม้ว่าจะมีรูปแบบที่คล้ายกันหลายรูปแบบที่ใช้กันอยู่ แต่รูปแบบที่ใช้กันมากที่สุดคือANSI/IEEE Std. 754-1985มาตรฐานนี้กำหนดรูปแบบสำหรับตัวเลข 32 บิตที่เรียกว่าความแม่นยำเดี่ยวเช่นเดียวกับตัวเลข 64 บิตที่เรียกว่าความแม่นยำคู่และตัวเลขที่ยาวกว่าที่เรียกว่าความแม่นยำแบบขยาย (ใช้สำหรับผลลัพธ์ระดับกลาง) การแสดงผลเลขทศนิยมแบบลอยตัวสามารถรองรับช่วงค่าที่กว้างกว่าเลขทศนิยมแบบคงที่มาก โดยมีความสามารถในการแสดงตัวเลขขนาดเล็กมากและตัวเลขขนาดใหญ่มาก[ 4 ]
ช่วงไดนามิกและความแม่นยำ
การยกกำลังที่มีอยู่ในการคำนวณจุดลอยตัวช่วยให้มั่นใจได้ถึงช่วงไดนามิกที่ใหญ่ขึ้นมาก – ตัวเลขที่ใหญ่ที่สุดและเล็กที่สุดที่สามารถแสดงได้ – ซึ่งมีความสำคัญอย่างยิ่งเมื่อประมวลผลชุดข้อมูลที่ข้อมูลบางส่วนอาจมีช่วงค่าตัวเลขที่กว้างมาก หรือช่วงอาจคาดเดาไม่ได้ ด้วยเหตุนี้ โปรเซสเซอร์จุดลอยตัวจึงเหมาะอย่างยิ่งสำหรับแอปพลิเคชันที่ต้องใช้การคำนวณอย่างหนัก[ 5 ]
ประสิทธิภาพการคำนวณ
FLOPS และMIPSเป็นหน่วยวัดประสิทธิภาพการคำนวณเชิงตัวเลขของคอมพิวเตอร์ การดำเนินการจุดลอยตัวมักใช้ในสาขาต่างๆ เช่น การวิจัยเชิงคำนวณทางวิทยาศาสตร์ รวมถึงการเรียนรู้ของเครื่องอย่างไรก็ตาม ก่อนช่วงปลายทศวรรษ 1980 ฮาร์ดแวร์จุดลอยตัว (สามารถใช้งานเลขคณิต FP ในซอฟต์แวร์บนฮาร์ดแวร์จำนวนเต็มใดๆ ก็ได้) มักเป็นคุณสมบัติเสริม และคอมพิวเตอร์ที่มีคุณสมบัตินี้เรียกว่า "คอมพิวเตอร์วิทยาศาสตร์" หรือมีความสามารถในการ " คำนวณทางวิทยาศาสตร์ " ดังนั้น หน่วย MIPS จึงมีประโยชน์ในการวัดประสิทธิภาพจำนวนเต็มของคอมพิวเตอร์ใดๆ รวมถึงคอมพิวเตอร์ที่ไม่มีความสามารถดังกล่าว และเพื่อพิจารณาความแตกต่างของสถาปัตยกรรม จึงมีการใช้ MOPS (ล้านการดำเนินการต่อวินาที) ที่คล้ายกันตั้งแต่ปี 1970 [ 6 ]เช่นกัน โปรดทราบว่านอกเหนือจากเลขคณิตจำนวนเต็ม (หรือจุดคงที่) แล้ว ตัวอย่างของการดำเนินการจำนวนเต็ม ได้แก่ การเคลื่อนย้ายข้อมูล (A ไป B) หรือการทดสอบค่า (ถ้า A = B แล้ว C) นั่นเป็นเหตุผลที่ MIPS เหมาะสมที่จะใช้เป็นเกณฑ์วัดประสิทธิภาพเมื่อคอมพิวเตอร์ถูกใช้ในการสืบค้นฐานข้อมูล การประมวลผลคำ สเปรดชีต หรือเพื่อเรียกใช้ระบบปฏิบัติการเสมือนหลายระบบ[ 7 ] [ 8 ]ในปี พ.ศ. 2517 David Kuckได้บัญญัติศัพท์ flops และ megaflops เพื่ออธิบายประสิทธิภาพของซูเปอร์คอมพิวเตอร์ในยุคนั้นโดยนับจำนวนการคำนวณจุดลอยตัวที่ทำได้ต่อวินาที[ 9 ]ซึ่งดีกว่าการใช้ MIPS ที่แพร่หลายในการเปรียบเทียบคอมพิวเตอร์ เนื่องจากสถิตินี้มักไม่ค่อยมีผลต่อความสามารถในการคำนวณทางคณิตศาสตร์ของเครื่องในงานทางวิทยาศาสตร์

FLOPS บนระบบ HPC สามารถคำนวณได้โดยใช้สมการนี้: [ 10 ]
สามารถสรุปให้เข้าใจง่ายขึ้นได้โดยใช้กรณีที่พบได้บ่อยที่สุด นั่นคือ คอมพิวเตอร์ที่มีซีพียูเพียง 1 ตัว:
FLOPS สามารถบันทึกได้ในหน่วยวัดความแม่นยำที่แตกต่างกัน ตัวอย่างเช่น รายชื่อซูเปอร์คอมพิวเตอร์ TOP500จัดอันดับคอมพิวเตอร์ตามการดำเนินการ 64 บิต ( รูปแบบจุดลอยตัวความแม่นยำสองเท่า ) ต่อวินาที ซึ่ง ย่อเป็นFP64 [ 11 ]มีหน่วยวัดที่คล้ายกันสำหรับ การดำเนินการ 32 บิต ( FP32 ) และ16 บิต ( FP16 )
จำนวนการคำนวณจุดลอยตัวต่อรอบสัญญาณนาฬิกาสำหรับโปรเซสเซอร์ต่างๆ
| สถาปัตยกรรมไมโคร | สถาปัตยกรรมชุดคำสั่ง | เอฟพี64 | เอฟพี32 | เอฟพี16 |
|---|---|---|---|---|
| ซีพียู Intel | ||||
| อินเทล 80486 | x87 (80 บิต) | ? | 0.128 [ 13 ] | ? |
| x87 (80 บิต) | ? | 0.5 [ 13 ] | ? |
| x87 (80 บิต) | ? | 1 [ 14 ] | ? |
| อินเทลพี6 เพนเทียม III | SSE (64 บิต) | ? | 2 [ 14 ] | ? |
| Intel NetBurst Pentium 4 (Willamette, Northwood) | SSE2 (64 บิต) | 2 | 4 | ? |
| อินเทลพี6 เพนเทียมเอ็ม | SSE2 (64 บิต) | 1 | 2 | ? |
| SSE3 (64 บิต) | 2 | 4 | ? | |
| 4 | 8 | ? | ||
| อินเทลอะตอม ( บอนเนลล์ , ซอลท์เวลล์ , ซิลเวอร์มอนต์และโกลด์มอนต์ ) | SSE3 (128 บิต) | 2 | 4 | ? |
| อินเทลแซนดี้บริดจ์ ( แซนดี้บริดจ์ , ไอวี่บริดจ์ ) | AVX (256 บิต) | 8 | 16 | 0 |
| AVX2และFMA (256 บิต) | 16 | 32 | 0 |
| Intel Xeon Phi ( Knights Corner ) | IMCI (512 บิต) | 16 | 32 | 0 |
| AVX-512และFMA (512 บิต) | 32 | 64 | 0 |
| ซีพียู AMD | ||||
| เอดีเอ็มบ็อบแคท | AMD64 (64 บิต) | 2 | 4 | 0 |
| AVX (128 บิต) | 4 | 8 | 0 | |
| เอดีเอ็มเค10 | SSE4/4a (128 บิต) | 4 | 8 | 0 |
| รถดันดิน AMD [ 15 ] ( เครื่องตอกเสาเข็ม , รถบดถนน , รถขุด ) | 4 | 8 | 0 | |
| AVX2และFMA (การถอดรหัส 128 บิต, 256 บิต) [ 20 ] | 8 | 16 | 0 | |
| AVX2และFMA (256 บิต) | 16 | 32 | 0 | |
| AVX-512และFMA (256 บิต) | 16 | 32 | 0 | |
| AVX-512และFMA (512 บิต) | 32 | 64 | 0 | |
| ซีพียู ARM | ||||
| อาร์เอ็ม คอร์เท็กซ์ A7, A9, A15 | อาร์เอ็มวี7 | 1 | 8 | 0 |
| อาร์เอ็ม คอร์เท็กซ์ A32, A35 | อาร์เอ็มวี8 | 2 | 8 | 0 |
| แขน Cortex-A53 , A55 , A57 , [ 15 ] A72 , A73 | อาร์เอ็มวี8 | 8 | 16 | 0 |
| แขน Cortex-A75 , A76 , A77 , A78 | อาร์เอ็มวี8 | 8 | 16 | 32 |
| อาร์เอ็ม คอร์เท็กซ์-เอ็กซ์1 | อาร์เอ็มวี8 | 16 | 32 | 64 |
| ควอลคอมม์ไครต์ | อาร์เอ็มวี8 | 1 | 8 | 0 |
| Qualcomm Kryo (1xx - 3xx) | อาร์เอ็มวี8 | 2 | 8 | 0 |
| Qualcomm Kryo (4xx - 5xx) | อาร์เอ็มวี8 | 8 | 16 | 0 |
| ซัมซุงเอ็กไซโนส M1 และ M2 | อาร์เอ็มวี8 | 2 | 8 | 0 |
| Samsung Exynos M3 และ M4 | อาร์เอ็มวี8 | 3 | 12 | 0 |
| ซีพียูอื่นๆ | ||||
| IBM PowerPC A2 (Blue Gene/Q) | พาวเวอร์ อิซา เวอร์ชัน 2.06 | 8 | 8 (ในรูปแบบ FP64) | 0 |
| ฮิตาชิ SH-4 [ 23 ] [ 24 ] | เอช-4 | 1 | 7 | 0 |
| การ์ดจอ Nvidia | ||||
| Nvidia Curie ( ซีรี่ส์ GeForce 6และซีรี่ส์ GeForce 7 ) | พีทีเอ็กซ์ | ? | 8 | ? |
| Nvidia Tesla 2.0 (GeForce GTX 260–295) | พีทีเอ็กซ์ | ? | 2 | ? |
| เอ็นดีโอเฟอร์มิ (เฉพาะ GeForce GTX 465–480, 560 Ti, 570–590 เท่านั้น) | พีทีเอ็กซ์ | 1/4 (ล็อกโดยไดรเวอร์,1 ในฮาร์ดแวร์ ) | 2 | 0 |
| เอ็นดีโอเฟอร์มิ (เฉพาะ Quadro 600–2000) | พีทีเอ็กซ์ | 1/8 | 2 | 0 |
| เอ็นดีโอเฟอร์มิ (เฉพาะ Quadro 4000–7000, Tesla) | พีทีเอ็กซ์ | 1 | 2 | 0 |
| โนวิโดเคปเลอร์ (GeForce (ยกเว้น Titan และ Titan Black), Quadro (ยกเว้น K6000), Tesla K10) | พีทีเอ็กซ์ | 1/12 (สำหรับ GK110 :ล็อกโดยไดรเวอร์ , 2/3ในฮาร์ดแวร์) | 2 | 0 |
| โนวิโดเคปเลอร์ (GeForce GTX Titan และ Titan Black, Quadro K6000, Tesla (ยกเว้น K10)) | พีทีเอ็กซ์ | 2 ⁄ 3 | 2 | 0 |
| พีทีเอ็กซ์ | 1/16 | 2 | 1/32 |
| Nvidia Pascal (เฉพาะ Quadro GP100 และ Tesla P100) | พีทีเอ็กซ์ | 1 | 2 | 4 |
| Nvidia Volta [ 25 ] | พีทีเอ็กซ์ | 1 | 2 ( FP32 ) + 2 ( INT32 ) | 16 |
| Nvidia Turing (เฉพาะ GeForce 16XX ) | พีทีเอ็กซ์ | 1/16 | 2 (FP32) + 2 (INT32) | 4 |
| Nvidia Turing (ยกเว้น GeForce 16XX ) | พีทีเอ็กซ์ | 1/16 | 2 (FP32) + 2 (INT32) | 16 |
| Nvidia Ampere [ 26 ] [ 27 ] (เฉพาะ Tesla A100/A30) | พีทีเอ็กซ์ | 2 | 2 (FP32) + 2 (INT32) | 32 |
| พีทีเอ็กซ์ | 1/32 | 2 (FP32) + 0 (INT32) หรือ1 (FP32) + 1 (INT32) | 8 |
| โนวิโดฮอปเปอร์ | พีทีเอ็กซ์ | 2 | 2 (FP32) + 1 (INT32) | 32 |
| การ์ดจอ AMD | ||||
| AMD TeraScale 1 ( Radeon HD 4000 ซีรีส์ ) | เทราสเกล 1 | 0.4 | 2 | ? |
| AMD TeraScale 2 ( Radeon HD 5000 ซีรี่ส์ ) | เทราสเกล 2 | 1 | 2 | ? |
| AMD TeraScale 3 ( Radeon HD 6000 ซีรี่ส์ ) | เทราสเกล 3 | 1 | 4 | ? |
| AMD GCN (เฉพาะ Radeon Pro W 8100–9100) | จีซีเอ็น | 1 | 2 | ? |
| AMD GCN (ยกเว้น Radeon Pro W 8100–9100 และ Vega 10–20) | จีซีเอ็น | 1/8 | 2 | 4 |
| AMD GCN Vega 10 | จีซีเอ็น | 1/8 | 2 | 4 |
| AMD GCN Vega 20 (เฉพาะ Radeon VII) | จีซีเอ็น | 1/2 (ล็อกโดยไดรเวอร์,1 ในฮาร์ดแวร์ ) | 2 | 4 |
| AMD GCN Vega 20 (เฉพาะ Radeon Instinct MI50 / MI60 และ Radeon Pro VII) | จีซีเอ็น | 1 | 2 | 4 |
| อาร์ดีเอ็นเอ | 1/8 | 2 | 4 | |
| เอดีเอ็ม อาร์ดีเอ็นเอ3 | อาร์ดีเอ็นเอ | 1/8 ? | 4 | 8? |
| เอ ดีเอ็ ม ซี ดีเอ็นเอ | ดีเอ็นเอ | 1 | 4 (เทนเซอร์) [ 30 ] | 16 |
| AMD CDNA 2 | ซีดีเอ็นเอ 2 | 4 (เทนเซอร์) | 4 (เทนเซอร์) | 16 |
| หน่วยประมวลผลกราฟิก Intel | ||||
| Intel Xe-LP (ไอริส Xe MAX) [ 31 ] | ซี | 1/2 ? | 2 | 4 |
| อินเทล Xe-HPG (อาร์ค อัลเคมิสต์) [ 31 ] | ซี | 0 | 2 | 16 |
| Intel Xe-HPC (ปอนเต เวคคิโอ) [ 32 ] | ซี | 2 | 2 | 32 |
| อินเทล Xe2 (อาร์ค แบทเทิลเมจ) | ซีอี2 | 1/8 | 2 | 16 |
| หน่วยประมวลผลกราฟิก Qualcomm | ||||
| Qualcomm Adreno 5x0 | อะดรีโน 5xx | 1 | 2 | 4 |
| Qualcomm Adreno 6x0 | อะดรีโน 6xx | 1 | 2 | 4 |
| กราฟคอร์ | ||||
| Graphcore Colossus GC2 [ 33 ] [ 34 ] | ? | 0 | 16 | 64 |
| ? | 0 | 32 | 128 | |
| ซูเปอร์คอมพิวเตอร์ | ||||
| ENIACที่ความถี่ 100 kHz ในปี 1945 | 0.00385 [ 37 ] (~2.6 × 10 −3 FLOPS/ W ) [ 38 ] | |||
| โปรเซสเซอร์ 48 บิต @ 208 kHzในมาตรฐาน CDC 1604ในปี 1960 | ||||
| โปรเซสเซอร์ 60 บิต ความเร็ว 10 เมกะเฮิร์ตซ์ ในCDC 6600ในปี 1964 | 0.3 (FP60) | |||
| โปรเซสเซอร์ 60 บิต ความเร็ว 10 เมกะเฮิร์ตซ์ ในCDC 7600ในปี 1967 | 1.0 (FP60) | |||
| Cray-1ที่ความเร็ว 80 MHz ในปี 1976 | 2 (700 ฟลอป/วัตต์) | |||
| CDC Cyber 205 ที่ความถี่ 50 MHz ในปี 1981 คอมไพเลอร์ FORTRAN (ANSI 77 พร้อมส่วนขยายเวกเตอร์) | 8 | 16 | ||
| เครื่องประมวลผลสัญญาณ Transputer IMS T800-20 ที่ความถี่ 20 MHz ในปี 1987 | 0.08 [ 39 ] | |||
| Parallella E16 @ 1,000 MHz ในปี 2555 | 2 [ 40 ] (5.0 GFLOPS/W) [ 41 ] | |||
| Parallella E64 @ 800 MHz ในปี 2555 | 2 [ 42 ] (50.0 GFLOPS/W) [ 41 ] | |||
| สถาปัตยกรรมไมโคร | สถาปัตยกรรมชุดคำสั่ง | เอฟพี64 | เอฟพี32 | เอฟพี16 |
บันทึกผลการปฏิบัติงาน
บันทึกคอมพิวเตอร์เครื่องเดียว
NEC SX-2ซึ่งเป็นซูเปอร์คอมพิวเตอร์ที่พัฒนาโดยNECในปี 1983 สามารถทำประสิทธิภาพระดับกิกะฟลอปส์ (GFLOPS) ได้ถึง 1.3 พันล้านฟลอปส์[ 43 ]
ในเดือนมิถุนายน พ.ศ. 2540 ASCI RedของIntelเป็นคอมพิวเตอร์เครื่องแรกของโลกที่สามารถทำความเร็วได้ถึง 1 teraFLOPS และสูงกว่านั้น Bill Camp ผู้อำนวยการ Sandia กล่าวว่า ASCI Red มีความน่าเชื่อถือสูงสุดในบรรดาซูเปอร์คอมพิวเตอร์ที่เคยสร้างมา และ "ถือเป็นจุดสูงสุดของซูเปอร์คอมพิวเตอร์ในด้านอายุการใช้งาน ราคา และประสิทธิภาพ" [ 44 ]
ซูเปอร์คอมพิวเตอร์ SX-9ของNEC เป็น โปรเซสเซอร์เวกเตอร์เครื่องแรกของโลกที่มีประสิทธิภาพเกิน 100 กิกะฟลอปส์ต่อคอร์เดี่ยว
ในเดือนมิถุนายน ปี 2006 สถาบันวิจัยRIKEN ของญี่ปุ่นได้ประกาศเปิดตัวคอมพิวเตอร์รุ่นใหม่ ชื่อMDGRAPE-3คอมพิวเตอร์รุ่นนี้มีประสิทธิภาพสูงสุดถึง 1 เพตาฟลอปส์ ซึ่งเร็วกว่า Blue Gene/L เกือบสองเท่า แต่ MDGRAPE-3 ไม่ใช่คอมพิวเตอร์อเนกประสงค์ จึงไม่ปรากฏอยู่ใน รายชื่อ Top500.org เนื่องจากมี หน่วยประมวลผลเฉพาะทางสำหรับการจำลองพลศาสตร์โมเลกุล
ในปี 2550 บริษัท Intel Corporation ได้เปิดตัวชิป POLARIS แบบมัลติคอร์รุ่น ทดลองซึ่งสามารถทำประสิทธิภาพได้ 1 teraFLOPS ที่ความถี่ 3.13 GHz ชิป 80 คอร์นี้สามารถเพิ่มประสิทธิภาพได้ถึง 2 teraFLOPS ที่ความถี่ 6.26 GHz แม้ว่าการระบายความร้อนที่ความถี่นี้จะเกิน 190 วัตต์ก็ตาม[ 45 ]
ในเดือนมิถุนายน พ.ศ. 2550 Top500.org รายงานว่าคอมพิวเตอร์ที่เร็วที่สุดในโลกคือ ซูเปอร์คอมพิวเตอร์ IBM Blue Gene/Lซึ่งวัดได้สูงสุด 596 teraFLOPS [ 46 ] Cray XT4อยู่ในอันดับที่สองด้วย 101.7 teraFLOPS
เมื่อวันที่ 26 มิถุนายน พ.ศ. 2550 IBMได้ประกาศเปิดตัวซูเปอร์คอมพิวเตอร์รุ่นที่สอง ซึ่งมีชื่อว่า Blue Gene/P และได้รับการออกแบบให้ทำงานอย่างต่อเนื่องด้วยความเร็วเกิน 1 เพตาฟลอปส์ ซึ่งเร็วกว่า Blue Gene/L เมื่อกำหนดค่าให้เป็นเช่นนั้น จะสามารถทำความเร็วได้เกิน 3 เพตาฟลอปส์[ 47 ]
เมื่อวันที่ 25 ตุลาคม พ.ศ. 2550 บริษัท NEC Corporation ของญี่ปุ่นได้ออกข่าวประชาสัมพันธ์ประกาศเปิดตัวรุ่น SX -9 [ 48 ]โดยอ้างว่าเป็นซูเปอร์คอมพิวเตอร์เวกเตอร์ที่เร็วที่สุดในโลกSX-9มี CPU ตัวแรกที่สามารถประมวลผลเวกเตอร์ได้สูงสุด 102.4 กิกะฟลอปส์ต่อคอร์เดียว
เมื่อ วันที่ 4 กุมภาพันธ์ พ.ศ. 2551 NSFและมหาวิทยาลัยเท็กซัสที่ออสตินได้เปิดการวิจัยเต็มรูปแบบบน ซูเปอร์คอมพิวเตอร์ AMD Sun ที่ชื่อ Ranger [ 49 ] ซึ่งเป็น ระบบซูเปอร์คอมพิวเตอร์ที่ทรงพลังที่สุดในโลกสำหรับการวิจัยวิทยาศาสตร์แบบเปิด ซึ่งทำงานด้วยความเร็วคงที่ 0.5 เพตาฟลอปส์
เมื่อวันที่ 25 พฤษภาคม พ.ศ. 2551 ซูเปอร์คอมพิวเตอร์อเมริกันที่สร้างโดยIBMชื่อ ' Roadrunner ' บรรลุเป้าหมายการคำนวณที่ 1 petaFLOPS โดยติดอันดับ 1 ใน รายชื่อ TOP500ของซูเปอร์คอมพิวเตอร์ที่ทรงพลังที่สุดประจำเดือนมิถุนายน พ.ศ. 2551 และพ.ย. พ.ศ. 2551 (ไม่รวมคอมพิวเตอร์แบบกริด ) [ 50 ] [ 51 ] คอมพิวเตอร์เครื่องนี้ตั้งอยู่ที่ห้องปฏิบัติการแห่งชาติลอสอะลาโมสในนิวเม็กซิโก ชื่อของคอมพิวเตอร์นี้มาจาก นกประจำรัฐนิวเม็กซิโกคือ นก โรดรันเนอร์ใหญ่ ( Geococcyx californianus ) [ 52 ]
ในเดือนมิถุนายน ปี 2008 AMD ได้เปิดตัวการ์ดจอ ATI Radeon HD 4800 ซีรีส์ ซึ่งมีรายงานว่าเป็น GPU รุ่นแรกที่สามารถทำความเร็วได้ถึง 1 เทราฟลอปส์ ต่อมาในวันที่ 12 สิงหาคม ปี 2008 AMD ได้เปิดตัวการ์ดจอ ATI Radeon HD 4870X2 ซึ่งประกอบด้วย GPU Radeon R770 สองตัว รวมกันแล้วทำความเร็วได้ถึง 2.4 เทราฟลอปส์
ในเดือนพฤศจิกายนปี 2008 การอัปเกรดซูเปอร์คอมพิวเตอร์ Cray Jaguarที่ห้องปฏิบัติการแห่งชาติ Oak Ridge (ORNL) สังกัดกระทรวงพลังงาน (DOE) ทำให้กำลังการประมวลผลของระบบเพิ่มขึ้นสูงสุดถึง 1.64 เพตาฟลอปส์ ทำให้ Jaguar เป็นระบบเพตาฟลอปส์ระบบแรกของโลกที่อุทิศให้กับการวิจัยแบบเปิดในช่วงต้นปี 2009 ซูเปอร์คอมพิวเตอร์นี้ได้รับการตั้งชื่อตามสัตว์ในตำนานว่าKraken Kraken ได้รับการประกาศให้เป็นซูเปอร์คอมพิวเตอร์ที่บริหารจัดการโดยมหาวิทยาลัยที่เร็วที่สุดในโลก และเร็วที่สุดเป็นอันดับที่ 6 โดยรวมในรายชื่อ TOP500 ปี 2009 ในปี 2010 Kraken ได้รับการอัปเกรดและสามารถทำงานได้เร็วขึ้นและมีประสิทธิภาพมากขึ้น
ในปี 2552 Cray Jaguar ทำงานได้ 1.75 เพตาฟลอปส์ เอาชนะ IBM Roadrunner ขึ้นเป็นอันดับหนึ่งในรายชื่อTOP500 [ 53 ]
ในเดือนตุลาคม พ.ศ. 2553 จีนได้เปิดตัวTianhe-1ซึ่งเป็นซูเปอร์คอมพิวเตอร์ที่ทำงานด้วยอัตราการประมวลผลสูงสุด 2.5 เพตาฟลอปส์[ 54 ] [ 55 ]
ณ ปี 2010 โปรเซสเซอร์ พีซีที่เร็วที่สุด ทำได้ถึง 109 กิกะฟลอปส์ (Intel Core i7 980 XE ) [ 56 ]ในการคำนวณความแม่นยำสองเท่าGPUมีประสิทธิภาพมากกว่ามาก ตัวอย่างเช่น โปรเซสเซอร์ประมวลผล GPU Nvidia Tesla C2050 ทำงานได้ประมาณ 515 กิกะฟลอปส์[ 57 ]ในการคำนวณความแม่นยำสองเท่า และ AMD FireStream 9270 ทำได้สูงสุดถึง 240 กิกะฟลอปส์[ 58 ]
ในเดือนพฤศจิกายน พ.ศ. 2554 มีการประกาศว่าญี่ปุ่นประสบความสำเร็จในการประมวลผล 10.51 เพตาฟลอปส์ด้วยคอมพิวเตอร์K [ 59 ]ประกอบด้วยโปรเซสเซอร์SPARC64 VIIIfx จำนวน 88,128 ตัว ในแร็ค 864 แร็ค โดยมีประสิทธิภาพตามทฤษฎีอยู่ที่ 11.28 เพตาฟลอปส์ ชื่อนี้มาจากคำภาษาญี่ปุ่นว่า " kei " ซึ่งหมายถึง 10 ควอดริลเลียน [ 60 ] ซึ่งสอดคล้องกับความเร็วเป้าหมายที่ 10 เพตาฟลอปส์
เมื่อวันที่ 15 พฤศจิกายน 2011 Intel ได้สาธิตโปรเซสเซอร์ x86 ตัวเดียวที่มีชื่อรหัสว่า "Knights Corner" ซึ่งสามารถรักษาประสิทธิภาพการทำงานได้มากกว่า teraFLOPS ใน การดำเนินการ DGEMM ที่หลากหลาย Intel เน้นย้ำในระหว่างการสาธิตว่านี่คือประสิทธิภาพการทำงานที่ teraFLOPS อย่างต่อเนื่อง (ไม่ใช่ "teraFLOPS ดิบ" ที่ผู้อื่นใช้เพื่อให้ได้ตัวเลขที่สูงขึ้นแต่มีความหมายน้อยกว่า) และเป็นโปรเซสเซอร์อเนกประสงค์ตัวแรกที่สามารถรักษาประสิทธิภาพการทำงานได้ถึง teraFLOPS [ 61 ] [ 62 ]
เมื่อวันที่ 18 มิถุนายน พ.ศ. 2555 ระบบซูเปอร์คอมพิวเตอร์ Sequoia ของ IBMซึ่งตั้งอยู่ที่ห้องปฏิบัติการแห่งชาติ Lawrence Livermore ของสหรัฐอเมริกา (LLNL) สามารถทำความเร็วได้ถึง 16 petaFLOPS สร้างสถิติโลกและครองอันดับหนึ่งในรายการ TOP500 ล่าสุด[ 63 ]
เมื่อวันที่ 12 พฤศจิกายน 2012 รายชื่อ TOP500 รับรอง ว่า Titanเป็นซูเปอร์คอมพิวเตอร์ที่เร็วที่สุดในโลกตามเกณฑ์มาตรฐาน LINPACK ที่ 17.59 petaFLOPS [ 64 ] [ 65 ]ได้รับการพัฒนาโดย Cray Inc. ที่ห้องปฏิบัติการแห่งชาติ Oak Ridgeและรวมโปรเซสเซอร์ AMD Opteron เข้ากับเทคโนโลยีหน่วยประมวลผลกราฟิก (GPU) NVIDIA Tesla "Kepler" [ 66 ] [ 67 ]
เมื่อวันที่ 10 มิถุนายน พ.ศ. 2556 Tianhe-2ของจีนได้รับการจัดอันดับให้เป็นเครื่องที่เร็วที่สุดในโลกด้วยความเร็ว 33.86 เพตาฟลอปส์[ 68 ]
เมื่อวันที่ 20 มิถุนายน 2559 Sunway TaihuLight ของจีน ได้รับการจัดอันดับให้เป็นเครื่องประมวลผลที่เร็วที่สุดในโลกด้วยประสิทธิภาพ 93 petaFLOPS ในการทดสอบ LINPACK (จากประสิทธิภาพสูงสุด 125 petaFLOPS) ระบบนี้ติดตั้งอยู่ที่ศูนย์ซูเปอร์คอมพิวเตอร์แห่งชาติในเมืองอู๋ซี และมีประสิทธิภาพมากกว่าระบบที่มีประสิทธิภาพสูงสุด 5 อันดับถัดไปในรายการ TOP500 ในขณะนั้นรวมกัน[ 69 ]
ในเดือนมิถุนายน พ.ศ. 2562 Summitซึ่งเป็นซูเปอร์คอมพิวเตอร์ที่สร้างโดย IBM และปัจจุบันทำงานอยู่ที่ห้องปฏิบัติการแห่งชาติ Oak Ridge (ORNL) ของกระทรวงพลังงาน (DOE) ได้รับตำแหน่งอันดับหนึ่งด้วยประสิทธิภาพ 148.6 petaFLOPS บน High Performance Linpack (HPL) ซึ่งเป็นเกณฑ์มาตรฐานที่ใช้ในการจัดอันดับ TOP500 Summit มีโหนด 4,356 โหนด แต่ละโหนดติดตั้งซีพียู Power9 22 คอร์สองตัว และ GPU NVIDIA Tesla V100 หกตัว[ 70 ]
ในเดือนมิถุนายน พ.ศ. 2565 Frontierของสหรัฐอเมริกาเป็นซูเปอร์คอมพิวเตอร์ที่ทรงพลังที่สุดใน TOP500 โดยทำคะแนนได้ถึง 1,102 เพตาฟลอป (1,102 เอ็กซาฟลอป) ในเกณฑ์มาตรฐาน LINPACK [ 71 ]
ในเดือนพฤศจิกายน พ.ศ. 2567 ซูเปอร์ คอมพิวเตอร์El Capitan ระดับเอ็กซาสเกล ของสหรัฐอเมริกาซึ่งตั้งอยู่ที่ห้องปฏิบัติการแห่งชาติลอว์เรนซ์ลิเวอร์มอร์ใน เมือง ลิเวอร์มอร์ได้แซงหน้า Frontier ขึ้นเป็นซูเปอร์คอมพิวเตอร์ที่เร็วที่สุดในโลกในการจัดอันดับTop500 ครั้งที่ 64 (พ.ย. พ.ศ. 2567)และยังคงอยู่ในรายชื่อในเดือนมิถุนายน พ.ศ. 2568 [ 72 ]
บันทึกการประมวลผลแบบกระจาย
การประมวลผลแบบกระจายใช้การเชื่อมต่ออินเทอร์เน็ตเพื่อเชื่อมโยงคอมพิวเตอร์ส่วนบุคคล และบางครั้งก็ใช้ซูเปอร์คอมพิวเตอร์ เพื่อให้ได้ประสิทธิภาพการประมวลผล (FLOPS) ที่สูงขึ้น:
- ณ เดือนตุลาคม พ.ศ. 2555 กลุ่มนักวิทยาศาสตร์คอมพิวเตอร์และนักดาราศาสตร์ได้ทำการจำลองการก่อตัวของดาวฤกษ์บนโครงข่ายเวิร์กสเตชันแบบเฮเทอโรจีนัสจำนวน 5 เครื่องที่กระจายอยู่ทั่วประเทศเนเธอร์แลนด์ ซึ่งหลายเครื่องมี GPU [ 73 ] การคำนวณดำเนินการโดยการรวมAMUSE [ 74 ]เข้ากับIbis [ 75 ]
- ณ เดือนเมษายน พ.ศ. 2556 การจำลอง CosmoGrid [ 76 ]ซึ่งเป็นการจำลองสสารมืดแบบจักรวาลวิทยาที่มีอนุภาค 8589934592 อนุภาค ได้ถูกดำเนินการพร้อมกันบนซูเปอร์คอมพิวเตอร์ 3 เครื่อง เพื่อตอบคำถามเกี่ยวกับปัญหาดาวเทียมที่หายไปของกาแล็กซี โดยใช้ซูเปอร์คอมพิวเตอร์ในเมืองเอสปู (ฟินแลนด์) เอดินบะระ (สหราชอาณาจักร) และอัมสเตอร์ดัม (เนเธอร์แลนด์) ซึ่งมีคอร์ประมวลผล 19644 คอร์ ทำให้ได้ประสิทธิภาพสูงสุด 80% ของฮาร์ดแวร์
- ณ เดือนเมษายน พ.ศ. 2563 เครือข่าย Folding@homeมีกำลังการประมวลผลรวมมากกว่า 2.3 exaFLOPS [ 77 ] [ 78 ] [ 79 ] [ 80 ]นับเป็นเครือข่ายคอมพิวเตอร์แบบกระจายที่มีประสิทธิภาพสูงสุด และเป็นเครือข่ายแรกที่ทำลายสถิติ 1 exaFLOPS ของกำลังการประมวลผลรวม ประสิทธิภาพในระดับนี้เกิดขึ้นได้จากความพยายามร่วมกันของหน่วยประมวลผลกราฟิก(GPU)และหน่วย ประมวลผลกลาง (CPU) จำนวนมาก [ 81 ]
- ณ เดือนธันวาคม 2020 เครือข่าย BOINC ทั้งหมด มีประสิทธิภาพเฉลี่ยประมาณ 31 เพตาฟลอปส์[ 82 ]
- ณ เดือนมิถุนายน พ.ศ. 2561 SETI@homeซึ่งใช้ แพลตฟอร์มซอฟต์แวร์ BOINCมีประสิทธิภาพเฉลี่ย 896 teraFLOPS [ 83 ]
- ณ เดือนมิถุนายน พ.ศ. 2561 โครงการEinstein@Home ซึ่งใช้เครือข่าย BOINCกำลังประมวลผลที่ 3 เพตาฟลอปส์[ 84 ]
- ณ เดือนมิถุนายน พ.ศ. 2561 MilkyWay@homeซึ่งใช้ โครงสร้างพื้นฐาน BOINCสามารถประมวลผลได้ 847 teraFLOPS [ 85 ]
- ณ เดือนมิถุนายน พ.ศ. 2563 GIMPSซึ่งค้นหาจำนวนเฉพาะเมอร์เซนน์สามารถรองรับได้ 1,354 เทราฟลอปส์[ 86 ]
ต้นทุนการคำนวณ
ต้นทุนฮาร์ดแวร์
| วันที่ | ราคาโดยประมาณ (ดอลลาร์สหรัฐ) ต่อ GFLOPS | แพลตฟอร์มที่ให้ต้นทุนต่อ GFLOPS ต่ำที่สุด | ความคิดเห็น | |
|---|---|---|---|---|
| ไม่ได้ปรับแต่ง | 2025 [ 87 ] | |||
| พ.ศ. 2488 | 1.265 ดอลลาร์สหรัฐ | 22.623 ตัน | ENIAC : 487,000 ดอลลาร์สหรัฐในปี 1945 และ 8,709,000 ดอลลาร์สหรัฐในปี 2023 | 487,000 ดอลลาร์สหรัฐ /0.000 000 385 GFLOPSคอมพิวเตอร์ดิจิทัลอิเล็กทรอนิกส์ รุ่นแรก ( ใช้ หลอดสุญญากาศ ) |
| 1961 | 18.672 ดอลลาร์สหรัฐ | 201.171 พันล้านเหรียญสหรัฐ | ในขณะนั้น การติดตั้งระบบ IBM 7030 Stretchขั้นพื้นฐานมีราคาสูงถึง7.78 ล้านดอลลาร์สหรัฐต่อเครื่อง | หน่วย ประมวล ผล IBM 7030 Stretchทำการคูณเลขทศนิยมหนึ่งครั้งทุกๆ2.4 ไมโครวินาที [ 88 ] คอมพิวเตอร์ รุ่น ที่สอง (แบบทรานซิสเตอร์ แยกส่วน) |
| พ.ศ. 2507 | 2.3 พันล้านดอลลาร์สหรัฐ | 23.876 พันล้านดอลลาร์สหรัฐ | ราคา เริ่มต้นของรุ่นพื้นฐานCDC 6600 : 6,891,300 ดอลลาร์สหรัฐ | CDC 6600 ถือเป็นซูเปอร์คอมพิวเตอร์เครื่องแรก ที่ประสบความสำเร็จในเชิงพาณิชย์ |
| 1984 | 18.75 ล้านเหรียญสหรัฐ | 58.106 ล้านเหรียญสหรัฐ | เครย์ X-MP /48 | 15,000,000 ดอลลาร์สหรัฐ / 0.8 GFLOPS คอมพิวเตอร์รุ่นที่สาม (ใช้ชิป ประมวลผลแบบรวม ) |
| พ.ศ. 2540 | 30,000 เหรียญสหรัฐ | 60,168 เหรียญสหรัฐ | คลัสเตอร์ Beowulf 16 โปรเซสเซอร์ 2 ชุดพร้อมไมโครโปรเซสเซอร์Pentium Pro [ 89 ] | |
| เมษายน พ.ศ. 2543 | 1,000 เหรียญสหรัฐ | 1,899 เหรียญสหรัฐ | กลุ่มบันยิป บีโอวูล์ฟ | บุนยิปเป็นสัตว์เลี้ยงลูกด้วยนมชนิดแรกเทคโนโลยีการคำนวณ US$ 1/ MFLOPSได้รับรางวัล Gordon Bell Prize ในปี 2000 |
| พฤษภาคม 2543 | 640 เหรียญสหรัฐ | 1,197 เหรียญสหรัฐ | KLAT2 | KLAT2 เป็นเทคโนโลยีการประมวลผลแรกที่สามารถรองรับการใช้งานขนาดใหญ่ได้ ในขณะที่ยังคงมีประสิทธิภาพต่ำ1 ดอลลาร์สหรัฐ / MFLOPS [ 90 ] |
| สิงหาคม พ.ศ. 2546 | 83.86 เหรียญสหรัฐ | 147 ดอลลาร์ | คาซีโอ | KASY0 เป็นเทคโนโลยีการประมวลผลแบบแรกที่มีต้นทุนต่ำกว่า100 ดอลลาร์สหรัฐ ต่อ GFLOPS KASY0 สามารถทำ GFLOPS ได้ 471 GFLOPS บน HPL 32 บิต ด้วยต้นทุนที่ต่ำกว่า 39,500 ดอลลาร์สหรัฐ ทำให้เป็นซูเปอร์คอมพิวเตอร์เครื่องแรกที่ทำต้นทุนต่ำกว่า 100 ดอลลาร์สหรัฐต่อ GFLOPS [ 91 ] |
| สิงหาคม 2550 | 48.31 เหรียญสหรัฐ | 75.01 เหรียญสหรัฐ | ไมโครวูล์ฟ | ณ เดือนสิงหาคม พ.ศ. 2550 ข้อมูลนี้คลัสเตอร์ Beowulf "ส่วนตัว" ขนาด 26 GFLOPSสามารถสร้างได้ในราคา 1256 ดอลลาร์[ 92 ] |
| มีนาคม 2554 | 1.80 เหรียญสหรัฐ | 2.58 ดอลลาร์ | HPU4Science | คลัสเตอร์ราคา 30,000 ดอลลาร์นี้สร้างขึ้นโดยใช้ฮาร์ดแวร์ระดับ "เกมเมอร์" ที่มีจำหน่ายทั่วไปเท่านั้น[ 93 ] |
| สิงหาคม 2555 | 75 เซ็นต์ | 1.05 ดอลลาร์ | ระบบ Quad AMD Radeon 7970 | คอมพิวเตอร์เดสก์ท็อป AMD Radeon 7970แบบควอดคอร์ ให้ประสิทธิภาพการประมวลผลแบบความแม่นยำเดี่ยว 16 TFLOPS และแบบความแม่นยำคู่ 4 TFLOPS ต้นทุนระบบทั้งหมดอยู่ที่ 3,000 ดอลลาร์ สร้างขึ้นโดยใช้ฮาร์ดแวร์ที่มีจำหน่ายทั่วไปเท่านั้น[ 94 ] |
| มิถุนายน 2556 | 21.68 เซ็นต์ | 29.96 เซ็นต์ | โซนี่ เพลย์สเตชั่น 4 | เครื่องเล่นเกม Sony PlayStation 4มีประสิทธิภาพสูงสุดอยู่ที่...1.84 TFLOPSในราคา 399 ดอลลาร์[ 95 ] |
| พฤศจิกายน 2556 | 16.11¢ | 22.27 เซนต์ | ระบบ AMD Sempron 145และGeForce GTX 760 | ระบบที่สร้างขึ้นโดยใช้ชิ้นส่วนที่มีจำหน่ายทั่วไป โดยใช้ AMD Sempron 145 หนึ่งตัวและNvidia GeForce GTX 760 สามตัว จะมีประสิทธิภาพโดยรวม6.771 TFLOPSสำหรับต้นทุนรวม1,090.66 ดอลลาร์สหรัฐ[ 96 ] |
| ธันวาคม 2556 | 12.41 เซนต์ | 17.15¢ | ระบบ Pentium G550และRadeon R9 290 | สร้างขึ้นโดยใช้ชิ้นส่วนที่มีจำหน่ายทั่วไปIntel Pentium G550และ AMD Radeon R9 290มีประสิทธิภาพสูงสุดที่...4.848 TFLOPSรวมเป็นเงิน681.84 ดอลลาร์สหรัฐ[ 97 ] |
| มกราคม 2558 | 7.85¢ | 10.66 เซ็นต์ | ระบบ Celeron G1830และRadeon R9 295X2 | สร้างขึ้นโดยใช้ชิ้นส่วนที่มีจำหน่ายทั่วไป Intel Celeron G1830และ AMD Radeon R9 295X2ให้ประสิทธิภาพสูงสุดที่มากกว่า11.5 TFLOPSในราคารวมทั้งสิ้น902.57 ดอลลาร์สหรัฐ[ 98 ] [ 99 ] |
| มิถุนายน 2560 | 6¢ | 7.88 เซ็นต์ | ระบบ AMD Ryzen 7 1700และAMD Radeon Vega Frontier Edition | สร้างขึ้นโดยใช้ชิ้นส่วนที่มีจำหน่ายทั่วไป CPU AMD Ryzen 7 1700 เมื่อรวมกับกราฟิกการ์ด AMD Radeon Vega FE ในโหมด CrossFire จะได้ประสิทธิภาพสูงสุดมากกว่า50 TFLOPSในราคาต่ำกว่า3,000 ดอลลาร์สหรัฐสำหรับระบบที่สมบูรณ์[ 100 ] |
| ตุลาคม 2560 | 2.73 เซ็นต์ | 3.59 เซนต์ | ระบบ Intel Celeron G3930และAMD RX Vega 64 | สร้างขึ้นโดยใช้ชิ้นส่วนที่มีจำหน่ายทั่วไป การ์ดกราฟิก AMD RX Vega 64 จำนวน 3 ตัว ให้ประสิทธิภาพการประมวลผลแบบ half precision มากกว่า 75 TFLOPS (38 TFLOPS SP หรือ 2.6 TFLOPS DP เมื่อรวมกับ CPU) ในราคาประมาณ 2,050 ดอลลาร์สหรัฐสำหรับระบบที่สมบูรณ์[ 101 ] |
| พฤศจิกายน 2020 | 3.14 เซนต์ | 3.91¢ | ระบบ AMD Ryzen 3600และNVIDIA RTX 3080 จำนวน 3 ตัว | AMD Ryzen 3600 @ 484 GFLOPS & $199.99 การ์ดจอ NVIDIA RTX 3080 จำนวน 3 ตัว ประสิทธิภาพ 29,770 GFLOPS ต่อตัว ราคา 699.99 ดอลลาร์สหรัฐ ประสิทธิภาพการประมวลผลรวมของระบบ (GFLOPS) = 89,794 / TFLOPS = 89.794 ต้นทุนระบบโดยรวมรวมถึงชิ้นส่วนที่มีต้นทุนต่ำแต่สมจริง เมื่อเทียบกับตัวอย่างอื่น = 2839 ดอลลาร์[ 102 ] ดอลลาร์สหรัฐ /GFLOP = 0.0314 |
| พฤศจิกายน 2020 | 3.88 เซนต์ | 4.83 เซ็นต์ | เพลย์สเตชั่น 5 | เครื่องเล่น เกม Sony PlayStation 5 Digital Edition ระบุว่ามีประสิทธิภาพสูงสุดที่ 10.28 TFLOPS (20.56 TFLOPS ที่ความแม่นยำครึ่งหนึ่ง) ในราคาขายปลีก 399 ดอลลาร์สหรัฐ[ 103 ] |
| พฤศจิกายน 2020 | 4.11¢ | 5.11¢ | เอ็กซ์ซีโอเอ็กซ์ ซีรีส์เอ็กซ์ | Microsoft Xbox Series Xระบุว่ามีประสิทธิภาพสูงสุดที่ 12.15 TFLOPS (24.30 TFLOPS ที่ความแม่นยำครึ่งหนึ่ง) ในราคาขายปลีก 499 ดอลลาร์สหรัฐ[ 104 ] |
| กันยายน 2565 | 1.94 เซนต์ | 2.13 เซนต์ | อาร์ทีเอ็กซ์ 4090 | การ์ด กราฟิก RTX 4090ของ Nvidia ระบุว่ามีประสิทธิภาพสูงสุดที่ 82.6 TFLOPS (1.32 PFLOPS ที่ความแม่นยำ 8 บิต) ในราคาขายปลีก 1599 ดอลลาร์สหรัฐ[ 105 ] |
| มีนาคม 2568 | 1.23 เซนต์ | 1.23 เซนต์ | การ์ดจอ Radeon RX 9070 XT | การ์ดจอ AMD RX 9070 มีประสิทธิภาพสูงสุด 48.7 TFLOPS ในราคาขายปลีก 599 ดอลลาร์สหรัฐ |
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การคำนวณจุดลอยตัวต่อวินาที
การคำนวณจุดลอยตัวต่อวินาที ( FLOPS , flops หรือ flop/s ) เป็นการวัด ประสิทธิภาพ หรือ การคำนวณ ของ คอมพิวเตอร์ ซึ่งมีประโยชน์ในสาขาการคำนวณทางวิทยาศาสตร์ที่ต้องการการคำนวณ...
ช่วงไดนามิกและความแม่นยำ
การยกกำลังที่มีอยู่ในการคำนวณจุดลอยตัวช่วยให้มั่นใจได้ถึงช่วงไดนามิกที่ใหญ่ขึ้นมาก – ตัวเลขที่ใหญ่ที่สุดและเล็กที่สุดที่สามารถแสดงได้ – ซึ่งมีความสำคัญอย่างยิ่งเมื่อประมวลผลชุดข้อมูลที่ข้อมูลบางส่วนอาจมีช่วงค่าตัวเลขที่กว้างมาก หรือช่วงอาจคาดเดาไม่ได้...
ประสิทธิภาพการคำนวณ
FLOPS และ MIPS เป็นหน่วยวัดประสิทธิภาพการคำนวณเชิงตัวเลขของคอมพิวเตอร์ การดำเนินการจุดลอยตัวมักใช้ในสาขาต่างๆ เช่น การวิจัยเชิงคำนวณทางวิทยาศาสตร์ รวมถึง การเรียนรู้ของเครื่อง อย่างไรก็ตาม ก่อนช่วงปลายทศวรรษ 1980 ฮาร์ดแวร์จุดลอยตัว (สามารถใช้งานเลขคณิต FP...
จำนวนการคำนวณจุดลอยตัวต่อรอบสัญญาณนาฬิกาสำหรับโปรเซสเซอร์ต่างๆ
(เฉพาะ GeForce GTX 465–480, 560 Ti, 570–590 เท่านั้น)