อ่าน 6 นาที

เกณฑ์มาตรฐาน (ด้านการคำนวณ)

ในด้าน การคำนวณ เกณฑ์มาตรฐาน คือการกระทำในการเรียกใช้ โปรแกรมคอมพิวเตอร์ ชุดโปรแกรม หรือการดำเนินการอื่นๆ เพื่อประเมิน ประสิทธิภาพ เชิงสัมพัทธ์ ของวัตถุ โดยปกติจะทำการ ทดสอบ...

เกณฑ์มาตรฐาน (ด้านการคำนวณ)

( เรียนรู้วิธีและเวลาในการลบข้อความนี้ )

ในด้านการคำนวณเกณฑ์มาตรฐานคือการกระทำในการเรียกใช้โปรแกรมคอมพิวเตอร์ชุดโปรแกรม หรือการดำเนินการอื่นๆ เพื่อประเมินประสิทธิภาพ เชิงสัมพัทธ์ ของวัตถุ โดยปกติจะทำการทดสอบและทดลองมาตรฐานจำนวนหนึ่งกับวัตถุนั้น^{[ 1 ]}

คำว่า"เกณฑ์มาตรฐาน"ยังถูกนำมาใช้กันอย่างแพร่หลายในบริบทของโปรแกรมการเปรียบเทียบเกณฑ์มาตรฐานที่ออกแบบมาอย่างละเอียดถี่ถ้วนอีกด้วย

โดยทั่วไปแล้ว การวัดประสิทธิภาพ (Benchmarking) มักเกี่ยวข้องกับการประเมินคุณลักษณะด้านประสิทธิภาพของฮาร์ดแวร์คอมพิวเตอร์เช่น ประสิทธิภาพ การคำนวณเลขทศนิยมของซีพียูแต่ก็มีบางกรณีที่เทคนิคนี้สามารถนำไปใช้กับซอฟต์แวร์ ได้เช่น กัน ตัวอย่างเช่น การวัดประสิทธิภาพซอฟต์แวร์จะทำกับคอมไพเลอร์หรือระบบจัดการฐานข้อมูล (DBMS)

เกณฑ์มาตรฐานเป็นวิธีการเปรียบเทียบประสิทธิภาพของระบบย่อยต่างๆ ในสถาปัตยกรรม ชิป/ระบบที่แตกต่างกัน การกำหนดเกณฑ์มาตรฐานเป็นส่วนหนึ่งของการบูรณาการอย่างต่อเนื่องเรียกว่า การกำหนดเกณฑ์มาตรฐานอย่างต่อเนื่อง^{[ 2 ]}

วัตถุประสงค์

เมื่อสถาปัตยกรรมคอมพิวเตอร์พัฒนาขึ้น การเปรียบเทียบประสิทธิภาพของระบบคอมพิวเตอร์ต่างๆ โดยดูจากสเปคเพียงอย่างเดียวจึงทำได้ยากขึ้น ดังนั้นจึงมีการพัฒนาการทดสอบที่ช่วยให้สามารถเปรียบเทียบสถาปัตยกรรมที่แตกต่างกันได้ ตัวอย่างเช่น โปรเซสเซอร์ Pentium 4โดยทั่วไปทำงานที่ความถี่สัญญาณนาฬิกาสูงกว่า โปรเซสเซอร์ Athlon XPหรือPowerPCซึ่งไม่ได้หมายความว่าจะมีพลังการประมวลผลมากกว่าเสมอไป โปรเซสเซอร์ที่มีความถี่สัญญาณนาฬิกาต่ำกว่าอาจทำงานได้ดีเท่าหรือดีกว่าโปรเซสเซอร์ที่ทำงานที่ความถี่สูงกว่า ดูBogoMipsและตำนานเมกะเฮิร์ตซ์

การทดสอบประสิทธิภาพ (Benchmark) ถูกออกแบบมาเพื่อจำลองภาระงานเฉพาะประเภทหนึ่งบนส่วนประกอบหรือระบบ การทดสอบประสิทธิภาพแบบสังเคราะห์ (Synthetic benchmark) ทำเช่นนั้นโดยการสร้างโปรแกรมพิเศษที่จำลองภาระงานนั้นให้กับส่วนประกอบ ในขณะที่การทดสอบประสิทธิภาพแบบแอปพลิเคชัน (Application benchmark) จะรันโปรแกรมที่ใช้งานจริงบนระบบ แม้ว่าการทดสอบประสิทธิภาพแบบแอปพลิเคชันมักจะให้การวัดประสิทธิภาพในโลกแห่งความเป็นจริงบนระบบที่กำหนดได้ดีกว่ามาก แต่การทดสอบประสิทธิภาพแบบสังเคราะห์ก็มีประโยชน์สำหรับการทดสอบส่วนประกอบแต่ละชิ้น เช่นฮาร์ดดิสก์หรืออุปกรณ์เครือข่าย

การทดสอบประสิทธิภาพมีความสำคัญอย่างยิ่งในการออกแบบซีพียูช่วยให้สถาปนิกโปรเซสเซอร์สามารถวัดและตัดสินใจเลือกข้อดีข้อเสียในด้านสถาปัตยกรรมระดับไมโครได้ ตัวอย่างเช่น หากการทดสอบประสิทธิภาพดึงเอาอัลกอริธึม หลัก ของแอปพลิเคชันออกมา ก็จะประกอบด้วยส่วนที่ไวต่อประสิทธิภาพของแอปพลิเคชันนั้น การรันโค้ดส่วนเล็กๆ นี้บนโปรแกรมจำลองที่แม่นยำระดับรอบการทำงาน สามารถให้เบาะแสเกี่ยวกับวิธีการปรับปรุงประสิทธิภาพได้

นับตั้งแต่ปี 1995 เป็นต้นมา ชุดเกณฑ์มาตรฐาน SPECได้รับการใช้งานอย่างแพร่หลาย

บริษัทผู้ผลิตคอมพิวเตอร์มักปรับแต่งระบบของตนเพื่อเพิ่มประสิทธิภาพในการทดสอบมาตรฐาน ซึ่งไม่ได้สะท้อนการใช้งานจริง แต่ปัจจุบันการทดสอบมาตรฐานได้รับการปรับปรุงให้ใกล้เคียงกับการใช้งานจริงมากขึ้น เพื่อให้การปรับแต่งใดๆ ส่งผลต่อประสิทธิภาพการทำงานของแอปพลิเคชันอย่างแท้จริง

ผู้จำหน่ายซอฟต์แวร์ยังใช้เกณฑ์มาตรฐานในการทำการตลาด เช่น "สงครามเกณฑ์มาตรฐาน" ระหว่าง ผู้ผลิต ฐานข้อมูลเชิงสัมพันธ์ คู่แข่ง ในช่วงทศวรรษ 1980 และ 1990 โดยทั่วไป บริษัทต่างๆ จะรายงานเฉพาะเกณฑ์มาตรฐาน (หรือแง่มุมของเกณฑ์มาตรฐาน) ที่แสดงให้เห็นถึงผลิตภัณฑ์ของตนในแง่ดีที่สุดเท่านั้น นอกจากนี้ยังเป็นที่ทราบกันดีว่าพวกเขาอาจบิดเบือนความสำคัญของเกณฑ์มาตรฐาน เพื่อแสดงให้เห็นถึงผลิตภัณฑ์ของตนในแง่ดีที่สุดเช่นกัน^{[ 3 ]}^{[ 4 ]}

เมื่อประสิทธิภาพเป็นสิ่งสำคัญ เกณฑ์วัดประสิทธิภาพเพียงอย่างเดียวที่สำคัญคือชุดแอปพลิเคชันของสภาพแวดล้อมเป้าหมาย

ฟังก์ชันการทำงาน

คุณสมบัติของซอฟต์แวร์การวัดประสิทธิภาพอาจรวมถึงการบันทึก/ ส่งออกขั้นตอนการทำงานไปยัง ไฟล์ สเปรดชีตการแสดงภาพ เช่น การวาดกราฟเส้นหรือ ไทล์ ที่มีรหัสสีและการหยุดกระบวนการชั่วคราวเพื่อให้สามารถดำเนินการต่อได้โดยไม่ต้องเริ่มต้นใหม่ ซอฟต์แวร์อาจมีคุณสมบัติเพิ่มเติมเฉพาะสำหรับวัตถุประสงค์ของมัน ตัวอย่างเช่น ซอฟต์แวร์การวัดประสิทธิภาพดิสก์อาจสามารถเริ่มวัดความเร็วของดิสก์ภายในช่วงที่กำหนดของดิสก์แทนที่จะวัดทั้งดิสก์ วัดความเร็วและความหน่วง ในการอ่าน แบบสุ่มมีคุณสมบัติ "การสแกนอย่างรวดเร็ว" ซึ่งวัดความเร็วผ่านตัวอย่างในช่วงเวลาและขนาดที่กำหนด และอนุญาตให้ระบุ ขนาด บล็อกข้อมูลซึ่งหมายถึงจำนวนไบต์ที่ร้องขอต่อคำขออ่าน^[⁵^]

ความท้าทาย

การเปรียบเทียบมาตรฐานไม่ใช่เรื่องง่าย และมักต้องผ่านกระบวนการหลายรอบเพื่อให้ได้ข้อสรุปที่คาดการณ์ได้และมีประโยชน์ การตีความข้อมูลการเปรียบเทียบมาตรฐานก็ยากอย่างยิ่งเช่นกัน นี่คือรายการความท้าทายทั่วไปบางส่วน:

โดยทั่วไปแล้ว ผู้ผลิตมักปรับแต่งผลิตภัณฑ์ของตนให้ตรงกับมาตรฐานอุตสาหกรรมต่างๆ Norton SysInfo (SI) นั้นปรับแต่งได้ง่ายเป็นพิเศษ เนื่องจากเน้นไปที่ความเร็วในการทำงานหลายอย่างพร้อมกัน จึงควรใช้ความระมัดระวังอย่างยิ่งในการตีความผลลัพธ์ดังกล่าว
ผู้จำหน่ายบางรายถูกกล่าวหาว่า "โกง" ในการทดสอบประสิทธิภาพ — ออกแบบระบบของตนเพื่อให้ได้ตัวเลขการทดสอบประสิทธิภาพที่สูงขึ้นมาก แต่ไม่ได้มีประสิทธิภาพตามภาระงานจริงที่คาดการณ์ไว้^{[ 6 ]}
เกณฑ์วัดประสิทธิภาพหลายอย่างมุ่งเน้นไปที่ความเร็วในการประมวลผล เพียงอย่างเดียว โดย ละเลยคุณสมบัติสำคัญอื่นๆ ของระบบคอมพิวเตอร์ เช่น:
- คุณภาพของการบริการ นอกเหนือจากประสิทธิภาพการทำงานโดยตรง ตัวอย่างของคุณภาพการบริการที่วัดไม่ได้ ได้แก่ ความปลอดภัย ความพร้อมใช้งาน ความน่าเชื่อถือ ความสมบูรณ์ของการดำเนินการ ความสามารถในการให้บริการ ความสามารถในการขยายขนาด (โดยเฉพาะความสามารถในการเพิ่มหรือจัดสรรกำลังการผลิตใหม่ได้อย่างรวดเร็วและไม่หยุดชะงัก) เป็นต้น มักมีการแลกเปลี่ยนที่แท้จริงระหว่างคุณภาพการบริการเหล่านี้ และทั้งหมดมีความสำคัญในด้านการประมวลผลทางธุรกิจ ข้อกำหนดมาตรฐานของ Transaction Processing Performance Councilได้กล่าวถึงข้อกังวลเหล่านี้บางส่วนโดยการระบุ การทดสอบคุณสมบัติ ACIDกฎการขยายขนาดของฐานข้อมูล และข้อกำหนดระดับการบริการ
- โดยทั่วไปแล้ว เกณฑ์มาตรฐานไม่ได้วัดต้นทุนรวมในการเป็นเจ้าของ (Total Cost of Ownership หรือ TCO) ข้อกำหนดของเกณฑ์มาตรฐาน Transaction Processing Performance Council (PTMP) ได้แก้ไขข้อกังวลนี้บางส่วนโดยระบุว่าต้องมีการรายงานตัวชี้วัดราคา/ประสิทธิภาพเพิ่มเติมจากตัวชี้วัดประสิทธิภาพดิบ โดยใช้ สูตร TCO แบบง่าย อย่างไรก็ตาม ต้นทุนที่รายงานนั้นเป็นเพียงส่วนหนึ่งเท่านั้น และผู้ขายบางรายอาจกำหนดราคาเฉพาะ (และเฉพาะ) สำหรับเกณฑ์มาตรฐาน โดยออกแบบ "รุ่นพิเศษสำหรับเกณฑ์มาตรฐาน" ที่มีราคาต่ำกว่าความเป็นจริง แม้แต่การเบี่ยงเบนเพียงเล็กน้อยจากแพ็คเกจเกณฑ์มาตรฐานก็ส่งผลให้ราคาสูงขึ้นมากในประสบการณ์จริง
- ภาระด้านสิ่งอำนวยความสะดวก (พื้นที่ พลังงาน และระบบระบายความร้อน) เมื่อใช้พลังงานมากขึ้น ระบบพกพาจะมีอายุการใช้งานแบตเตอรี่สั้นลงและต้องชาร์จบ่อยขึ้น เซิร์ฟเวอร์ที่ใช้พลังงานและ/หรือพื้นที่มากขึ้นอาจไม่สามารถติดตั้งได้ภายในข้อจำกัดด้านทรัพยากรของศูนย์ข้อมูลที่มีอยู่ รวมถึงข้อจำกัดด้านระบบระบายความร้อน มีข้อแลกเปลี่ยนที่แท้จริง เนื่องจากเซมิคอนดักเตอร์ส่วนใหญ่ต้องการพลังงานมากขึ้นเพื่อสลับการทำงานได้เร็วขึ้น ดูเพิ่มเติมที่ ประสิทธิภาพต่อวัตต์
- ในระบบฝังตัวบางระบบที่หน่วยความจำมีต้นทุนสูง การเพิ่มความหนาแน่นของโค้ดสามารถช่วยลดต้นทุนได้อย่างมาก
โดยทั่วไปแล้ว เกณฑ์วัดประสิทธิภาพของผู้จำหน่ายมักละเลยข้อกำหนดด้านความสามารถในการประมวลผลสำหรับการพัฒนา การทดสอบ และการกู้คืนระบบในกรณีเกิดภัยพิบัติผู้จำหน่ายมักรายงานเฉพาะสิ่งที่อาจจำเป็นสำหรับความสามารถในการใช้งานจริงเท่านั้น เพื่อให้ราคาเริ่มต้นดูต่ำที่สุดเท่าที่จะเป็นไปได้
การทดสอบประสิทธิภาพกำลังประสบปัญหาในการปรับตัวให้เข้ากับเซิร์ฟเวอร์ที่กระจายตัวอยู่เป็นวงกว้าง โดยเฉพาะอย่างยิ่งเซิร์ฟเวอร์ที่มีความอ่อนไหวเป็นพิเศษต่อโครงสร้างเครือข่าย การเกิดขึ้นของระบบประมวลผลแบบกริดโดยเฉพาะอย่างยิ่ง ทำให้การทดสอบประสิทธิภาพซับซ้อนยิ่งขึ้น เนื่องจากภาระงานบางอย่าง "เป็นมิตรกับระบบกริด" ในขณะที่ภาระงานอื่นๆ ไม่เป็นเช่นนั้น
ผู้ใช้งานอาจมีมุมมองต่อประสิทธิภาพการทำงานที่แตกต่างไปจากที่เกณฑ์มาตรฐานระบุไว้ โดยเฉพาะอย่างยิ่ง ผู้ใช้งานชื่นชอบความสามารถในการคาดการณ์ได้ เช่น เซิร์ฟเวอร์ที่ตรงตามหรือเกินกว่าข้อตกลงระดับบริการ เสมอ เกณฑ์มาตรฐานมักเน้นคะแนนเฉลี่ย (มุมมองด้านไอที) มากกว่าเวลาตอบสนองสูงสุดในกรณีที่เลวร้ายที่สุด ( มุมมองด้าน การประมวลผลแบบเรียลไทม์ ) หรือค่าเบี่ยงเบนมาตรฐานต่ำ (มุมมองของผู้ใช้)
สถาปัตยกรรมเซิร์ฟเวอร์จำนวนมากจะเสื่อมประสิทธิภาพลงอย่างมากเมื่อมีการใช้งานในระดับสูง (ใกล้ 100%) — "ประสิทธิภาพตกฮวบ" — และการทดสอบประสิทธิภาพควรคำนึงถึงปัจจัยนี้ด้วย (แต่ส่วนใหญ่มักไม่ทำ) โดยเฉพาะอย่างยิ่ง ผู้ผลิตมักจะเผยแพร่ผลการทดสอบประสิทธิภาพเซิร์ฟเวอร์ที่ระดับการใช้งานต่อเนื่องประมาณ 80% ซึ่งเป็นสถานการณ์ที่ไม่สมจริง และไม่ได้บันทึกสิ่งที่เกิดขึ้นกับระบบโดยรวมเมื่อความต้องการใช้งานเพิ่มสูงขึ้นเกินระดับนั้น
การทดสอบประสิทธิภาพจำนวนมากมุ่งเน้นไปที่แอปพลิเคชันเดียว หรือแม้แต่แอปพลิเคชันระดับเดียว โดยละเลยแอปพลิเคชันอื่นๆ ปัจจุบันศูนย์ข้อมูลส่วนใหญ่กำลังนำเทคโนโลยีเวอร์ชวลไลเซชัน มาใช้ กันอย่างแพร่หลายด้วยเหตุผลหลายประการ และการทดสอบประสิทธิภาพยังคงตามไม่ทันความเป็นจริงที่แอปพลิเคชันและแอปพลิเคชันระดับต่างๆ ทำงานพร้อมกันบนเซิร์ฟเวอร์แบบรวมศูนย์
มีเกณฑ์มาตรฐานคุณภาพสูงน้อยมาก (หรืออาจไม่มีเลย) ที่ช่วยวัดประสิทธิภาพของการประมวลผลแบบแบตช์ โดยเฉพาะอย่างยิ่งการประมวลผลแบบแบตช์และการประมวลผลออนไลน์ที่มีปริมาณมากพร้อมกันการประมวลผลแบบแบตช์มักเน้นไปที่ความสามารถในการคาดการณ์ได้ว่างานที่ใช้เวลานานจะเสร็จสมบูรณ์อย่างถูกต้องก่อนกำหนดเวลา เช่น สิ้นเดือนหรือสิ้นปีงบประมาณ กระบวนการทางธุรกิจหลักที่สำคัญหลายอย่างใช้การประมวลผลแบบแบตช์ และน่าจะเป็นเช่นนั้นเสมอ เช่น การเรียกเก็บเงิน
สถาบันการเปรียบเทียบมาตรฐานมักเพิกเฉยหรือไม่ปฏิบัติตามวิธีการทางวิทยาศาสตร์ขั้นพื้นฐาน ซึ่งรวมถึงแต่ไม่จำกัดเพียง: ขนาดตัวอย่างเล็ก ขาดการควบคุมตัวแปร และความสามารถในการทำซ้ำผลลัพธ์ที่จำกัด^{[ 7 ]}

หลักการเปรียบเทียบมาตรฐาน

มีลักษณะสำคัญเจ็ดประการสำหรับเกณฑ์มาตรฐาน^{[ 8 ]}คุณสมบัติหลักเหล่านี้ได้แก่:

ความเหมาะสม: เกณฑ์มาตรฐานควรวัดคุณลักษณะที่ค่อนข้างสำคัญ
ความครอบคลุม: ตัวชี้วัดประสิทธิภาพมาตรฐานควรได้รับการยอมรับอย่างกว้างขวางจากภาคอุตสาหกรรมและสถาบันการศึกษา
ความเป็นธรรม: ระบบทุกระบบควรได้รับการเปรียบเทียบอย่างยุติธรรม
ความสามารถในการทำซ้ำ: สามารถตรวจสอบผลลัพธ์ของเกณฑ์มาตรฐานได้
ความคุ้มค่า: การทดสอบมาตรฐานมีต้นทุนต่ำ
ความสามารถในการปรับขนาด: การทดสอบประสิทธิภาพควรใช้งานได้กับระบบที่มีทรัพยากรหลากหลายระดับ ตั้งแต่ต่ำไปจนถึงสูง
ความโปร่งใส: ตัวชี้วัดมาตรฐานควรเข้าใจง่าย

ประเภทของเกณฑ์มาตรฐาน

โปรแกรมจริง
- ซอฟต์แวร์ประมวลผลคำ
- ซอฟต์แวร์เครื่องมือ CAD
- ซอฟต์แวร์แอปพลิเคชันของผู้ใช้ (เช่น MIS)
- วิดีโอเกม
- คอมไพเลอร์ที่สร้างโปรเจ็กต์ขนาดใหญ่ เช่นเบราว์เซอร์ Chromiumหรือเคอร์เนล Linux
การวัดประสิทธิภาพส่วนประกอบ / การวัดประสิทธิภาพระดับไมโคร
- รูทีนหลักประกอบด้วยโค้ดขนาดเล็กและเฉพาะเจาะจงชิ้นหนึ่ง
- วัดประสิทธิภาพของส่วนประกอบพื้นฐานของคอมพิวเตอร์^{[ 9 ]}
- อาจใช้สำหรับการตรวจจับพารามิเตอร์ฮาร์ดแวร์ของคอมพิวเตอร์โดยอัตโนมัติ เช่น จำนวนรีจิสเตอร์ขนาดแคช ความหน่วงของหน่วยความจำเป็นต้น
เคอร์เนล
- ประกอบด้วยรหัสสำคัญ
- โดยปกติแล้วจะถูกแยกออกมาจากโปรแกรมจริง
- เคอร์เนลยอดนิยม: ลิเวอร์มอร์ลูป
- linpack benchmark (ประกอบด้วยโปรแกรมย่อยพีชคณิตเชิงเส้นพื้นฐานที่เขียนด้วยภาษา FORTRAN)
- ผลลัพธ์แสดงในหน่วย Mflop/s
เกณฑ์มาตรฐานสังเคราะห์
- ขั้นตอนการเขียนโปรแกรมสำหรับการทดสอบประสิทธิภาพเชิงสังเคราะห์:
  - รวบรวมสถิติของการดำเนินการทุกประเภทจากโปรแกรมแอปพลิเคชันหลายโปรแกรม
  - รับสัดส่วนของการดำเนินการแต่ละครั้ง
  - เขียนโปรแกรมโดยอิงตามสัดส่วนข้างต้น
- ประเภทของดัชนีชี้วัดสังเคราะห์ ได้แก่:
  - หินลับมีด
  - ดรีสโตน
- นี่คือเกณฑ์มาตรฐานคอมพิวเตอร์อุตสาหกรรมทั่วไปชุดแรกๆ ผลการทดสอบอาจไม่ได้คะแนนสูงเสมอไปบนคอมพิวเตอร์แบบไปป์ไลน์สมัยใหม่
เกณฑ์มาตรฐาน I/O
เกณฑ์มาตรฐานฐานข้อมูล
- วัดปริมาณงานและเวลาตอบสนองของระบบจัดการฐานข้อมูล (DBMS)
เกณฑ์มาตรฐานแบบขนาน
- ใช้กับเครื่องที่มีหลายคอร์และ/หรือโปรเซสเซอร์ หรือระบบที่ประกอบด้วยเครื่องหลายเครื่อง

เกณฑ์มาตรฐานทั่วไป

มาตรฐานอุตสาหกรรม (ผ่านการตรวจสอบและยืนยันได้)

กลุ่มมาตรฐานไมโครโปรเซสเซอร์ฝังตัว (EEMBC)
บริษัท Standard Performance Evaluation Corporation (SPEC) โดยเฉพาะอย่างยิ่งSPECintและSPECfp
สภาประสิทธิภาพการประมวลผลธุรกรรม (TPC): เกณฑ์มาตรฐาน DBMS ^{[ 10 ]}

เกณฑ์มาตรฐานโอเพนซอร์ส

AIM Multiuser Benchmark – ประกอบด้วยรายการทดสอบที่สามารถผสมผสานกันเพื่อสร้าง 'โหลดมิกซ์' ที่จำลองการทำงานของคอมพิวเตอร์เฉพาะอย่างบนระบบปฏิบัติการประเภท UNIX ใดๆ ก็ได้
Bonnie++ – โปรแกรมทดสอบประสิทธิภาพระบบไฟล์และฮาร์ดไดรฟ์
BRL-CAD – ชุดทดสอบประสิทธิภาพข้ามแพลตฟอร์มที่ไม่ขึ้นกับสถาปัตยกรรมใดๆ โดยอิงจากประสิทธิภาพการเรย์เทรซซิ่งแบบมัลติเธรด มีพื้นฐานมาจาก VAX-11/780 และถูกใช้มาตั้งแต่ปี 1984 เพื่อประเมินประสิทธิภาพ CPU สัมพัทธ์ ความแตกต่างของคอมไพเลอร์ ระดับการปรับแต่ง ความสอดคล้อง ความแตกต่างของสถาปัตยกรรม และความแตกต่างของระบบปฏิบัติการ
ความรู้รวมหมู่ – กรอบการทำงานที่ปรับแต่งได้และใช้งานได้หลายแพลตฟอร์ม เพื่อระดมความคิดจากกลุ่มคนจำนวนมากในการวัดประสิทธิภาพและเพิ่มประสิทธิภาพการทำงานของผู้ใช้ (เช่นการเรียนรู้เชิงลึก ) บนฮาร์ดแวร์ต่างๆ ที่อาสาสมัครจัดหาให้
Coremark – เกณฑ์มาตรฐานสำหรับการประมวลผลแบบฝังตัว
ชุดทดสอบประสิทธิภาพ DEISA – การทดสอบประสิทธิภาพแอปพลิเคชัน HPC ทางวิทยาศาสตร์
Dhrystone – ประสิทธิภาพการคำนวณเลขจำนวนเต็ม มักรายงานเป็นหน่วย DMIPS (Dhrystone ล้านคำสั่งต่อวินาที)
DiskSpd – เครื่องมือแบบบรรทัดคำสั่งสำหรับทดสอบประสิทธิภาพการจัดเก็บข้อมูล ซึ่งสร้างคำขอต่างๆ มากมายต่อไฟล์คอมพิวเตอร์พาร์ติชั่นหรืออุปกรณ์จัดเก็บข้อมูล
Fhourstones – เกณฑ์มาตรฐานจำนวนเต็ม
HINT – ออกแบบมาเพื่อวัดประสิทธิภาพโดยรวมของ CPU และหน่วยความจำ
Iometer – เครื่องมือวัดและวิเคราะห์คุณลักษณะของระบบย่อยอินพุต/เอาต์พุต สำหรับระบบเดี่ยวและระบบแบบคลัสเตอร์
IOzone – โปรแกรมทดสอบประสิทธิภาพระบบไฟล์
เกณฑ์มาตรฐาน LINPACK – ซึ่งโดยทั่วไปใช้ในการวัดFLOPS
ลิเวอร์มอร์ ลูปส์
การทดสอบประสิทธิภาพแบบขนานของ NAS
NBench – ชุดโปรแกรมทดสอบประสิทธิภาพแบบสังเคราะห์ที่ใช้วัดประสิทธิภาพการคำนวณจำนวนเต็ม การประมวลผลหน่วยความจำ และการคำนวณเลขทศนิยม
PAL – มาตรฐานสำหรับระบบจำลองฟิสิกส์แบบเรียลไทม์
PerfKitBenchmarker – ชุดเกณฑ์มาตรฐานสำหรับวัดและเปรียบเทียบบริการคลาวด์ต่างๆ
Phoronix Test Suite – ชุดโปรแกรมทดสอบประสิทธิภาพแบบโอเพนซอร์สสำหรับ Linux, OpenSolaris, FreeBSD, OSX และ Windows ชุดนี้ประกอบด้วยโปรแกรมทดสอบประสิทธิภาพอื่นๆ อีกหลายตัวที่แสดงอยู่ในหน้านี้ เพื่อให้การใช้งานง่ายขึ้น
POV-Ray – การเรนเดอร์ภาพ 3 มิติ
Tak (ฟังก์ชัน) – เกณฑ์มาตรฐานอย่างง่ายที่ใช้ทดสอบประสิทธิภาพของการเรียกซ้ำ
TATP Benchmark – มาตรฐานการวัดประสิทธิภาพการประมวลผลธุรกรรมแอปพลิเคชันโทรคมนาคม
TPoX – เกณฑ์มาตรฐานการประมวลผลธุรกรรม XML สำหรับฐานข้อมูล XML
VUP (VAX unit of performance) – หรือเรียกอีกอย่างว่า VAX MIPS
Whetstone – ประสิทธิภาพการคำนวณเลขทศนิยม มักรายงานเป็นล้านคำสั่ง Whetstone ต่อวินาที (MWIPS)

การทดสอบประสิทธิภาพระบบปฏิบัติการ Microsoft Windows

คริสตัลดิสก์มาร์ค
Underwriters Laboratories (UL) : 3DMark , PCMark
เกณฑ์มาตรฐานสวรรค์
พีฟาสต์
เกณฑ์มาตรฐานการซ้อนทับ
ซูเปอร์พีไอ
ซูเปอร์ไพรม์
หินลับมีด
เครื่องมือประเมินระบบของ Windows (Windows System Assessment Tool)ซึ่งรวมอยู่ใน Windows Vista และเวอร์ชันที่ใหม่กว่านั้น มีดัชนีที่ช่วยให้ผู้ใช้สามารถประเมินระบบของตนได้อย่างง่ายดาย
Worldbench (เลิกใช้งานแล้ว)

คนอื่น

AnTuTu – นิยมใช้ในโทรศัพท์และอุปกรณ์ที่ใช้ชิป ARM
Byte Sieve - เดิมทีใช้ทดสอบประสิทธิภาพของภาษา แต่ก็ถูกนำมาใช้กันอย่างแพร่หลายในฐานะเครื่องมือวัดประสิทธิภาพการทำงานของเครื่องคอมพิวเตอร์เช่นกัน
Creative Computing Benchmark – เครื่องมือเปรียบเทียบประสิทธิภาพของ ภาษาโปรแกรม BASICบนแพลตฟอร์มต่างๆ เปิดตัวครั้งแรกในปี 1983
Geekbench – โปรแกรมทดสอบประสิทธิภาพข้ามแพลตฟอร์มสำหรับ Windows, Linux, macOS, iOS และ Android
iCOMP – ผลการเปรียบเทียบประสิทธิภาพของไมโครโปรเซสเซอร์จาก Intel ซึ่งเผยแพร่โดย Intel
คอร์เนอร์สโตน
Novabench - โปรแกรมทดสอบประสิทธิภาพคอมพิวเตอร์สำหรับ Microsoft Windows, macOS และ Linux
การจัดอันดับประสิทธิภาพ – รูปแบบการสร้างแบบจำลองที่ AMD และ Cyrix ใช้เพื่อสะท้อนประสิทธิภาพเชิงเปรียบเทียบ ซึ่งโดยปกติจะเปรียบเทียบกับผลิตภัณฑ์คู่แข่ง
การทดสอบประสิทธิภาพ Rugg/Feldman - หนึ่งในการทดสอบประสิทธิภาพไมโครคอมพิวเตอร์รุ่นแรกๆ จากปี 1977
SunSpider – โปรแกรมทดสอบความเร็วเบราว์เซอร์
UserBenchmark - โปรแกรมทดสอบประสิทธิภาพพีซี
VMmark – ชุดโปรแกรมทดสอบประสิทธิภาพการจำลองเสมือน (virtualization benchmark suite)
แบบทดสอบ Will Smith กินสปาเก็ตตี้ - สำหรับโมเดลแปลงข้อความเป็นวิดีโอ

ดูเพิ่มเติม

การเปรียบเทียบมาตรฐาน (มุมมองทางธุรกิจ)
ตัวชี้วัดผลงาน
เกณฑ์มาตรฐานการบีบอัดแบบไม่สูญเสียข้อมูล
เครื่องตรวจสอบประสิทธิภาพการทำงาน
ชุดทดสอบ – ชุดของกรณีทดสอบที่ออกแบบมาเพื่อแสดงให้เห็นว่าโปรแกรมซอฟต์แวร์มีพฤติกรรมตามที่กำหนดไว้

อ่านเพิ่มเติม

เกรย์, จิม, บรรณาธิการ (1993). คู่มือมาตรฐานสำหรับระบบฐานข้อมูลและธุรกรรม . ชุดหนังสือ Morgan Kaufmann ในสาขาระบบการจัดการข้อมูล (ฉบับที่ 2). สำนักพิมพ์ Morgan Kaufmann Publishers, Inc. ISBN 1-55860-292-5.
Scalzo, Bert; Kline, Kevin; Fernandez, Claudia; Burleson, Donald K.; Ault, Mike (2007). วิธีการปฏิบัติในการวัดประสิทธิภาพฐานข้อมูลสำหรับ Oracle และ SQL Server . Rampant TechPress. ISBN 978-0-9776715-3-3.
Nambiar, Raghunath; Poess, Meikel, บรรณาธิการ (2009). การประเมินผลการปฏิบัติงานและการเปรียบเทียบมาตรฐาน . Springer. ISBN 978-3-642-10423-7.

ลิงก์ภายนอก

Lewis, Byron C.; Crews, Albert E. (1985). "วิวัฒนาการของการเปรียบเทียบประสิทธิภาพในฐานะเทคนิคการประเมินประสิทธิภาพคอมพิวเตอร์" MIS Quarterly . 9 (1): 7– 16. doi : 10.2307/249270 . ISSN 0276-7783 . JSTOR 249270 .ช่วงเวลา: 1962-1976

Wikimedia Commons มีสื่อที่เกี่ยวข้องกับเกณฑ์มาตรฐาน (ด้านคอมพิวเตอร์ )

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Benchmark_(computing)&oldid=1351551064 "

เกณฑ์มาตรฐาน (ด้านการคำนวณ)

วัตถุประสงค์

ฟังก์ชันการทำงาน

ความท้าทาย

หลักการเปรียบเทียบมาตรฐาน

ประเภทของเกณฑ์มาตรฐาน

เกณฑ์มาตรฐานทั่วไป

มาตรฐานอุตสาหกรรม (ผ่านการตรวจสอบและยืนยันได้)

เกณฑ์มาตรฐานโอเพนซอร์ส

การทดสอบประสิทธิภาพระบบปฏิบัติการ Microsoft Windows

คนอื่น

ดูเพิ่มเติม

อ่านเพิ่มเติม

ลิงก์ภายนอก

ข้อมูลสำคัญจากบทความ