กลับไปหน้าบทความ

อ่าน 6 นาที

เกณฑ์มาตรฐาน (ด้านการคำนวณ)

ในด้าน การคำนวณ เกณฑ์มาตรฐาน คือการกระทำในการเรียกใช้ โปรแกรมคอมพิวเตอร์ ชุดโปรแกรม หรือการดำเนินการอื่นๆ เพื่อประเมิน ประสิทธิภาพ เชิงสัมพัทธ์ ของวัตถุ โดยปกติจะทำการ ทดสอบ...

เกณฑ์มาตรฐาน (ด้านการคำนวณ)

( เรียนรู้วิธีและเวลาในการลบข้อความนี้ )
ตัวอย่างกราฟิกที่ใช้เป็นเกณฑ์มาตรฐานในการทดสอบประสิทธิภาพของเอนจิ้นOGRE

ในด้านการคำนวณเกณฑ์มาตรฐานคือการกระทำในการเรียกใช้โปรแกรมคอมพิวเตอร์ชุดโปรแกรม หรือการดำเนินการอื่นๆ เพื่อประเมินประสิทธิภาพ เชิงสัมพัทธ์ ของวัตถุ โดยปกติจะทำการทดสอบและทดลองมาตรฐานจำนวนหนึ่งกับวัตถุนั้น[ 1 ]

คำว่า"เกณฑ์มาตรฐาน"ยังถูกนำมาใช้กันอย่างแพร่หลายในบริบทของโปรแกรมการเปรียบเทียบเกณฑ์มาตรฐานที่ออกแบบมาอย่างละเอียดถี่ถ้วนอีกด้วย

โดยทั่วไปแล้ว การวัดประสิทธิภาพ (Benchmarking) มักเกี่ยวข้องกับการประเมินคุณลักษณะด้านประสิทธิภาพของฮาร์ดแวร์คอมพิวเตอร์เช่น ประสิทธิภาพ การคำนวณเลขทศนิยมของซีพียูแต่ก็มีบางกรณีที่เทคนิคนี้สามารถนำไปใช้กับซอฟต์แวร์ ได้เช่น กัน ตัวอย่างเช่น การวัดประสิทธิภาพซอฟต์แวร์จะทำกับคอมไพเลอร์หรือระบบจัดการฐานข้อมูล (DBMS)

เกณฑ์มาตรฐานเป็นวิธีการเปรียบเทียบประสิทธิภาพของระบบย่อยต่างๆ ในสถาปัตยกรรม ชิป/ระบบที่แตกต่างกัน การกำหนดเกณฑ์มาตรฐานเป็นส่วนหนึ่งของการบูรณาการอย่างต่อเนื่องเรียกว่า การกำหนดเกณฑ์มาตรฐานอย่างต่อเนื่อง[ 2 ]

วัตถุประสงค์

เมื่อสถาปัตยกรรมคอมพิวเตอร์พัฒนาขึ้น การเปรียบเทียบประสิทธิภาพของระบบคอมพิวเตอร์ต่างๆ โดยดูจากสเปคเพียงอย่างเดียวจึงทำได้ยากขึ้น ดังนั้นจึงมีการพัฒนาการทดสอบที่ช่วยให้สามารถเปรียบเทียบสถาปัตยกรรมที่แตกต่างกันได้ ตัวอย่างเช่น โปรเซสเซอร์ Pentium 4โดยทั่วไปทำงานที่ความถี่สัญญาณนาฬิกาสูงกว่า โปรเซสเซอร์ Athlon XPหรือPowerPCซึ่งไม่ได้หมายความว่าจะมีพลังการประมวลผลมากกว่าเสมอไป โปรเซสเซอร์ที่มีความถี่สัญญาณนาฬิกาต่ำกว่าอาจทำงานได้ดีเท่าหรือดีกว่าโปรเซสเซอร์ที่ทำงานที่ความถี่สูงกว่า ดูBogoMipsและตำนานเมกะเฮิร์ตซ์

การทดสอบประสิทธิภาพ (Benchmark) ถูกออกแบบมาเพื่อจำลองภาระงานเฉพาะประเภทหนึ่งบนส่วนประกอบหรือระบบ การทดสอบประสิทธิภาพแบบสังเคราะห์ (Synthetic benchmark) ทำเช่นนั้นโดยการสร้างโปรแกรมพิเศษที่จำลองภาระงานนั้นให้กับส่วนประกอบ ในขณะที่การทดสอบประสิทธิภาพแบบแอปพลิเคชัน (Application benchmark) จะรันโปรแกรมที่ใช้งานจริงบนระบบ แม้ว่าการทดสอบประสิทธิภาพแบบแอปพลิเคชันมักจะให้การวัดประสิทธิภาพในโลกแห่งความเป็นจริงบนระบบที่กำหนดได้ดีกว่ามาก แต่การทดสอบประสิทธิภาพแบบสังเคราะห์ก็มีประโยชน์สำหรับการทดสอบส่วนประกอบแต่ละชิ้น เช่นฮาร์ดดิสก์หรืออุปกรณ์เครือข่าย

การทดสอบประสิทธิภาพมีความสำคัญอย่างยิ่งในการออกแบบซีพียูช่วยให้สถาปนิกโปรเซสเซอร์สามารถวัดและตัดสินใจเลือกข้อดีข้อเสียในด้านสถาปัตยกรรมระดับไมโครได้ ตัวอย่างเช่น หากการทดสอบประสิทธิภาพดึงเอาอัลกอริธึม หลัก ของแอปพลิเคชันออกมา ก็จะประกอบด้วยส่วนที่ไวต่อประสิทธิภาพของแอปพลิเคชันนั้น การรันโค้ดส่วนเล็กๆ นี้บนโปรแกรมจำลองที่แม่นยำระดับรอบการทำงาน สามารถให้เบาะแสเกี่ยวกับวิธีการปรับปรุงประสิทธิภาพได้

นับตั้งแต่ปี 1995 เป็นต้นมา ชุดเกณฑ์มาตรฐาน SPECได้รับการใช้งานอย่างแพร่หลาย

บริษัทผู้ผลิตคอมพิวเตอร์มักปรับแต่งระบบของตนเพื่อเพิ่มประสิทธิภาพในการทดสอบมาตรฐาน ซึ่งไม่ได้สะท้อนการใช้งานจริง แต่ปัจจุบันการทดสอบมาตรฐานได้รับการปรับปรุงให้ใกล้เคียงกับการใช้งานจริงมากขึ้น เพื่อให้การปรับแต่งใดๆ ส่งผลต่อประสิทธิภาพการทำงานของแอปพลิเคชันอย่างแท้จริง

ผู้จำหน่ายซอฟต์แวร์ยังใช้เกณฑ์มาตรฐานในการทำการตลาด เช่น "สงครามเกณฑ์มาตรฐาน" ระหว่าง ผู้ผลิต ฐานข้อมูลเชิงสัมพันธ์ คู่แข่ง ในช่วงทศวรรษ 1980 และ 1990 โดยทั่วไป บริษัทต่างๆ จะรายงานเฉพาะเกณฑ์มาตรฐาน (หรือแง่มุมของเกณฑ์มาตรฐาน) ที่แสดงให้เห็นถึงผลิตภัณฑ์ของตนในแง่ดีที่สุดเท่านั้น นอกจากนี้ยังเป็นที่ทราบกันดีว่าพวกเขาอาจบิดเบือนความสำคัญของเกณฑ์มาตรฐาน เพื่อแสดงให้เห็นถึงผลิตภัณฑ์ของตนในแง่ดีที่สุดเช่นกัน[ 3 ] [ 4 ]

เมื่อประสิทธิภาพเป็นสิ่งสำคัญ เกณฑ์วัดประสิทธิภาพเพียงอย่างเดียวที่สำคัญคือชุดแอปพลิเคชันของสภาพแวดล้อมเป้าหมาย

ฟังก์ชันการทำงาน

คุณสมบัติของซอฟต์แวร์การวัดประสิทธิภาพอาจรวมถึงการบันทึก/ ส่งออกขั้นตอนการทำงานไปยัง ไฟล์ สเปรดชีตการแสดงภาพ เช่น การวาดกราฟเส้นหรือ ไทล์ ที่มีรหัสสีและการหยุดกระบวนการชั่วคราวเพื่อให้สามารถดำเนินการต่อได้โดยไม่ต้องเริ่มต้นใหม่ ซอฟต์แวร์อาจมีคุณสมบัติเพิ่มเติมเฉพาะสำหรับวัตถุประสงค์ของมัน ตัวอย่างเช่น ซอฟต์แวร์การวัดประสิทธิภาพดิสก์อาจสามารถเริ่มวัดความเร็วของดิสก์ภายในช่วงที่กำหนดของดิสก์แทนที่จะวัดทั้งดิสก์ วัดความเร็วและความหน่วง ในการอ่าน แบบสุ่มมีคุณสมบัติ "การสแกนอย่างรวดเร็ว" ซึ่งวัดความเร็วผ่านตัวอย่างในช่วงเวลาและขนาดที่กำหนด และอนุญาตให้ระบุ ขนาด บล็อกข้อมูลซึ่งหมายถึงจำนวนไบต์ที่ร้องขอต่อคำขออ่าน[ 5 ]

ความท้าทาย

การเปรียบเทียบมาตรฐานไม่ใช่เรื่องง่าย และมักต้องผ่านกระบวนการหลายรอบเพื่อให้ได้ข้อสรุปที่คาดการณ์ได้และมีประโยชน์ การตีความข้อมูลการเปรียบเทียบมาตรฐานก็ยากอย่างยิ่งเช่นกัน นี่คือรายการความท้าทายทั่วไปบางส่วน:

  • โดยทั่วไปแล้ว ผู้ผลิตมักปรับแต่งผลิตภัณฑ์ของตนให้ตรงกับมาตรฐานอุตสาหกรรมต่างๆ Norton SysInfo (SI) นั้นปรับแต่งได้ง่ายเป็นพิเศษ เนื่องจากเน้นไปที่ความเร็วในการทำงานหลายอย่างพร้อมกัน จึงควรใช้ความระมัดระวังอย่างยิ่งในการตีความผลลัพธ์ดังกล่าว
  • ผู้จำหน่ายบางรายถูกกล่าวหาว่า "โกง" ในการทดสอบประสิทธิภาพ — ออกแบบระบบของตนเพื่อให้ได้ตัวเลขการทดสอบประสิทธิภาพที่สูงขึ้นมาก แต่ไม่ได้มีประสิทธิภาพตามภาระงานจริงที่คาดการณ์ไว้[ 6 ]
  • เกณฑ์วัดประสิทธิภาพหลายอย่างมุ่งเน้นไปที่ความเร็วในการประมวลผล เพียงอย่างเดียว โดย ละเลยคุณสมบัติสำคัญอื่นๆ ของระบบคอมพิวเตอร์ เช่น:
    • คุณภาพของการบริการ นอกเหนือจากประสิทธิภาพการทำงานโดยตรง ตัวอย่างของคุณภาพการบริการที่วัดไม่ได้ ได้แก่ ความปลอดภัย ความพร้อมใช้งาน ความน่าเชื่อถือ ความสมบูรณ์ของการดำเนินการ ความสามารถในการให้บริการ ความสามารถในการขยายขนาด (โดยเฉพาะความสามารถในการเพิ่มหรือจัดสรรกำลังการผลิตใหม่ได้อย่างรวดเร็วและไม่หยุดชะงัก) เป็นต้น มักมีการแลกเปลี่ยนที่แท้จริงระหว่างคุณภาพการบริการเหล่านี้ และทั้งหมดมีความสำคัญในด้านการประมวลผลทางธุรกิจ ข้อกำหนดมาตรฐานของ Transaction Processing Performance Councilได้กล่าวถึงข้อกังวลเหล่านี้บางส่วนโดยการระบุ การทดสอบคุณสมบัติ ACIDกฎการขยายขนาดของฐานข้อมูล และข้อกำหนดระดับการบริการ
    • โดยทั่วไปแล้ว เกณฑ์มาตรฐานไม่ได้วัดต้นทุนรวมในการเป็นเจ้าของ (Total Cost of Ownership หรือ TCO) ข้อกำหนดของเกณฑ์มาตรฐาน Transaction Processing Performance Council (PTMP) ได้แก้ไขข้อกังวลนี้บางส่วนโดยระบุว่าต้องมีการรายงานตัวชี้วัดราคา/ประสิทธิภาพเพิ่มเติมจากตัวชี้วัดประสิทธิภาพดิบ โดยใช้ สูตร TCO แบบง่าย อย่างไรก็ตาม ต้นทุนที่รายงานนั้นเป็นเพียงส่วนหนึ่งเท่านั้น และผู้ขายบางรายอาจกำหนดราคาเฉพาะ (และเฉพาะ) สำหรับเกณฑ์มาตรฐาน โดยออกแบบ "รุ่นพิเศษสำหรับเกณฑ์มาตรฐาน" ที่มีราคาต่ำกว่าความเป็นจริง แม้แต่การเบี่ยงเบนเพียงเล็กน้อยจากแพ็คเกจเกณฑ์มาตรฐานก็ส่งผลให้ราคาสูงขึ้นมากในประสบการณ์จริง
    • ภาระด้านสิ่งอำนวยความสะดวก (พื้นที่ พลังงาน และระบบระบายความร้อน) เมื่อใช้พลังงานมากขึ้น ระบบพกพาจะมีอายุการใช้งานแบตเตอรี่สั้นลงและต้องชาร์จบ่อยขึ้น เซิร์ฟเวอร์ที่ใช้พลังงานและ/หรือพื้นที่มากขึ้นอาจไม่สามารถติดตั้งได้ภายในข้อจำกัดด้านทรัพยากรของศูนย์ข้อมูลที่มีอยู่ รวมถึงข้อจำกัดด้านระบบระบายความร้อน มีข้อแลกเปลี่ยนที่แท้จริง เนื่องจากเซมิคอนดักเตอร์ส่วนใหญ่ต้องการพลังงานมากขึ้นเพื่อสลับการทำงานได้เร็วขึ้น ดูเพิ่มเติมที่ ประสิทธิภาพต่อวัตต์
    • ในระบบฝังตัวบางระบบที่หน่วยความจำมีต้นทุนสูง การเพิ่มความหนาแน่นของโค้ดสามารถช่วยลดต้นทุนได้อย่างมาก
  • โดยทั่วไปแล้ว เกณฑ์วัดประสิทธิภาพของผู้จำหน่ายมักละเลยข้อกำหนดด้านความสามารถในการประมวลผลสำหรับการพัฒนา การทดสอบ และการกู้คืนระบบในกรณีเกิดภัยพิบัติผู้จำหน่ายมักรายงานเฉพาะสิ่งที่อาจจำเป็นสำหรับความสามารถในการใช้งานจริงเท่านั้น เพื่อให้ราคาเริ่มต้นดูต่ำที่สุดเท่าที่จะเป็นไปได้
  • การทดสอบประสิทธิภาพกำลังประสบปัญหาในการปรับตัวให้เข้ากับเซิร์ฟเวอร์ที่กระจายตัวอยู่เป็นวงกว้าง โดยเฉพาะอย่างยิ่งเซิร์ฟเวอร์ที่มีความอ่อนไหวเป็นพิเศษต่อโครงสร้างเครือข่าย การเกิดขึ้นของระบบประมวลผลแบบกริดโดยเฉพาะอย่างยิ่ง ทำให้การทดสอบประสิทธิภาพซับซ้อนยิ่งขึ้น เนื่องจากภาระงานบางอย่าง "เป็นมิตรกับระบบกริด" ในขณะที่ภาระงานอื่นๆ ไม่เป็นเช่นนั้น
  • ผู้ใช้งานอาจมีมุมมองต่อประสิทธิภาพการทำงานที่แตกต่างไปจากที่เกณฑ์มาตรฐานระบุไว้ โดยเฉพาะอย่างยิ่ง ผู้ใช้งานชื่นชอบความสามารถในการคาดการณ์ได้ เช่น เซิร์ฟเวอร์ที่ตรงตามหรือเกินกว่าข้อตกลงระดับบริการ เสมอ เกณฑ์มาตรฐานมักเน้นคะแนนเฉลี่ย (มุมมองด้านไอที) มากกว่าเวลาตอบสนองสูงสุดในกรณีที่เลวร้ายที่สุด ( มุมมองด้าน การประมวลผลแบบเรียลไทม์ ) หรือค่าเบี่ยงเบนมาตรฐานต่ำ (มุมมองของผู้ใช้)
  • สถาปัตยกรรมเซิร์ฟเวอร์จำนวนมากจะเสื่อมประสิทธิภาพลงอย่างมากเมื่อมีการใช้งานในระดับสูง (ใกล้ 100%) — "ประสิทธิภาพตกฮวบ" — และการทดสอบประสิทธิภาพควรคำนึงถึงปัจจัยนี้ด้วย (แต่ส่วนใหญ่มักไม่ทำ) โดยเฉพาะอย่างยิ่ง ผู้ผลิตมักจะเผยแพร่ผลการทดสอบประสิทธิภาพเซิร์ฟเวอร์ที่ระดับการใช้งานต่อเนื่องประมาณ 80% ซึ่งเป็นสถานการณ์ที่ไม่สมจริง และไม่ได้บันทึกสิ่งที่เกิดขึ้นกับระบบโดยรวมเมื่อความต้องการใช้งานเพิ่มสูงขึ้นเกินระดับนั้น
  • การทดสอบประสิทธิภาพจำนวนมากมุ่งเน้นไปที่แอปพลิเคชันเดียว หรือแม้แต่แอปพลิเคชันระดับเดียว โดยละเลยแอปพลิเคชันอื่นๆ ปัจจุบันศูนย์ข้อมูลส่วนใหญ่กำลังนำเทคโนโลยีเวอร์ชวลไลเซชัน มาใช้ กันอย่างแพร่หลายด้วยเหตุผลหลายประการ และการทดสอบประสิทธิภาพยังคงตามไม่ทันความเป็นจริงที่แอปพลิเคชันและแอปพลิเคชันระดับต่างๆ ทำงานพร้อมกันบนเซิร์ฟเวอร์แบบรวมศูนย์
  • มีเกณฑ์มาตรฐานคุณภาพสูงน้อยมาก (หรืออาจไม่มีเลย) ที่ช่วยวัดประสิทธิภาพของการประมวลผลแบบแบตช์ โดยเฉพาะอย่างยิ่งการประมวลผลแบบแบตช์และการประมวลผลออนไลน์ที่มีปริมาณมากพร้อมกันการประมวลผลแบบแบตช์มักเน้นไปที่ความสามารถในการคาดการณ์ได้ว่างานที่ใช้เวลานานจะเสร็จสมบูรณ์อย่างถูกต้องก่อนกำหนดเวลา เช่น สิ้นเดือนหรือสิ้นปีงบประมาณ กระบวนการทางธุรกิจหลักที่สำคัญหลายอย่างใช้การประมวลผลแบบแบตช์ และน่าจะเป็นเช่นนั้นเสมอ เช่น การเรียกเก็บเงิน
  • สถาบันการเปรียบเทียบมาตรฐานมักเพิกเฉยหรือไม่ปฏิบัติตามวิธีการทางวิทยาศาสตร์ขั้นพื้นฐาน ซึ่งรวมถึงแต่ไม่จำกัดเพียง: ขนาดตัวอย่างเล็ก ขาดการควบคุมตัวแปร และความสามารถในการทำซ้ำผลลัพธ์ที่จำกัด[ 7 ]

หลักการเปรียบเทียบมาตรฐาน

มีลักษณะสำคัญเจ็ดประการสำหรับเกณฑ์มาตรฐาน[ 8 ]คุณสมบัติหลักเหล่านี้ได้แก่:

  1. ความเหมาะสม: เกณฑ์มาตรฐานควรวัดคุณลักษณะที่ค่อนข้างสำคัญ
  2. ความครอบคลุม: ตัวชี้วัดประสิทธิภาพมาตรฐานควรได้รับการยอมรับอย่างกว้างขวางจากภาคอุตสาหกรรมและสถาบันการศึกษา
  3. ความเป็นธรรม: ระบบทุกระบบควรได้รับการเปรียบเทียบอย่างยุติธรรม
  4. ความสามารถในการทำซ้ำ: สามารถตรวจสอบผลลัพธ์ของเกณฑ์มาตรฐานได้
  5. ความคุ้มค่า: การทดสอบมาตรฐานมีต้นทุนต่ำ
  6. ความสามารถในการปรับขนาด: การทดสอบประสิทธิภาพควรใช้งานได้กับระบบที่มีทรัพยากรหลากหลายระดับ ตั้งแต่ต่ำไปจนถึงสูง
  7. ความโปร่งใส: ตัวชี้วัดมาตรฐานควรเข้าใจง่าย

ประเภทของเกณฑ์มาตรฐาน

  1. โปรแกรมจริง
  2. การวัดประสิทธิภาพส่วนประกอบ / การวัดประสิทธิภาพระดับไมโคร
    • รูทีนหลักประกอบด้วยโค้ดขนาดเล็กและเฉพาะเจาะจงชิ้นหนึ่ง
    • วัดประสิทธิภาพของส่วนประกอบพื้นฐานของคอมพิวเตอร์[ 9 ]
    • อาจใช้สำหรับการตรวจจับพารามิเตอร์ฮาร์ดแวร์ของคอมพิวเตอร์โดยอัตโนมัติ เช่น จำนวนรีจิสเตอร์ขนาดแคชความหน่วงของหน่วยความจำเป็นต้น
  3. เคอร์เนล
    • ประกอบด้วยรหัสสำคัญ
    • โดยปกติแล้วจะถูกแยกออกมาจากโปรแกรมจริง
    • เคอร์เนลยอดนิยม: ลิเวอร์มอร์ลูป
    • linpack benchmark (ประกอบด้วยโปรแกรมย่อยพีชคณิตเชิงเส้นพื้นฐานที่เขียนด้วยภาษา FORTRAN)
    • ผลลัพธ์แสดงในหน่วย Mflop/s
  4. เกณฑ์มาตรฐานสังเคราะห์
    • ขั้นตอนการเขียนโปรแกรมสำหรับการทดสอบประสิทธิภาพเชิงสังเคราะห์:
      • รวบรวมสถิติของการดำเนินการทุกประเภทจากโปรแกรมแอปพลิเคชันหลายโปรแกรม
      • รับสัดส่วนของการดำเนินการแต่ละครั้ง
      • เขียนโปรแกรมโดยอิงตามสัดส่วนข้างต้น
    • ประเภทของดัชนีชี้วัดสังเคราะห์ ได้แก่:
    • นี่คือเกณฑ์มาตรฐานคอมพิวเตอร์อุตสาหกรรมทั่วไปชุดแรกๆ ผลการทดสอบอาจไม่ได้คะแนนสูงเสมอไปบนคอมพิวเตอร์แบบไปป์ไลน์สมัยใหม่
  5. เกณฑ์มาตรฐาน I/O
  6. เกณฑ์มาตรฐานฐานข้อมูล
    • วัดปริมาณงานและเวลาตอบสนองของระบบจัดการฐานข้อมูล (DBMS)
  7. เกณฑ์มาตรฐานแบบขนาน
    • ใช้กับเครื่องที่มีหลายคอร์และ/หรือโปรเซสเซอร์ หรือระบบที่ประกอบด้วยเครื่องหลายเครื่อง

เกณฑ์มาตรฐานทั่วไป

มาตรฐานอุตสาหกรรม (ผ่านการตรวจสอบและยืนยันได้)

เกณฑ์มาตรฐานโอเพนซอร์ส

  • AIM Multiuser Benchmark – ประกอบด้วยรายการทดสอบที่สามารถผสมผสานกันเพื่อสร้าง 'โหลดมิกซ์' ที่จำลองการทำงานของคอมพิวเตอร์เฉพาะอย่างบนระบบปฏิบัติการประเภท UNIX ใดๆ ก็ได้
  • Bonnie++ – โปรแกรมทดสอบประสิทธิภาพระบบไฟล์และฮาร์ดไดรฟ์
  • BRL-CAD – ชุดทดสอบประสิทธิภาพข้ามแพลตฟอร์มที่ไม่ขึ้นกับสถาปัตยกรรมใดๆ โดยอิงจากประสิทธิภาพการเรย์เทรซซิ่งแบบมัลติเธรด มีพื้นฐานมาจาก VAX-11/780 และถูกใช้มาตั้งแต่ปี 1984 เพื่อประเมินประสิทธิภาพ CPU สัมพัทธ์ ความแตกต่างของคอมไพเลอร์ ระดับการปรับแต่ง ความสอดคล้อง ความแตกต่างของสถาปัตยกรรม และความแตกต่างของระบบปฏิบัติการ
  • ความรู้รวมหมู่ – กรอบการทำงานที่ปรับแต่งได้และใช้งานได้หลายแพลตฟอร์ม เพื่อระดมความคิดจากกลุ่มคนจำนวนมากในการวัดประสิทธิภาพและเพิ่มประสิทธิภาพการทำงานของผู้ใช้ (เช่นการเรียนรู้เชิงลึก ) บนฮาร์ดแวร์ต่างๆ ที่อาสาสมัครจัดหาให้
  • Coremark – เกณฑ์มาตรฐานสำหรับการประมวลผลแบบฝังตัว
  • ชุดทดสอบประสิทธิภาพ DEISA – การทดสอบประสิทธิภาพแอปพลิเคชัน HPC ทางวิทยาศาสตร์
  • Dhrystone – ประสิทธิภาพการคำนวณเลขจำนวนเต็ม มักรายงานเป็นหน่วย DMIPS (Dhrystone ล้านคำสั่งต่อวินาที)
  • DiskSpdเครื่องมือแบบบรรทัดคำสั่งสำหรับทดสอบประสิทธิภาพการจัดเก็บข้อมูล ซึ่งสร้างคำขอต่างๆ มากมายต่อไฟล์คอมพิวเตอร์พาร์ติชั่นหรืออุปกรณ์จัดเก็บข้อมูล
  • Fhourstones – เกณฑ์มาตรฐานจำนวนเต็ม
  • HINT – ออกแบบมาเพื่อวัดประสิทธิภาพโดยรวมของ CPU และหน่วยความจำ
  • Iometer – เครื่องมือวัดและวิเคราะห์คุณลักษณะของระบบย่อยอินพุต/เอาต์พุต สำหรับระบบเดี่ยวและระบบแบบคลัสเตอร์
  • IOzone – โปรแกรมทดสอบประสิทธิภาพระบบไฟล์
  • เกณฑ์มาตรฐาน LINPACK – ซึ่งโดยทั่วไปใช้ในการวัดFLOPS
  • ลิเวอร์มอร์ ลูปส์
  • การทดสอบประสิทธิภาพแบบขนานของ NAS
  • NBench – ชุดโปรแกรมทดสอบประสิทธิภาพแบบสังเคราะห์ที่ใช้วัดประสิทธิภาพการคำนวณจำนวนเต็ม การประมวลผลหน่วยความจำ และการคำนวณเลขทศนิยม
  • PAL – มาตรฐานสำหรับระบบจำลองฟิสิกส์แบบเรียลไทม์
  • PerfKitBenchmarker – ชุดเกณฑ์มาตรฐานสำหรับวัดและเปรียบเทียบบริการคลาวด์ต่างๆ
  • Phoronix Test Suite – ชุดโปรแกรมทดสอบประสิทธิภาพแบบโอเพนซอร์สสำหรับ Linux, OpenSolaris, FreeBSD, OSX และ Windows ชุดนี้ประกอบด้วยโปรแกรมทดสอบประสิทธิภาพอื่นๆ อีกหลายตัวที่แสดงอยู่ในหน้านี้ เพื่อให้การใช้งานง่ายขึ้น
  • POV-Ray – การเรนเดอร์ภาพ 3 มิติ
  • Tak (ฟังก์ชัน) – เกณฑ์มาตรฐานอย่างง่ายที่ใช้ทดสอบประสิทธิภาพของการเรียกซ้ำ
  • TATP Benchmark – มาตรฐานการวัดประสิทธิภาพการประมวลผลธุรกรรมแอปพลิเคชันโทรคมนาคม
  • TPoX – เกณฑ์มาตรฐานการประมวลผลธุรกรรม XML สำหรับฐานข้อมูล XML
  • VUP (VAX unit of performance) – หรือเรียกอีกอย่างว่า VAX MIPS
  • Whetstone – ประสิทธิภาพการคำนวณเลขทศนิยม มักรายงานเป็นล้านคำสั่ง Whetstone ต่อวินาที (MWIPS)

การทดสอบประสิทธิภาพระบบปฏิบัติการ Microsoft Windows

คนอื่น

  • AnTuTu – นิยมใช้ในโทรศัพท์และอุปกรณ์ที่ใช้ชิป ARM
  • Byte Sieve - เดิมทีใช้ทดสอบประสิทธิภาพของภาษา แต่ก็ถูกนำมาใช้กันอย่างแพร่หลายในฐานะเครื่องมือวัดประสิทธิภาพการทำงานของเครื่องคอมพิวเตอร์เช่นกัน
  • Creative Computing Benchmark – เครื่องมือเปรียบเทียบประสิทธิภาพของ ภาษาโปรแกรม BASICบนแพลตฟอร์มต่างๆ เปิดตัวครั้งแรกในปี 1983
  • Geekbench – โปรแกรมทดสอบประสิทธิภาพข้ามแพลตฟอร์มสำหรับ Windows, Linux, macOS, iOS และ Android
  • iCOMP – ผลการเปรียบเทียบประสิทธิภาพของไมโครโปรเซสเซอร์จาก Intel ซึ่งเผยแพร่โดย Intel
  • คอร์เนอร์สโตน
  • Novabench - โปรแกรมทดสอบประสิทธิภาพคอมพิวเตอร์สำหรับ Microsoft Windows, macOS และ Linux
  • การจัดอันดับประสิทธิภาพ – รูปแบบการสร้างแบบจำลองที่ AMD และ Cyrix ใช้เพื่อสะท้อนประสิทธิภาพเชิงเปรียบเทียบ ซึ่งโดยปกติจะเปรียบเทียบกับผลิตภัณฑ์คู่แข่ง
  • การทดสอบประสิทธิภาพ Rugg/Feldman - หนึ่งในการทดสอบประสิทธิภาพไมโครคอมพิวเตอร์รุ่นแรกๆ จากปี 1977
  • SunSpider – โปรแกรมทดสอบความเร็วเบราว์เซอร์
  • UserBenchmark - โปรแกรมทดสอบประสิทธิภาพพีซี
  • VMmark – ชุดโปรแกรมทดสอบประสิทธิภาพการจำลองเสมือน (virtualization benchmark suite)
  • แบบทดสอบ Will Smith กินสปาเก็ตตี้ - สำหรับโมเดลแปลงข้อความเป็นวิดีโอ

ดูเพิ่มเติม

อ่านเพิ่มเติม

  • เกรย์, จิม, บรรณาธิการ (1993). คู่มือมาตรฐานสำหรับระบบฐานข้อมูลและธุรกรรม . ชุดหนังสือ Morgan Kaufmann ในสาขาระบบการจัดการข้อมูล (ฉบับที่ 2). สำนักพิมพ์ Morgan Kaufmann Publishers, Inc. ISBN 1-55860-292-5.
  • Scalzo, Bert; Kline, Kevin; Fernandez, Claudia; Burleson, Donald K.; Ault, Mike (2007). วิธีการปฏิบัติในการวัดประสิทธิภาพฐานข้อมูลสำหรับ Oracle และ SQL Server . Rampant TechPress. ISBN 978-0-9776715-3-3.
  • Nambiar, Raghunath; Poess, Meikel, บรรณาธิการ (2009). การประเมินผลการปฏิบัติงานและการเปรียบเทียบมาตรฐาน . Springer. ISBN 978-3-642-10423-7.
  • Lewis, Byron C.; Crews, Albert E. (1985). "วิวัฒนาการของการเปรียบเทียบประสิทธิภาพในฐานะเทคนิคการประเมินประสิทธิภาพคอมพิวเตอร์" MIS Quarterly . 9 (1): 7– 16. doi : 10.2307/249270 . ISSN  0276-7783 . JSTOR  249270 .ช่วงเวลา: 1962-1976

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Benchmark_(computing)&oldid=1351551064 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ เกณฑ์มาตรฐาน (ด้านการคำนวณ)

ในด้าน การคำนวณ เกณฑ์มาตรฐาน คือการกระทำในการเรียกใช้ โปรแกรมคอมพิวเตอร์ ชุดโปรแกรม หรือการดำเนินการอื่นๆ เพื่อประเมิน ประสิทธิภาพ เชิงสัมพัทธ์ ของวัตถุ โดยปกติจะทำการ ทดสอบ...

วัตถุประสงค์

เมื่อ สถาปัตยกรรมคอมพิวเตอร์ พัฒนาขึ้น การเปรียบเทียบประสิทธิภาพของระบบคอมพิวเตอร์ต่างๆ โดยดูจากสเปคเพียงอย่างเดียวจึงทำได้ยากขึ้น ดังนั้นจึงมีการพัฒนาการทดสอบที่ช่วยให้สามารถเปรียบเทียบสถาปัตยกรรมที่แตกต่างกันได้ ตัวอย่างเช่น โปรเซสเซอร์ Pentium 4...

ฟังก์ชันการทำงาน

คุณสมบัติของซอฟต์แวร์การวัดประสิทธิภาพอาจรวมถึงการบันทึก/ ส่งออก ขั้นตอนการทำงานไปยัง ไฟล์ สเปรดชีต การแสดงภาพ เช่น การวาด กราฟเส้น หรือ ไทล์ ที่มีรหัสสี และการหยุดกระบวนการชั่วคราวเพื่อให้สามารถดำเนินการต่อได้โดยไม่ต้องเริ่มต้นใหม่...

ความท้าทาย

การเปรียบเทียบมาตรฐานไม่ใช่เรื่องง่าย และมักต้องผ่านกระบวนการหลายรอบเพื่อให้ได้ข้อสรุปที่คาดการณ์ได้และมีประโยชน์ การตีความข้อมูลการเปรียบเทียบมาตรฐานก็ยากอย่างยิ่งเช่นกัน นี่คือรายการความท้าทายทั่วไปบางส่วน: