กลับไปหน้าบทความ

อ่าน 6 นาที

เมทริกซ์ของกูเกิล

ทุกหน้าต้องการการล้างข้อมูล/ค้นหาโดย Google/การวิเคราะห์ลิงค์/แบบจำลองของมาร์คอฟ

เมทริกซ์ของ Google เป็น เมทริกซ์สุ่มชนิดพิเศษที่ใช้ใน อัลกอริทึม PageRankของGoogleเมทริกซ์นี้แสดงถึงกราฟที่มีขอบแทนลิงก์ระหว่างหน้าต่างๆ จากนั้นสามารถสร้าง PageRank...

เมทริกซ์ของกูเกิล

( เรียนรู้วิธีและเวลาในการลบข้อความนี้ )
รูปที่ 1. เมทริกซ์ของเครือข่ายบทความวิกิพีเดียของ Google ซึ่งเขียนขึ้นบนพื้นฐานของดัชนี PageRank; แสดงส่วนย่อยขององค์ประกอบเมทริกซ์ 200 x 200 อันดับแรก ขนาดรวม N=3282257 (จาก[ 1 ] )

เมทริกซ์ของ Google เป็น เมทริกซ์สุ่มชนิดพิเศษที่ใช้ใน อัลกอริทึม PageRankของGoogleเมทริกซ์นี้แสดงถึงกราฟที่มีขอบแทนลิงก์ระหว่างหน้าต่างๆ จากนั้นสามารถสร้าง PageRank ของแต่ละหน้าได้แบบวนซ้ำจากเมทริกซ์ของ Google โดยใช้วิธี Power Methodอย่างไรก็ตาม เพื่อให้ Power Method ลู่เข้า เมทริกซ์จะต้องเป็นเมทริกซ์สุ่ม ไม่สามารถลดรูปได้และ ไม่เป็นคาบ

เมทริกซ์ประชิดAและเมทริกซ์มาร์คอฟS

ในการสร้างเมทริกซ์G ของ Google เราต้องสร้างเมทริกซ์ความสัมพันธ์A ก่อน ซึ่งเป็นเมทริกซ์ที่แสดงถึงความสัมพันธ์ระหว่างหน้าเว็บหรือโหนดต่างๆ

สมมติว่ามีNหน้า เราสามารถกรอกข้อมูลในตารางA ได้ โดยทำดังนี้:

  1. ค่าในเมทริกซ์จะเป็น 1 ถ้าโหนดหนึ่งเชื่อมโยงกับอีกโหนดหนึ่งและจะเป็น 0 ถ้าไม่ใช่ นี่คือเมทริกซ์ความสัมพันธ์ของลิงก์
  2. เมทริกซ์S ที่เกี่ยวข้อง กับการเปลี่ยนสถานะในห่วงโซ่มาร์คอฟของเครือข่ายที่กำหนด จะถูกสร้างขึ้นจาก เมทริก ซ์ Aโดยการหารองค์ประกอบของคอลัมน์ "j" ด้วยจำนวน โดยที่คือจำนวนรวมของลิงก์ขาออกจากโหนด  jไปยังโหนดอื่นๆ ทั้งหมด คอลัมน์ที่มี องค์ประกอบ เมทริกซ์เป็นศูนย์ซึ่งสอดคล้องกับโหนดที่ไม่มีลิงก์ จะถูกแทนที่ด้วยค่าคงที่1/Nกระบวนการนี้จะเพิ่มลิงก์จากทุกโหนดปลายทาง (สถานะที่ไม่มีลิงก์) ไปยังทุกโหนดอื่นๆ
  3. จากโครงสร้างของเมทริกซ์ S ผลรวมของทุกองค์ประกอบในคอลัมน์ใดๆ จะเท่ากับหนึ่ง ด้วยวิธีนี้ เมทริกซ์Sจึงมีความนิยามทางคณิตศาสตร์ที่ดี และจัดอยู่ในกลุ่มของลูกโซ่ Markov และกลุ่มของตัวดำเนินการ Perron-Frobenius ซึ่งทำให้SเหมาะสมสำหรับอัลกอริทึมPageRank

การสร้างเมทริกซ์ Gของ Google

รูปที่ 2 เมทริกซ์ Google ของเครือข่ายมหาวิทยาลัยเคมบริดจ์ (2006) องค์ประกอบเมทริกซ์แบบหยาบเขียนตามดัชนี PageRank ขนาดรวม N=212710 แสดงไว้ (จาก[ 1 ] )

จากนั้นเมทริกซ์ Google สุดท้าย G สามารถแสดงได้ผ่านSดังนี้:

ตามโครงสร้างแล้ว ผลรวมขององค์ประกอบที่ไม่เป็นลบทั้งหมดภายในแต่ละคอลัมน์ของเมทริกซ์จะมีค่าเท่ากับหนึ่ง ค่าสัมประสิทธิ์เชิงตัวเลขนี้เรียกว่า ตัวประกอบลดทอน (damping factor)

โดยปกติSเป็นเมทริกซ์แบบเบาบางและสำหรับเครือข่ายทิศทางสมัยใหม่จะมีองค์ประกอบที่ไม่เป็นศูนย์เพียงประมาณสิบตัวในแถวหรือคอลัมน์ ดังนั้นจึงต้องใช้การคูณเพียงประมาณ 10 Nครั้งเพื่อคูณเวกเตอร์ด้วยเมทริกซ์  G [ 2 ] [ 3 ]

ตัวอย่างเมทริกซ์ของ Google

ตัวอย่างของการสร้างเมทริกซ์โดยใช้สมการ (1) ภายในเครือข่ายแบบง่ายมีอยู่ในบทความ CheiRank

สำหรับเมทริกซ์จริง Google ใช้ปัจจัยการลดทอนประมาณ 0.85 [ 2 ] [ 3 ] [ 4 ]เงื่อนไขนี้ให้ความน่าจะเป็นที่ผู้ใช้จะกระโดดไปยังหน้าใดก็ได้แบบสุ่ม เมทริกซ์นี้จัดอยู่ในกลุ่มตัวดำเนินการ Perron-Frobeniusของ ห่วง โซ่ Markov [ 2 ] ตัวอย่างโครงสร้างเมทริกซ์ของ Google แสดงในรูปที่ 1 สำหรับเครือข่ายไฮเปอร์ลิงก์บทความ Wikipedia ในปี 2009 ในขนาดเล็ก และในรูปที่ 2 สำหรับเครือข่ายมหาวิทยาลัยเคมบริดจ์ในปี 2006 ในขนาดใหญ่

สเปกตรัมและสถานะเฉพาะของเมทริกซ์G

รูปที่ 3 สเปกตรัมของค่าลักษณะเฉพาะของเมทริกซ์ Google ของมหาวิทยาลัยเคมบริดจ์จากรูปที่ 2 จุดสีน้ำเงินแสดงค่าลักษณะเฉพาะของพื้นที่ย่อยที่แยก จุดสีแดงแสดงค่าลักษณะเฉพาะของส่วนประกอบหลัก (จาก[ 5 ] )

เนื่องจากมีค่าไอเกนสูงสุดเพียงค่าเดียวที่มีเวกเตอร์ไอเกนขวาที่สอดคล้องกันซึ่งมีองค์ประกอบที่ไม่เป็นลบซึ่งสามารถมองได้ว่าเป็นการกระจายความน่าจะเป็นแบบคงที่[ 2 ]ความน่าจะเป็นเหล่านี้เรียงลำดับตามค่าที่ลดลงจะให้เวกเตอร์ PageRank พร้อมกับ PageRank ที่ Google Search ใช้ในการจัดอันดับเว็บเพจ โดยปกติแล้วสำหรับ World Wide Web จะมีค่า โดยที่จำนวนโหนดที่มีค่า PageRank ที่กำหนดจะแปรผันตามโดยมีเลขชี้กำลัง[ 6 ] [ 7 ]เวกเตอร์ไอเกนซ้ายที่มีองค์ประกอบเมทริกซ์คงที่ โดยที่ค่าไอเกนทั้งหมดจะเคลื่อนที่ตาม ยกเว้นค่าไอเก นสูงสุดซึ่งยังคงไม่เปลี่ยนแปลง[ 2 ]เวกเตอร์ PageRank จะแปรผันตามแต่เวกเตอร์ไอเกนอื่นๆ ที่มีค่ายังคงไม่เปลี่ยนแปลงเนื่องจากความเป็นตั้งฉากกับเวกเตอร์ซ้ายคงที่ที่ ช่องว่าง ระหว่างและค่าไอเกนอื่นๆ ทำให้เกิดการลู่เข้าอย่างรวดเร็วของเวกเตอร์เริ่มต้นแบบสุ่มไปยัง PageRank ประมาณหลังจากคูณเมทริกซ์ 50 ครั้ง

รูปที่ 4 การกระจายค่าลักษณะเฉพาะของเมทริกซ์ Google ในระนาบเชิงซ้อนสำหรับเครือข่ายพจนานุกรม: Roget (A, N=1022), ODLIS (B, N=2909) และ FOLDOC (C, N=13356); เครือข่าย WWW ของมหาวิทยาลัยในสหราชอาณาจักร: มหาวิทยาลัยเวลส์ (คาร์ดิฟฟ์) (D, N=2778), มหาวิทยาลัยเบอร์มิงแฮมซิตี้ (E, N=10631), มหาวิทยาลัยคีล (สแตฟฟอร์ดเชียร์) (F, N=11437), มหาวิทยาลัยนอตติงแฮมเทรนต์ (G, N=12660), มหาวิทยาลัยลิเวอร์พูลจอห์นมัวร์ส (H, N=13578) (ข้อมูลสำหรับมหาวิทยาลัยเป็นของปี 2002) (จาก[ 8 ] )

โดย ทั่วไปเมทริกซ์ จะมีค่าไอเกนที่เสื่อมสภาพจำนวนมาก (ดูเช่น [6] [ 8 ] ) ตัวอย่างของสเปกตรัมค่าไอเกนของเมทริกซ์ Google ของเครือข่ายทิศทางต่างๆ แสดงในรูปที่ 3 จาก[ 5 ]และรูปที่ 4 จาก[ 8 ]

เมทริกซ์ Google ยังสามารถสร้างขึ้นสำหรับเครือข่าย Ulam ที่สร้างขึ้นโดยวิธี Ulam [8] สำหรับแผนที่ไดนามิก คุณสมบัติสเปกตรัมของเมทริกซ์ดังกล่าวมีการกล่าวถึงใน [9,10,11,12,13,15] [ 5 ] [ 9 ]ในหลายกรณี สเปกตรัมจะถูกอธิบายโดยกฎ Weyl แบบแฟรกทัล [10,12]

รูปที่ 5 การกระจายค่าลักษณะเฉพาะในระนาบเชิงซ้อนสำหรับเมทริกซ์ Google ของเคอร์เนล Linux เวอร์ชัน 2.6.32 ที่มีขนาดเมทริกซ์ที่วงกลมหน่วยแสดงด้วยเส้นโค้งทึบ (จาก[ 9 ] )
รูปที่ 6 การกระจายความน่าจะเป็นแบบหยาบสำหรับสถานะไอเกนของเมทริกซ์ Google สำหรับเคอร์เนล Linux เวอร์ชัน 2.6.32 เส้นแนวนอนแสดงเวกเตอร์ไอเกน 64 ตัวแรกที่เรียงลำดับตามแนวตั้งโดย(จาก[ 9 ] )

เมทริกซ์ Google สามารถสร้างขึ้นสำหรับเครือข่ายทิศทางอื่นๆ ได้เช่นกัน เช่น สำหรับเครือข่ายการเรียกใช้ขั้นตอนของซอฟต์แวร์ Linux Kernel ที่แนะนำใน [15] ในกรณีนี้ สเปกตรัมของจะถูกอธิบายโดยกฎ Weyl แบบแฟรกทัลที่มีมิติแฟรกทัล(ดูรูปที่ 5 จาก[ 9 ] ) การวิเคราะห์เชิงตัวเลขแสดงให้เห็นว่าสถานะไอเกนของเมทริกซ์นั้นอยู่ในบริเวณเฉพาะที่ (ดูรูปที่ 6 จาก[ 9 ] ) วิธี การวนซ้ำของ Arnoldiช่วยให้สามารถคำนวณค่าไอเกนและเวกเตอร์ไอเกนจำนวนมากสำหรับเมทริกซ์ที่มีขนาดค่อนข้างใหญ่ได้ [13] [ 5 ] [ 9 ]

ตัวอย่างอื่นๆ ของเมทริกซ์ ได้แก่ เมทริกซ์สมองของ Google [17] และการจัดการกระบวนการทางธุรกิจ [18] ดูเพิ่มเติมที่[ 1 ]การประยุกต์ใช้การวิเคราะห์เมทริกซ์ของ Google กับลำดับ DNA ได้รับการอธิบายไว้ใน [20] แนวทางเมทริกซ์ของ Google ดังกล่าวยังช่วยให้สามารถวิเคราะห์การพันกันของวัฒนธรรมผ่านการจัดอันดับบทความ Wikipedia หลายภาษาเกี่ยวกับบุคคล [21]

บันทึกทางประวัติศาสตร์

เมทริกซ์ของ Google ที่มีปัจจัยการลดทอนได้รับการอธิบายโดยSergey BrinและLarry Pageในปี 1998 [22] ดูบทความเกี่ยวกับประวัติ PageRank [23], [24] ด้วย

ดูเพิ่มเติม

เอกสารอ้างอิง

  1. ^ a b c Ermann, L.; Chepelianskii, AD; Shepelyansky, DL (2011). "มุ่งสู่เครื่องมือค้นหาแบบสองมิติ". Journal of Physics A . 45 (27) 275101. arXiv : 1106.6215 . Bibcode : 2012JPhA...45A5101E . doi : 10.1088/1751-8113/45/27/275101 . S2CID 14827486 . 
  2. ^ a b c d e Langville, Amy N. ; Meyer, Carl (2006). Google's PageRank and Beyond . Princeton University Press . ISBN 978-0-691-12202-1.
  3. ^ a b Austin, David (2008). "วิธีที่ Google ค้นหาเข็มของคุณในกองฟางบนเว็บ" . AMS Feature Columns. เก็บถาวรจากต้นฉบับเมื่อ 2018-01-11 . สืบค้นเมื่อ2011-01-08 .
  4. ^ลอว์, เอดิธ (9 ตุลาคม 2551). "PageRank Lecture 12" (PDF )
  5. ^ a b c d Frahm, KM; Georgeot, B.; Shepelyansky, DL (2011-11-01). "การเกิดขึ้นอย่างเป็นสากลของ PageRank". Journal of Physics A . 44 (46) 465101. arXiv : 1105.1062 . Bibcode : 2011JPhA...44T5101F . doi : 10.1088/1751-8113/44/46/465101 . S2CID 16292743 . 
  6. โดนาโต, เดโบรา; ลอร่า, ลุยจิ; เลโอนาร์ดี, สเตฟาโน; มิลลอซซี่, สเตฟาโน (30-03-2547). "คุณสมบัติขนาดใหญ่ของ Webgraph" (PDF ) วารสารกายภาพแห่งยุโรป B. 38 (2): 239– 243. Bibcode : 2004EPJB...38..239D . CiteSeerX 10.1.1.104.2136ดอย : 10.1140/epjb/e2004-00056-6 . S2CID 10640375 .  
  7. ^ Pandurangan, Gopal; Ranghavan, Prabhakar; Upfal, Eli (2005). "การใช้ PageRank เพื่อกำหนดลักษณะโครงสร้างเว็บ" (PDF) . Internet Mathematics . 3 (1): 1– 20. doi : 10.1080/15427951.2006.10129114 . S2CID 101281 . 
  8. ^ a b c Georgeot, Bertrand; Giraud, Olivier; Shepelyansky, Dima L. (25 พฤษภาคม 2010). "คุณสมบัติเชิงสเปกตรัมของเมทริกซ์ Google ของเวิลด์ไวด์เว็บและเครือข่ายทิศทางอื่นๆ" Physical Review E . 81 (5) 056109. arXiv : 1002.3342 . Bibcode : 2010PhRvE..81e6109G . doi : 10.1103/PhysRevE.81.056109 . PMID 20866299 . S2CID 14490804 .  
  9. ^ a b c d e f Ermann, L.; Chepelianskii, AD; Shepelyansky, DL (2011). "กฎ Weyl แบบแฟรกทัลสำหรับสถาปัตยกรรมเคอร์เนล Linux" European Physical Journal B . 79 (1): 115– 120. arXiv : 1005.1395 . Bibcode : 2011EPJB...79..115E . doi : 10.1140/epjb/e2010-10774-7 . S2CID 445348 . 
  • Serra-Capizzano, Stefano (2005). "รูปแบบมาตรฐานจอร์แดนของเมทริกซ์ Google: การมีส่วนร่วมที่เป็นไปได้ในการคำนวณ PageRank" SIAM J. Matrix Anal. Appl . 27 (2): 305. doi : 10.1137 /s0895479804441407 . hdl : 11383/1494937 .
  • อูแลม, สตานิสลาฟ (1960). รวมปัญหาทางคณิตศาสตร์ . เอกสารวิชาการด้านคณิตศาสตร์บริสุทธิ์และประยุกต์. นิวยอร์ก: อินเตอร์ไซแอนซ์. หน้า 73.
  • Froyland G.; Padberg K. (2009). "เซตเกือบไม่เปลี่ยนแปลงและแมนิโฟลด์ไม่เปลี่ยนแปลง—การเชื่อมโยงคำอธิบายเชิงความน่าจะเป็นและเชิงเรขาคณิตของโครงสร้างที่สอดคล้องกันในการไหล" Physica D. 238 ( 16): 1507. Bibcode : 2009PhyD..238.1507F . doi : 10.1016/j.physd.2009.03.002 .
  • Shepelyansky DL; Zhirov OV (2010). "เมทริกซ์ Google, ตัวดึงดูดแบบไดนามิก และเครือข่าย Ulam" Phys. Rev. E . 81 (3) 036213. arXiv : 0905.4162 . Bibcode : 2010PhRvE..81c6213S . doi : 10.1103/physreve.81.036213 . PMID  20365838 . S2CID  15874766 .
  • Ermann L.; Shepelyansky DL (2010). "Google matrix and Ulam networks of intermittency maps". Phys. Rev. E . 81 (3) 036221. arXiv : 0911.3823 . Bibcode : 2010PhRvE..81c6221E . doi : 10.1103/physreve.81.036221 . PMID  20365846 . S2CID  388806 .
  • Ermann L.; Shepelyansky DL (2010). "วิธี Ulam และกฎ Weyl แบบแฟรกทัลสำหรับตัวดำเนินการ Perron-Frobenius" Eur. Phys. J. B . 75 (3): 299– 304. arXiv : 0912.5083 . Bibcode : 2010EPJB...75..299E . doi : 10.1140/epjb/e2010-00144-0 . S2CID  54899977 .
  • Frahm KM; Shepelyansky DL (2010). "วิธี Ulam สำหรับแผนที่มาตรฐาน Chirikov". Eur. Phys. J. B . 76 (1): 57– 68. arXiv : 1004.1349 . Bibcode : 2010EPJB...76...57F . doi : 10.1140/epjb/e2010-00190-6 . S2CID  55539783 .
  • Chepelianskii, Alexei D. (2010). "มุ่งสู่กฎทางฟิสิกส์สำหรับสถาปัตยกรรมซอฟต์แวร์". arXiv : 1003.5455 [ cs.SE ].
  • เชเปยันสกี้ DL; ชิรอฟ โอวี (2010) "สู่ Google Matrix ของสมอง" ฟิสิกส์ เล็ตต์ ก . 374 ( 31– 32): 3206. arXiv : 1002.4583 . Bibcode : 2010PhLA..374.3206S . ดอย : 10.1016/j.physleta.2010.06.007 .
  • Abel M.; Shepelyansky DL (2011). "เมทริกซ์การจัดการกระบวนการทางธุรกิจของ Google". Eur. Phys. J. B . 84 (4): 493. arXiv : 1009.2631 . Bibcode : 2011EPJB...84..493A . doi : 10.1140/epjb/e2010-10710-y . S2CID  15510734 .
  • Kandiah, Vivek; Shepelyansky, Dima L. (2013). "การวิเคราะห์เมทริกซ์ของลำดับดีเอ็นเอด้วย Google" . PLOS ONE . ​​8 (5) e61519. arXiv : 1301.1626 . Bibcode : 2013PLoSO...861519K . doi : 10.1371/journal.pone.0061519 . PMC  3650020 . PMID  23671568 .
  • Eom, Young-Ho; Shepelyansky, Dima L. (2013). "การเน้นย้ำความเกี่ยวพันของวัฒนธรรมผ่านการจัดอันดับบทความวิกิพีเดียหลายภาษา" PLOS ONE . ​​8 (10) e74554. arXiv : 1306.6259 . Bibcode : 2013PLoSO...874554E . doi : 10.1371/journal.pone.0074554 . PMC  3789750 . PMID  24098338 .
  • Brin S.; Page L. (1998). "กายวิภาคของเครื่องมือค้นหาเว็บไฮเปอร์เท็กซ์ขนาดใหญ่" เครือข่ายคอมพิวเตอร์และระบบ ISDN 30 ( 1– 7 ): 107. doi : 10.1016/s0169-7552(98)00110-x . S2CID  7587743 .
  • Massimo, Franceschet (2010). "PageRank: ยืนอยู่บนไหล่ของยักษ์ใหญ่". arXiv : 1002.2858 [ cs.IR ].
  • Vigna, Sebastiano (2010). "การจัดอันดับสเปกตรัม" (PDF) . เก็บถาวรจากต้นฉบับ(PDF)เมื่อ 2015-02-08 . เรียกดูเมื่อ2015-02-08 .
  • ตารางข้อมูลของ Google ที่ Scholarpedia
  • ฝ่ายประชาสัมพันธ์ของ Google ปิดตัวลง
  • วิดีโอบรรยายในการประชุมเชิงปฏิบัติการ IHES หัวข้อ "เมทริกซ์ของ Google: พื้นฐาน การประยุกต์ใช้ และอื่นๆ" ตุลาคม 2561
ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Google_matrix&oldid=1350152099 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ เมทริกซ์ของกูเกิล

เมทริกซ์ของ Google เป็น เมทริกซ์สุ่มชนิดพิเศษที่ใช้ใน อัลกอริทึม PageRankของGoogleเมทริกซ์นี้แสดงถึงกราฟที่มีขอบแทนลิงก์ระหว่างหน้าต่างๆ จากนั้นสามารถสร้าง PageRank...

เมทริกซ์ประชิดAและเมทริกซ์มาร์คอฟS

ในการสร้างเมทริกซ์G ของ Google เราต้องสร้างเมทริกซ์ความสัมพันธ์A ก่อน ซึ่งเป็นเมทริกซ์ที่แสดงถึงความสัมพันธ์ระหว่างหน้าเว็บหรือโหนดต่างๆ สมมติว่ามีNหน้า เราสามารถกรอกข้อมูลในตารางA ได้ โดยทำดังนี้: ค่าในเมทริกซ์จะเป็น 1...

การสร้างเมทริกซ์ Gของ Google

รูปที่ 2 เมทริกซ์ Google ของเครือข่ายมหาวิทยาลัยเคมบริดจ์ (2006) องค์ประกอบเมทริกซ์แบบหยาบเขียนตามดัชนี PageRank ขนาดรวม N=212710 แสดงไว้ (จาก[ 1 ] )จากนั้นเมทริกซ์ Google สุดท้าย G สามารถแสดงได้ผ่านSดังนี้: จีฉันเจ=αเอสฉันเจ+(1−α)1เอ็น(1){\displaystyle...

ตัวอย่างเมทริกซ์ของ Google

ตัวอย่างของการสร้างเมทริกซ์โดยใช้สมการ (1) ภายในเครือข่ายแบบง่ายมีอยู่ในบทความ CheiRankเอส{\displaystyle S}สำหรับเมทริกซ์จริง Google ใช้ปัจจัยการลดทอนประมาณ 0.85 [ 2 ] [ 3 ] [ 4 ]เงื่อนไขนี้ให้ความน่าจะเป็นที่ผู้ใช้จะกระโดดไปยังหน้าใดก็ได้แบบสุ่ม...