อ่าน 3 นาที
การค้นหาส่วนบุคคลของ Google
Google Personalized Searchเป็นฟีเจอร์การค้นหาส่วนบุคคลของ Google Search ซึ่งเปิดตัวในปี 2547 การค้นหาทั้งหมดใน Google Search...
การค้นหาส่วนบุคคลของ Google
Google Personalized Searchเป็นฟีเจอร์การค้นหาส่วนบุคคลของ Google Search ซึ่งเปิดตัวในปี 2547 การค้นหาทั้งหมดใน Google Search จะเชื่อมโยงกับบันทึกคุกกี้ของเบราว์เซอร์[ 1 ]เมื่อผู้ใช้ทำการค้นหา ผลการค้นหาจะไม่เพียงขึ้นอยู่กับความเกี่ยวข้องของแต่ละหน้าเว็บกับคำค้นหาเท่านั้น แต่ยังขึ้นอยู่กับเว็บไซต์ที่ผู้ใช้ (หรือบุคคลอื่นที่ใช้เบราว์เซอร์เดียวกัน) เคยเข้าชมผ่านผลการค้นหาก่อนหน้า นี้ด้วย [ 1 ]ซึ่งจะมอบประสบการณ์ที่เป็นส่วนตัวมากขึ้น และสามารถเพิ่มความเกี่ยวข้องของผลการค้นหาสำหรับผู้ใช้แต่ละรายได้ การกรองดังกล่าวอาจมีผลข้างเคียง เช่น การสร้างฟิลเตอร์บับเบิล
การเปลี่ยนแปลงในอัลกอริทึมการค้นหาของ Google ในช่วงหลังๆ ทำให้ข้อมูลผู้ใช้มีความสำคัญน้อยลง ซึ่งหมายความว่าผลกระทบของการค้นหาแบบส่วนบุคคลต่อผลการค้นหานั้นมีจำกัด เพื่อตอบสนองต่อคำวิจารณ์ Google จึงได้เปิดให้สามารถปิดใช้งานฟีเจอร์นี้ได้ด้วย
ประวัติศาสตร์
การค้นหาแบบส่วนบุคคล (Personalized Search) เปิดตัวครั้งแรกเมื่อวันที่ 29 มีนาคม 2547 ในรูปแบบเบต้าทดสอบของโครงการ Google Labs ต่อมาเมื่อวันที่ 20 เมษายน 2548 ได้เปิดให้บริการอย่างเป็นทางการ แต่ยังคงแยกต่างหากจากการค้นหาของ Google ทั่วไป และเมื่อวันที่ 11 พฤศจิกายน 2548 ก็ได้รวมเข้าเป็นส่วนหนึ่งของการค้นหาของ Google ปกติ แต่เฉพาะผู้ใช้ที่มีบัญชี Google เท่านั้น
ตั้งแต่วันที่ 4 ธันวาคม 2552 เป็นต้นไป ฟีเจอร์การค้นหาแบบส่วนบุคคล (Personalized Search) ได้ถูกนำมาใช้กับผู้ใช้ Google Search ทุกคน รวมถึงผู้ที่ไม่ได้ลงชื่อเข้าใช้บัญชี Google ด้วย
นอกจากการปรับแต่งผลการค้นหาตามพฤติกรรมและความสนใจส่วนบุคคลที่เชื่อมโยงกับบัญชี Google แล้ว Google ยังได้นำผลการค้นหาแบบโซเชียลมาใช้ในเดือนตุลาคม 2552 โดยอิงจากบุคคลที่ผู้ใช้รู้จัก โดยใช้สมมติฐานว่าบุคคลที่ผู้ใช้รู้จักมักมีความสนใจคล้ายคลึงกัน ผลการค้นหาเหล่านี้จะช่วยเพิ่มอันดับให้กับเว็บไซต์จากภายใน "วงสังคม" ของผู้ใช้ บริการทั้งสองนี้ได้รวมเข้ากับผลการค้นหาปกติในเดือนกุมภาพันธ์ 2554 และขยายผลการค้นหาโดยรวมถึงเนื้อหาที่แชร์ไปยังผู้ใช้ที่รู้จักผ่านเครือข่ายสังคมออนไลน์ด้วย
การเก็บรวบรวมข้อมูล
อัลกอริทึมการค้นหาของ Google ขับเคลื่อนด้วยการรวบรวมและจัดเก็บประวัติการใช้งานเว็บในฐานข้อมูล สำหรับผู้ใช้ที่ไม่ได้เข้าสู่ระบบ Google จะดูคุกกี้เบราว์เซอร์ ที่จัดเก็บแบบไม่ระบุตัวตน ในเบราว์เซอร์ของผู้ใช้ และเปรียบเทียบสตริงที่ไม่ซ้ำกันกับสตริงที่จัดเก็บไว้ในฐานข้อมูลของ Google บัญชี Google ที่เข้าสู่ ระบบ Google Chromeจะใช้ประวัติการใช้งานเว็บของผู้ใช้เพื่อเรียนรู้ว่าเว็บไซต์และเนื้อหาใดที่พวกเขาชอบ และใช้เป็นพื้นฐานในการแสดงผลการค้นหา Google ใช้ข้อมูลที่ผู้ใช้ให้มาเพื่อสร้างโปรไฟล์ ซึ่งรวมถึงเพศ อายุ ภาษา และความสนใจ โดยอิงจากพฤติกรรมก่อนหน้าในการใช้บริการของ Google [ 2 ]
เมื่อผู้ใช้ทำการค้นหาโดยใช้ Google คำหลักหรือคำค้นหาจะถูกนำมาใช้เพื่อสร้างผลลัพธ์ที่จัดอันดับตาม อัลกอริทึม PageRankอัลกอริทึมนี้ ตามที่ Google กล่าวไว้ คือ "ระบบนับคะแนนโหวตลิงก์และกำหนดว่าหน้าเว็บใดมีความสำคัญที่สุดตามคะแนนเหล่านั้น จากนั้นคะแนนเหล่านี้จะถูกนำมาใช้ร่วมกับปัจจัยอื่นๆ อีกมากมายเพื่อพิจารณาว่าหน้าเว็บนั้นจะติดอันดับที่ดีในการค้นหาหรือไม่" "PageRank อาศัยลักษณะที่เป็นประชาธิปไตยอย่างเป็นเอกลักษณ์ของเว็บโดยใช้โครงสร้างลิงก์จำนวนมากเป็นตัวบ่งชี้คุณค่าของแต่ละหน้าเว็บ โดยพื้นฐานแล้ว Google ตีความลิงก์จากหน้า A ไปยังหน้า B ว่าเป็นการโหวตจากหน้า A ให้กับหน้า B แต่ Google พิจารณามากกว่าปริมาณการโหวตหรือลิงก์ที่หน้าเว็บได้รับ ตัวอย่างเช่น มันยังวิเคราะห์หน้าเว็บที่ลงคะแนนด้วย การโหวตที่ลงโดยหน้าเว็บที่ "สำคัญ" จะมีน้ำหนักมากกว่าและช่วยทำให้หน้าเว็บอื่นๆ "สำคัญ" ด้วย การใช้ปัจจัยเหล่านี้และปัจจัยอื่นๆ Google จะให้มุมมองเกี่ยวกับความสำคัญสัมพัทธ์ของหน้าเว็บ" [ 3 ]
นับตั้งแต่แผนกค้นหาเปิดตัวเวอร์ชันแรกที่มีผลการค้นหาแบบกำหนดเองในปี 2548 และเริ่มพิจารณาเว็บไซต์ที่เคยเข้าชมมาก่อน ปัจจัยใหม่ๆ ได้ถูกเพิ่มเข้ามาเพื่อปรับปรุงผลการค้นหา ตามที่ Google ระบุ ข้อสรุปที่พวกเขาได้หลังจากทดสอบมาหลายปี ตัวบ่งชี้ที่ดีที่สุดอย่างหาที่เปรียบไม่ได้ในการตัดสินใจว่าผลลัพธ์ใดมีความเกี่ยวข้องกับผู้ใช้คือวลีการค้นหาเอง ไม่ใช่ข้อมูลผู้ใช้ และการปรับแต่งผลการค้นหาให้เป็นส่วนตัวไม่ได้เป็นปัจจัยสำคัญเท่าที่เคยเป็นมา[ 4 ]
Jonathan Zittrainศาสตราจารย์ด้านกฎหมายของมหาวิทยาลัยฮาร์วาร์ดโต้แย้งขอบเขตที่ตัวกรองการปรับแต่งส่วนบุคคลบิดเบือนผลการค้นหาของ Google โดยกล่าวว่า "ผลกระทบของการปรับแต่งการค้นหานั้นมีน้อย" [ 5 ]นอกจากนี้ Google ยังให้ผู้ใช้สามารถปิดคุณสมบัติการปรับแต่งส่วนบุคคลได้หากต้องการ[ 6 ]โดยการลบประวัติการค้นหาของ Google และตั้งค่าให้ Google ไม่จดจำคำหลักการค้นหาและลิงก์ที่เข้าชมในอนาคต
ประเภทของข้อมูลที่รวบรวม
มีปัจจัยมากกว่า 50 อย่าง (ที่ Google เรียกว่า 'สัญญาณ') ที่ใช้ในการกำหนดผลการค้นหา ปัจจัยสำคัญที่สุดในการปรับแต่งผลการค้นหาให้เหมาะสมกับแต่ละบุคคล ได้แก่:
- ที่ตั้ง
- ประวัติการค้นหา
- ประวัติการเข้าชมเว็บไซต์
- เครือข่ายสังคม
ตัวแปรแต่ละตัวเหล่านี้จะมีส่วนในการปรับแต่งผลการค้นหาของผู้ใช้ โดยหวังว่าจะสามารถให้ผลลัพธ์ที่เกี่ยวข้องมากที่สุดแก่ผู้ใช้ได้อย่างรวดเร็ว เพื่อตอบคำถามที่ผู้ใช้ถาม[ 7 ]
ข้อมูลตำแหน่งที่ตั้ง
ข้อมูลตำแหน่งที่ตั้งช่วยให้ Google สามารถให้ข้อมูลตามตำแหน่งปัจจุบันและสถานที่ที่ผู้ใช้เคยไปในอดีต โดยอิงตามตำแหน่ง GPS จากสมาร์ทโฟน Android หรือที่อยู่ IP ของผู้ใช้ Google ใช้ข้อมูลตำแหน่งที่ตั้งนี้เพื่อแสดงรายการท้องถิ่นที่จัดกลุ่มไว้กับผลการค้นหาโดยใช้ แพลตฟอร์ม Google Localซึ่งมีบทวิจารณ์และคะแนนโดยละเอียดจากZagat [ 8 ]
ประวัติการค้นหา
ประวัติการค้นหาถูกนำมาใช้ครั้งแรกเพื่อปรับแต่งผลการค้นหาให้เป็นส่วนตัวในปี 2548 โดยอิงจากการค้นหาก่อนหน้าและลิงก์ที่คลิกโดยผู้ใช้ปลายทางแต่ละราย จากนั้นในปี 2552 Google ประกาศว่าการค้นหาแบบส่วนบุคคลจะไม่จำเป็นต้องให้ผู้ใช้เข้าสู่ระบบอีกต่อไป และ Google จะใช้คุกกี้ที่ไม่ระบุตัวตนในเว็บเบราว์เซอร์เพื่อปรับแต่งผลการค้นหาสำหรับผู้ที่ไม่ได้เข้าสู่ระบบ[ 1 ]
ประวัติการเข้าชมเว็บไซต์
ประวัติการเข้าชมเว็บแตกต่างจากประวัติการค้นหา เนื่องจากเป็นบันทึกของหน้าเว็บที่ผู้ใช้เข้าชมจริง แต่ยังคงเป็นปัจจัยที่ส่งผลต่อการจัดอันดับผลการค้นหา ในขณะที่Google+ ยังใช้งานอยู่ ข้อมูลจะถูกนำมาใช้ในผลการค้นหา เนื่องจาก Google ได้รับข้อมูลประชากรของผู้ใช้จำนวนมากจากข้อมูลนี้ เช่น อายุ เพศ สถานที่ ประวัติการทำงาน ความสนใจ และการเชื่อมต่อทางสังคม[ 7 ]
ประสิทธิผล
เพื่อกำหนดผลกระทบที่แท้จริงของการปรับแต่งการค้นหาต่อผู้ใช้ปลายทาง นักวิจัยที่มหาวิทยาลัยนอร์ทอีสเทิร์นได้ทำการศึกษาเปรียบเทียบผู้ใช้ที่เข้าสู่ระบบกับกลุ่มควบคุม และพบว่า 11.7% ของผลลัพธ์แสดงความแตกต่างเนื่องจากการปรับแต่งส่วนบุคคล การวิจัยแสดงให้เห็นว่าผลลัพธ์นี้แตกต่างกันอย่างมากตามคำค้นหาและตำแหน่งการจัดอันดับผลลัพธ์[ 9 ]
ในตัวอย่างต่อไปนี้ ทีม Portent ได้ทำการค้นหาคำว่า 'JavaScript' (แสดงทางด้านขวา) จากนั้นจึงทำการค้นหาคำว่า 'Programming Textbooks' และ 'Books on HTML' ก่อนที่จะค้นหาคำว่า 'JavaScript' อีกครั้ง ซึ่งทำให้ผลการค้นหาเปลี่ยนไป โดยแสดงรายการหนังสือสามเล่มที่ไม่ปรากฏในผลลัพธ์เดิม การศึกษาแสดงให้เห็นว่าจากปัจจัยต่างๆ ที่ทดสอบ ปัจจัยสองอย่างที่มีผลกระทบมากที่สุดคือ การที่ผู้ใช้เข้าสู่ระบบด้วยบัญชี Google และที่อยู่ IP ของผู้ใช้ที่ทำการค้นหา การศึกษาเดียวกันนี้ยังได้ตรวจสอบผลกระทบของการปรับแต่งส่วนบุคคล 11.7% โดยใช้Amazon Mechanical Turk (AMT) (ตลาดออนไลน์แบบ crowdsourcing ซึ่งเป็นส่วนหนึ่งของ Amazon Web Services) เทียบกับกลุ่มควบคุมเพื่อหาความแตกต่างระหว่างทั้งสองกลุ่ม ผลลัพธ์แสดงให้เห็นว่า URL ที่มีอันดับสูงสุดมีโอกาสน้อยที่จะเปลี่ยนแปลงตามการปรับแต่งส่วนบุคคล และการปรับแต่งส่วนบุคคลส่วนใหญ่เกิดขึ้นในอันดับที่ต่ำกว่าของหน้าผลลัพธ์[ 7 ]
แผนกต้อนรับ
มีข้อกังวลหลายประการเกี่ยวกับคุณสมบัตินี้ คุณสมบัตินี้ลดโอกาสในการค้นหาข้อมูลใหม่ เนื่องจากทำให้ผลการค้นหาเอนเอียงไปทางสิ่งที่ผู้ใช้เคยพบแล้ว นอกจากนี้ยังก่อให้เกิดปัญหาด้านความเป็นส่วนตัว เนื่องจากผู้ใช้อาจไม่ทราบว่าผลการค้นหาของตนได้รับการปรับแต่งเฉพาะบุคคล และส่งผลกระทบต่อผลการค้นหาของผู้อื่นที่ใช้คอมพิวเตอร์เครื่องเดียวกัน (เว้นแต่จะเข้าสู่ระบบในฐานะผู้ใช้อื่น) คุณสมบัตินี้ยังมีผลกระทบอย่างมากต่อ อุตสาหกรรม การเพิ่มประสิทธิภาพเครื่องมือค้นหา (SEO) เนื่องจากผลการค้นหาไม่ได้ถูกจัดอันดับในลักษณะเดียวกันสำหรับผู้ใช้ทุกคน ทำให้ยากต่อการระบุผลกระทบของความพยายาม SEO [ 10 ]การปรับแต่งเฉพาะบุคคลทำให้ประสบการณ์การค้นหาไม่สอดคล้องกันสำหรับผู้ใช้ที่แตกต่างกัน ทำให้อุตสาหกรรม SEO ต้องตระหนักถึงทั้งผลการค้นหาที่ปรับแต่งเฉพาะบุคคลและไม่ปรับแต่งเฉพาะบุคคลเพื่อให้ได้อันดับที่ดีขึ้น[ 8 ]
การค้นหาแบบส่วนบุคคลประสบปัญหาในการสร้าง สัญญาณรบกวนพื้นหลังจำนวนมากให้กับผลการค้นหา ซึ่งอาจมองได้ว่าเป็นผลกระทบต่อเนื่องเมื่อมีการค้นหาครั้งหนึ่งแล้วตามด้วยการค้นหาครั้งถัดไป การค้นหาครั้งที่สองจะได้รับอิทธิพลจากการค้นหาครั้งแรกหากไม่ได้ตั้งค่าระยะเวลาหมดเวลาไว้ที่เกณฑ์ที่สูงพอ ตัวอย่างของผลกระทบเชิงลบของผลกระทบต่อเนื่องคือ การค้นหาร้านค้าในฮาวายอาจส่งต่อผลลัพธ์ของการค้นหาครั้งก่อนที่ล้มเหลวซึ่งแสดงร้านค้าเดียวกันในแคลิฟอร์เนีย ทำให้เกิดสัญญาณรบกวน[ 9 ]
อย่างไรก็ตาม ในช่วงไม่กี่ปีที่ผ่านมา งานวิจัยใหม่ระบุว่าเครื่องมือค้นหาไม่ได้สร้างฟิลเตอร์บับเบิลแบบที่เคยคิดกันไว้ ในการศึกษาผลกระทบทางการเมืองของเครื่องมือค้นหาในเจ็ดประเทศที่ดำเนินการโดยมหาวิทยาลัยมิชิแกนสเตท นักวิจัยพบว่าเครื่องมือค้นหาเป็นส่วนเสริมของแหล่งข่าวอื่นๆ ที่ผู้คนใช้อยู่แล้ว ผู้ใช้ตรวจสอบแหล่งข่าวโดยเฉลี่ย 4.5 แหล่งจากสื่อต่างๆ เพื่อให้เข้าใจ และผู้ที่มีความสนใจทางการเมืองโดยเฉพาะจะตรวจสอบมากกว่านั้น (การศึกษานี้ได้รับทุนสนับสนุนจาก Google) นักวิจัยตั้งข้อสังเกตว่าฟิลเตอร์บับเบิลฟังดูเหมือนเป็นปัญหาจริง และดูเหมือนว่าจะใช้กับคนอื่นๆ มากกว่าตัวคุณเอง อย่างไรก็ตาม ข้อสรุปของพวกเขาคือ ปัญหานี้ถูกกล่าวเกินจริง หลักฐานเป็นเพียงเรื่องเล่า และเป็นไปไม่ได้ที่จะเห็นว่าเครื่องมือค้นหามีส่วนทำให้เกิดฟิลเตอร์บับเบิลโดยอิงจากหลักฐานเชิงประจักษ์ที่ได้จากการศึกษา[ 11 ]
ดูเพิ่มเติม
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ การค้นหาส่วนบุคคลของ Google
Google Personalized Searchเป็นฟีเจอร์การค้นหาส่วนบุคคลของ Google Search ซึ่งเปิดตัวในปี 2547 การค้นหาทั้งหมดใน Google Search...
ประวัติศาสตร์
การค้นหาแบบส่วนบุคคล (Personalized Search) เปิดตัวครั้งแรกเมื่อวันที่ 29 มีนาคม 2547 ในรูปแบบเบต้าทดสอบของโครงการ Google Labs ต่อมาเมื่อวันที่ 20 เมษายน 2548 ได้เปิดให้บริการอย่างเป็นทางการ แต่ยังคงแยกต่างหากจากการค้นหาของ Google ทั่วไป และเมื่อวันที่ 11...
การเก็บรวบรวมข้อมูล
อัลกอริทึมการค้นหาของ Google ขับเคลื่อนด้วยการรวบรวมและจัดเก็บประวัติการใช้งานเว็บในฐานข้อมูล สำหรับผู้ใช้ที่ไม่ได้เข้าสู่ระบบ Google จะดู คุกกี้เบราว์เซอร์ ที่จัดเก็บแบบไม่ระบุตัวตน ในเบราว์เซอร์ของผู้ใช้...
ประเภทของข้อมูลที่รวบรวม
มีปัจจัยมากกว่า 50 อย่าง (ที่ Google เรียกว่า 'สัญญาณ') ที่ใช้ในการกำหนดผลการค้นหา ปัจจัยสำคัญที่สุดในการปรับแต่งผลการค้นหาให้เหมาะสมกับแต่ละบุคคล ได้แก่: