อ่าน 15 นาที
ผู้ช่วยเสมือนจริง
ผู้ ช่วยเสมือน (Virtual Assistant หรือ VA ) คือ โปรแกรม ที่สามารถทำงานหรือให้บริการต่างๆ แก่ผู้ใช้ตามข้อมูลที่ผู้ใช้ป้อน เช่น คำสั่งหรือคำถาม รวมถึงคำถามด้วยเสียง...
ผู้ช่วยเสมือนจริง

ผู้ช่วยเสมือน (Virtual AssistantหรือVA ) คือโปรแกรมที่สามารถทำงานหรือให้บริการต่างๆ แก่ผู้ใช้ตามข้อมูลที่ผู้ใช้ป้อน เช่น คำสั่งหรือคำถาม รวมถึงคำถามด้วยเสียง เทคโนโลยีเหล่านี้มักรวมเอา ความสามารถของ แชทบอท เข้ามา เพื่อช่วยให้การทำงานง่ายขึ้น การโต้ตอบอาจเกิดขึ้นผ่านข้อความ อินเทอร์เฟซแบบกราฟิก หรือเสียง เนื่องจากผู้ช่วยเสมือนบางตัวสามารถตีความคำพูดของมนุษย์และตอบกลับด้วยเสียงสังเคราะห์ได้
ในหลายกรณี ผู้ใช้สามารถถามคำถามผู้ช่วยเสมือน ควบคุมอุปกรณ์บ้านอัตโนมัติและการเล่นสื่อ และจัดการงานพื้นฐานอื่นๆ เช่น อีเมล รายการสิ่งที่ต้องทำ และปฏิทิน ทั้งหมดนี้ด้วยคำสั่งด้วยเสียง[ 1 ]ในช่วงไม่กี่ปีที่ผ่านมา ผู้ช่วยเสมือนที่โดดเด่นสำหรับการใช้งานโดยตรงของผู้บริโภค ได้แก่Apple Siri , Amazon Alexa , Google Assistant (Gemini) , Microsoft CopilotและSamsung Bixby [ 2 ] นอกจากนี้ บริษัทในอุตสาหกรรมต่างๆ มักจะรวมเทคโนโลยีผู้ช่วยเสมือนบางประเภทเข้ากับการบริการลูกค้าหรือการสนับสนุนของตน[ 3 ]
ในช่วงทศวรรษ 2020 การเกิดขึ้นของแชทบอทที่ใช้ปัญญาประดิษฐ์เช่นChatGPTได้นำมาซึ่งความสามารถและความสนใจที่เพิ่มขึ้นในด้านผลิตภัณฑ์และบริการผู้ช่วยเสมือน[ 4 ] [ 5 ] [ 6 ]
ประวัติศาสตร์
ทศวรรษแห่งการทดลอง: ทศวรรษ 1910–1980
Radio Rex เป็นของเล่นที่สั่งงานด้วยเสียงตัวแรกที่ได้รับสิทธิบัตรในปี พ.ศ. 2459 [ 7 ]และวางจำหน่ายในปี พ.ศ. 2465 [ 8 ]เป็นของเล่นไม้รูปสุนัขที่จะออกมาจากบ้านเมื่อมีคนเรียกชื่อมัน
ในปี พ.ศ. 2495 Bell Labsได้นำเสนอ "Audrey" เครื่องจดจำตัวเลขอัตโนมัติ เครื่องนี้ใช้แผงรีเลย์สูงหกฟุต ใช้พลังงานมาก มีสายเคเบิลจำนวนมาก และมีปัญหาในการบำรุงรักษามากมายที่เกี่ยวข้องกับวงจรหลอดสุญญากาศที่ซับซ้อน มันสามารถจดจำหน่วยพื้นฐานของคำพูด คือ โฟนีมได้ มันถูกจำกัดให้จดจำตัวเลขที่พูดโดยผู้พูดที่กำหนดไว้อย่างแม่นยำเท่านั้น ดังนั้นจึงสามารถใช้สำหรับการโทรออกด้วยเสียงได้ แต่ในกรณีส่วนใหญ่ การโทรออกด้วยปุ่มกดนั้นถูกกว่าและเร็วกว่าการพูดตัวเลขต่อเนื่องกัน[ 9 ]
อีกหนึ่งเครื่องมือยุคแรกที่สามารถทำการจดจำเสียงพูดแบบดิจิทัลได้คือ เครื่องคิดเลขสั่งงานด้วยเสียง IBM Shoeboxซึ่งเปิดตัวสู่สาธารณชนในงานมหกรรมโลกซีแอตเติลปี 1962หลังจากวางจำหน่ายครั้งแรกในปี 1961 คอมพิวเตอร์รุ่นแรกนี้ พัฒนาขึ้นเกือบ 20 ปีก่อนการเปิดตัวคอมพิวเตอร์ส่วนบุคคล IBM เครื่องแรก ในปี 1981 สามารถจดจำคำพูดได้ 16 คำ และตัวเลข 0 ถึง 9
โปรแกรมประมวลผลภาษาธรรมชาติตัวแรก หรือแชทบอท ELIZAได้รับการพัฒนาโดยศาสตราจารย์Joseph Weizenbaum แห่ง MIT ในช่วงทศวรรษ 1960 สร้างขึ้นเพื่อ "แสดงให้เห็นว่าการสื่อสารระหว่างมนุษย์กับเครื่องจักรนั้นเป็นเพียงผิวเผิน" [ 10 ] ELIZA ใช้การจับคู่รูปแบบและวิธีการแทนที่ลงในคำตอบที่กำหนดไว้เพื่อจำลองการสนทนา ซึ่งทำให้เกิดภาพลวงตาว่าโปรแกรมเข้าใจ
มีรายงานว่าเลขานุการของไวเซนบอมเองขอให้ไวเซนบอมออกจากห้องเพื่อให้เธอและเอลิซ่าได้สนทนากันอย่างแท้จริง ไวเซนบอมรู้สึกประหลาดใจกับเรื่องนี้ และเขียนในภายหลังว่า "ฉันไม่รู้มาก่อนว่า... การสัมผัสกับโปรแกรมคอมพิวเตอร์ที่ค่อนข้างง่ายเพียงช่วงเวลาสั้นๆ สามารถทำให้เกิดความคิดหลงผิดอย่างรุนแรงในคนปกติได้[ 11 ]
ปรากฏการณ์นี้จึงได้ชื่อว่า"ปรากฏการณ์เอลิซา" (ELIZA effect)ซึ่งหมายถึงแนวโน้มที่จะสันนิษฐานโดยไม่รู้ตัวว่าพฤติกรรมของคอมพิวเตอร์นั้นคล้ายคลึงกับพฤติกรรมของมนุษย์ หรือก็คือ การมองคอมพิวเตอร์ให้มีลักษณะเหมือนมนุษย์ (anthropomorphisation) ซึ่งเป็นปรากฏการณ์ที่พบได้ในการปฏิสัมพันธ์ระหว่างมนุษย์กับผู้ช่วยเสมือนจริง
ความก้าวหน้าครั้งสำคัญถัดไปในการพัฒนาเทคโนโลยีการจดจำเสียงเกิดขึ้นในทศวรรษ 1970 ที่มหาวิทยาลัยคาร์เนกีเมลลอนในเมืองพิตต์สเบิร์ก รัฐเพน ซิลเวเนีย โดยได้รับการสนับสนุนอย่างมากจากกระทรวงกลาโหมของสหรัฐอเมริกาและ หน่วยงาน DARPAซึ่งให้ทุนสนับสนุนโครงการวิจัยการทำความเข้าใจคำพูดเป็นเวลาห้าปี โดยมีเป้าหมายเพื่อให้ได้คำศัพท์ขั้นต่ำ 1,000 คำ บริษัทและสถาบันการศึกษาต่างๆ รวมถึง IBM, มหาวิทยาลัยคาร์เนกีเมลลอน (CMU) และสถาบันวิจัยสแตนฟอร์ด ได้เข้าร่วมในโครงการนี้
ผลลัพธ์ที่ได้คือ "Harpy" มันสามารถจดจำคำศัพท์ได้ประมาณ 1,000 คำ ซึ่งเป็นจำนวนคำที่เทียบเท่ากับเด็กอายุสามขวบ และสามารถเข้าใจประโยคได้ มันสามารถประมวลผลคำพูดที่ใช้คำศัพท์ การออกเสียง และโครงสร้างไวยากรณ์ที่ตั้งโปรแกรมไว้ล่วงหน้า เพื่อพิจารณาว่าลำดับของคำใดที่เข้ากันได้อย่างมีความหมาย จึงช่วยลดข้อผิดพลาดในการจดจำคำพูดได้
ในปี 1986 Tangora คือเครื่องพิมพ์ดีดที่พัฒนาต่อยอดมาจาก Shoebox ซึ่งเป็นเครื่องพิมพ์ดีดที่จดจำเสียงได้ ตั้งชื่อตามนักพิมพ์ดีดที่เร็วที่สุดในโลกในขณะนั้น เครื่องพิมพ์ดีดนี้มีคำศัพท์ 20,000 คำ และใช้การคาดเดาเพื่อเลือกผลลัพธ์ที่น่าจะเป็นไปได้มากที่สุดโดยอิงจากสิ่งที่พูดในอดีต วิธีการของ IBM นั้นอิงตาม แบบจำลอง มาร์คอฟแบบซ่อนเร้น (Hidden Markov Model ) ซึ่งเพิ่มสถิติเข้าไปในเทคนิคการประมวลผลสัญญาณดิจิทัล วิธีการนี้ทำให้สามารถคาดเดาเสียงสระหรือพยัญชนะ ที่น่าจะเป็นไปได้มากที่สุด ที่จะตามหลังเสียงสระหรือพยัญชนะที่กำหนดได้ อย่างไรก็ตาม ผู้พูดแต่ละคนต้องฝึกเครื่องพิมพ์ดีดให้จดจำเสียงของตนเองและเว้นจังหวะระหว่างแต่ละคำด้วยตนเอง
ในปี พ.ศ. 2526 Gus Searcy ได้คิดค้น " Butler in a Box " ซึ่งเป็นระบบควบคุมบ้านด้วยเสียงแบบอิเล็กทรอนิกส์[ 12 ]
กำเนิดผู้ช่วยเสมือนอัจฉริยะ: ทศวรรษ 1990–2010
ในช่วงทศวรรษ 1990 เทคโนโลยีการรู้จำเสียงพูดแบบดิจิทัลกลายเป็นคุณสมบัติสำคัญของคอมพิวเตอร์ส่วนบุคคล โดยมีบริษัท IBM , PhilipsและLernout & Hauspieแข่งขันกันเพื่อแย่งชิงลูกค้า ต่อมา การเปิดตัวสมาร์ทโฟนเครื่อง แรก ของ IBM Simonในปี 1994 ได้วางรากฐานให้กับผู้ช่วยเสมือนอัจฉริยะอย่างที่เรารู้จักกันในปัจจุบัน
ในปี 1997 ซอฟต์แวร์ NaturallySpeaking ของ Dragon สามารถจดจำและถอดเสียงพูดของมนุษย์ตามธรรมชาติโดยไม่เว้นช่วงระหว่างแต่ละคำลงในเอกสารได้ในอัตรา 100 คำต่อนาที ปัจจุบันยังคงมีเวอร์ชันของ Naturally Speaking ให้ดาวน์โหลดและยังคงใช้งานอยู่ เช่น โดยแพทย์จำนวนมากในสหรัฐอเมริกาและสหราชอาณาจักรเพื่อบันทึกข้อมูลทางการแพทย์ของตน
ในปี 2544 Colloquisได้เปิดตัว SmarterChild สู่สาธารณะ บนแพลตฟอร์มต่างๆ เช่นAIMและMSN Messengerแม้ว่า SmarterChild จะใช้ข้อความทั้งหมด แต่ก็สามารถเล่นเกม ตรวจสอบสภาพอากาศ ค้นหาข้อเท็จจริง และสนทนากับผู้ใช้ได้ในระดับหนึ่ง[ 13 ]
ผู้ช่วยเสมือนดิจิทัลสมัยใหม่ตัวแรกที่ติดตั้งบนสมาร์ทโฟนคือSiriซึ่งเปิดตัวเป็นฟีเจอร์ของiPhone 4Sเมื่อวันที่ 4 ตุลาคม 2011 [ 14 ] Apple Inc.พัฒนา Siri ขึ้นหลังจากเข้าซื้อกิจการSiri Inc. ในปี 2010 ซึ่ง เป็นบริษัท ที่แยกตัวออกมาจากSRI Internationalซึ่งเป็นสถาบันวิจัยที่ได้รับเงินทุนจากDARPAและ กระทรวง กลาโหมของสหรัฐอเมริกา[ 15 ]จุดประสงค์ของ Siri คือเพื่อช่วยในการทำงานต่างๆ เช่น การส่งข้อความ การโทร การตรวจสอบสภาพอากาศ หรือการตั้งนาฬิกาปลุก เมื่อเวลาผ่านไป Siri ได้พัฒนาไปสู่การแนะนำร้านอาหาร ค้นหาข้อมูลทางอินเทอร์เน็ต และให้เส้นทางการขับขี่[ 16 ]
ในเดือนพฤศจิกายน 2014 Amazon ประกาศเปิดตัว Alexa พร้อมกับ Echo [ 17 ]ในปี 2016 Salesforceเปิดตัว Einstein ซึ่งพัฒนามาจากชุดเทคโนโลยีพื้นฐานของแพลตฟอร์ม Salesforce [ 18 ] Einstein ถูกแทนที่ด้วย Agentforce ซึ่งเป็นAI ตัวแทนในเดือนกันยายน 2024 [ 19 ]
ในเดือนเมษายน 2017 Amazon ได้เปิดตัวบริการสำหรับการสร้างอินเทอร์เฟซสนทนาสำหรับผู้ช่วยเสมือนหรืออินเทอร์เฟซทุกประเภท
แบบจำลองภาษาขนาดใหญ่: ทศวรรษ 2020 ถึงปัจจุบัน
ในช่วงทศวรรษ 2020 ระบบปัญญาประดิษฐ์ (AI) เช่นChatGPTได้รับความนิยมมากขึ้นเนื่องจากความสามารถในการสร้างคำตอบที่เหมือนมนุษย์สำหรับการสนทนาแบบข้อความ ในเดือนกุมภาพันธ์ 2020 ไมโครซอฟต์ได้เปิดตัว Turing Natural Language Generation (T-NLG) ซึ่งในขณะนั้นเป็น "แบบจำลองภาษาที่ใหญ่ที่สุดเท่าที่เคยเผยแพร่มา โดยมีพารามิเตอร์ถึง 17 พันล้านตัว" [ 20 ]เมื่อวันที่ 30 พฤศจิกายน 2022 ChatGPT ได้เปิดตัวเป็นต้นแบบและได้รับความสนใจอย่างรวดเร็วจากคำตอบที่ละเอียดและชัดเจนในหลายสาขาความรู้ การเกิดขึ้นของ ChatGPT และการเปิดตัวสู่สาธารณชนในวงกว้างได้เพิ่มความสนใจและการแข่งขันในด้านนี้ ในเดือนกุมภาพันธ์ 2023 Google เริ่มเปิดตัวบริการทดลองที่เรียกว่า "Bard" ซึ่งใช้ โปรแกรม LaMDAเพื่อสร้างคำตอบข้อความสำหรับคำถามที่ถามโดยอิงจากข้อมูลที่รวบรวมจาก เว็บ
ในขณะที่ ChatGPT และแชทบอททั่วไปอื่นๆ ที่ใช้ AI เชิงสร้างสรรค์ล่าสุดสามารถทำงานต่างๆ ที่เกี่ยวข้องกับผู้ช่วยเสมือนได้ แต่ก็ยังมีเทคโนโลยีเฉพาะทางอีกรูปแบบหนึ่งที่ออกแบบมาเพื่อตอบสนองสถานการณ์หรือความต้องการที่เฉพาะเจาะจงมากขึ้น[ 21 ] [ 4 ]
วิธีการปฏิสัมพันธ์

ผู้ช่วยเสมือนทำงานผ่านช่องทางต่างๆ ดังนี้:
- ข้อความ รวมถึง: การแชทออนไลน์ (โดยเฉพาะใน แอปพลิเคชัน ส่งข้อความโต้ตอบแบบทันทีหรือแอปพลิเคชันอื่น ๆ) ข้อความ SMSอีเมลหรือช่องทางการสื่อสารแบบข้อความอื่น ๆ เช่นผู้ช่วยเสมือนอัจฉริยะสำหรับธุรกิจของConversica [ 22 ]
- เสียง: ตัวอย่างเช่น ด้วยAmazon Alexa [ 23 ]บนอุปกรณ์Amazon Echo , Siri บน iPhone , Google Assistant บนอุปกรณ์ Androidที่เปิดใช้งาน Google หรือBixbyบนอุปกรณ์ Samsung
- รูปภาพ: ผู้ช่วยอัจฉริยะบางตัว เช่น Google Assistant (ซึ่งรวมถึงGoogle Lens ) และ Bixby ในสมาร์ทโฟน Samsung Galaxy series มีความสามารถเพิ่มเติมในการประมวลผลภาพเพื่อจดจำวัตถุในภาพได้
ผู้ช่วยเสมือนจริงจำนวนมากสามารถเข้าถึงได้ผ่านหลายวิธี ทำให้ผู้ใช้สามารถโต้ตอบกับผู้ช่วยเหล่านั้นได้อย่างหลากหลาย ไม่ว่าจะเป็นผ่านการแชท คำสั่งเสียง หรือเทคโนโลยีอื่นๆ ที่ผสานรวมอยู่ด้วย
ผู้ช่วยเสมือนใช้การประมวลผลภาษาธรรมชาติ (NLP) เพื่อจับคู่ข้อความหรือเสียงที่ผู้ใช้ป้อนเข้ากับคำสั่งที่สามารถดำเนินการได้ บางตัวเรียนรู้อย่างต่อเนื่องโดยใช้เทคนิคปัญญาประดิษฐ์ รวมถึง การเรียนรู้ของเครื่องและปัญญาประดิษฐ์แบบรอบด้าน
ในการเปิดใช้งานผู้ช่วยเสมือนโดยใช้เสียง อาจใช้คำปลุก ซึ่งเป็นคำหรือกลุ่มคำ เช่น "Hey Siri", "OK Google" หรือ "Hey Google", "Alexa" และ "Hey Microsoft" [ 24 ]เมื่อผู้ช่วยเสมือนได้รับความนิยมมากขึ้น ความเสี่ยงทางกฎหมายที่เกี่ยวข้องก็เพิ่มมากขึ้น เช่นกัน [ 25 ] : 815
อุปกรณ์และวัตถุ

ผู้ช่วยเสมือนอาจถูกรวมเข้ากับแพลตฟอร์มหลายประเภท หรืออย่างเช่น Amazon Alexa ที่อาจใช้งานข้ามหลายแพลตฟอร์มพร้อมกัน:
- รวมถึงอุปกรณ์ต่างๆ เช่น ลำโพงอัจฉริยะอย่าง Amazon Echo, Google Home และApple HomePod
- ใน แอปพลิเคชัน ส่งข้อความโต้ตอบแบบทันทีทั้งบนสมาร์ทโฟนและผ่านทางเว็บ เช่น M (ผู้ช่วยเสมือน)บน แอป FacebookและFacebook Messengerหรือผ่านทางเว็บ
- อาจถูกรวมเข้ากับระบบปฏิบัติการมือถือ (OS) เช่น Siri ของ Apple บน อุปกรณ์ iOSและ BlackBerry Assistant บน อุปกรณ์ BlackBerry 10หรือรวมอยู่ในระบบปฏิบัติการเดสก์ท็อป เช่นCortanaบนระบบปฏิบัติการMicrosoft Windows
- ติดตั้งในสมาร์ทโฟนโดยไม่ขึ้นกับระบบปฏิบัติการ เช่นเดียวกับBixbyบนSamsung Galaxy S8และNote 8 [ 26 ]
- ในแพลตฟอร์มการส่งข้อความโต้ตอบแบบทันที จะมีผู้ช่วยจากองค์กรเฉพาะ เช่นAerobot ของสายการบินAeromexico บน Facebook Messenger หรือ Secretary บน WeChat
- ภายในแอปมือถือจากบริษัทเฉพาะและองค์กรอื่น ๆ เช่น Dom จากDomino's Pizza [ 27 ]
- ในเครื่องใช้ไฟฟ้า[ 28 ]รถยนต์[ 29 ]และเทคโนโลยีสวมใส่ได้[ 30 ]เช่นAi Pin
- ผู้ช่วยเสมือนรุ่นก่อนๆ มักทำงานบนเว็บไซต์ เช่นAsk Jenn ของAlaska Airlines [ 31 ]หรือบน ระบบ ตอบรับด้วยเสียงแบบโต้ตอบ (IVR) เช่นIVR ของ American AirlinesโดยNuance [ 32 ]
บริการ
ผู้ช่วยเสมือนสามารถให้บริการได้หลากหลายประเภท ซึ่งรวมถึง: [ 33 ]
- ให้ข้อมูลต่างๆ เช่น สภาพอากาศ ข้อเท็จจริงจากแหล่งข้อมูล เช่นวิกิพีเดียหรือIMDbตั้งนาฬิกาปลุก สร้างรายการสิ่งที่ต้องทำ และรายการซื้อของ
- เล่นเพลงจากบริการสตรีมมิ่ง เช่นSpotifyและPandora ; ฟังสถานีวิทยุ; อ่านหนังสือเสียง
- เล่นวิดีโอ รายการทีวี หรือภาพยนตร์บนโทรทัศน์ โดยสตรีมมิ่งจากแหล่งต่างๆ เช่นNetflix
- การค้าแบบสนทนา (ดูรายละเอียดด้านล่าง)
- ช่วยส่งเสริมปฏิสัมพันธ์ระหว่างประชาชนกับภาครัฐ (ดูปัญญาประดิษฐ์ในภาครัฐ )
- เสริมและ/หรือทดแทนผู้เชี่ยวชาญด้านบริการลูกค้าที่เป็นมนุษย์[ 34 ]ในโดเมนต่างๆ เช่น การดูแลสุขภาพ การขาย และการธนาคาร รายงานฉบับหนึ่งประเมินว่าผู้ช่วยออนไลน์อัตโนมัติทำให้ภาระงานของศูนย์บริการลูกค้าที่ ให้บริการโดยมนุษย์ลดลง 30% [ 35 ]
- ยกระดับประสบการณ์การขับขี่ด้วยการเปิดใช้งานการโต้ตอบกับผู้ช่วยเสมือนจริง เช่น Siri และ Alexa ขณะอยู่ในรถ
การค้าผ่านการสนทนา
การค้าแบบสนทนาคืออีคอมเมิร์ซผ่านวิธีการส่งข้อความต่างๆ รวมถึงผ่านผู้ช่วยเสียง[ 36 ]แต่ยังรวมถึงการแชทสด บน เว็บไซต์อีคอมเมิร์ซการแชทสดบนแอปพลิเคชันส่งข้อความ เช่นWeChat , Facebook Messenger และWhatsApp [ 37 ]และแชทบอทบนแอปพลิเคชันส่งข้อความหรือเว็บไซต์
ฝ่ายบริการลูกค้า
ผู้ช่วยเสมือนสามารถทำงานร่วมกับทีมสนับสนุนลูกค้าของธุรกิจเพื่อให้ บริการสนับสนุนลูกค้า ตลอด 24 ชั่วโมง 7 วันต่อสัปดาห์ โดยให้การตอบสนองที่รวดเร็ว ซึ่งช่วยยกระดับประสบการณ์ของลูกค้า ธุรกิจในอุตสาหกรรมบริการได้นำผู้ช่วยเสียง AI มาใช้เพื่อจัดการปฏิสัมพันธ์กับลูกค้าเป็นประจำ เช่น การจองนัดหมายและการรับคำสั่งซื้อ โดยเฉพาะอย่างยิ่งสำหรับการให้บริการนอกเวลาทำการ[ 38 ]การใช้งานเหล่านี้มักใช้การฝึกอบรมเฉพาะอุตสาหกรรมเพื่อทำความเข้าใจคำศัพท์เฉพาะด้านและบูรณาการกับซอฟต์แวร์ธุรกิจที่มีอยู่
บริการจากบุคคลที่สาม
Amazon เปิดใช้งาน "Skills" ของ Alexa และ "Actions" ของ Google ซึ่งโดยพื้นฐานแล้วคือแอปพลิเคชันที่ทำงานบนแพลตฟอร์มผู้ช่วยอัจฉริยะ
ความเป็นส่วนตัว
ผู้ช่วยเสมือนมีข้อกังวลด้านความเป็นส่วนตัวหลายประการที่เกี่ยวข้องกับมัน คุณสมบัติเช่นการเปิดใช้งานด้วยเสียงถือเป็นภัยคุกคาม เนื่องจากคุณสมบัติดังกล่าวต้องการให้เครื่องคอยฟังอยู่ตลอดเวลา[ 39 ]โหมดความเป็นส่วนตัวเช่นปุ่มรักษาความปลอดภัยเสมือนได้รับการเสนอเพื่อสร้างการตรวจสอบสิทธิ์แบบหลายชั้นสำหรับผู้ช่วยเสมือน[ 40 ]
Google Assistant
นโยบายความเป็นส่วนตัวของ Google Assistant ระบุว่า Google Assistant จะไม่เก็บข้อมูลเสียงโดยไม่ได้รับอนุญาตจากผู้ใช้ แต่อาจเก็บข้อมูลการถอดเสียงการสนทนาเพื่อปรับแต่งประสบการณ์การใช้งาน การปรับแต่งสามารถปิดได้ในการตั้งค่า หากผู้ใช้ต้องการให้ Google Assistant เก็บข้อมูลเสียง พวกเขาสามารถไปที่กิจกรรมเสียงและการสนทนา (VAA) และเปิดใช้งานฟีเจอร์นี้ได้ ไฟล์เสียงจะถูกส่งไปยังคลาวด์และ Google จะใช้เพื่อปรับปรุงประสิทธิภาพของ Google Assistant แต่เฉพาะในกรณีที่เปิดใช้งานฟีเจอร์ VAA แล้วเท่านั้น[ 41 ]
อเมซอน อเล็กซ่า
นโยบายความเป็นส่วนตัวของผู้ช่วยเสมือนของ Amazon อย่าง Alexa ระบุว่า Alexa จะฟังการสนทนาเฉพาะเมื่อมีการใช้คำปลุก (เช่น Alexa, Amazon, Echo) เท่านั้น โดยจะเริ่มบันทึกการสนทนาหลังจากมีการเรียกคำปลุก และจะหยุดบันทึกหลังจากเงียบไป 8 วินาที จากนั้นจะส่งการสนทนาที่บันทึกไว้ไปยังคลาวด์ และสามารถลบการบันทึกออกจากคลาวด์ได้โดยไปที่ 'ความเป็นส่วนตัวของ Alexa' ใน 'Alexa' [ 42 ]
แอปเปิ้ล ซิริ
Apple ระบุว่าไม่ได้บันทึกเสียงเพื่อปรับปรุง Siri แต่ใช้การถอดเสียงแทน โดยข้อมูลการถอดเสียงจะถูกส่งเฉพาะเมื่อเห็นว่ามีความสำคัญต่อการวิเคราะห์เท่านั้น ผู้ใช้สามารถเลือกที่จะไม่ให้ Siri ส่งข้อมูลการถอดเสียงในระบบคลาวด์ได้ทุกเมื่อ[ 43 ]
ไมโครซอฟต์ คอร์ทานา
Cortana เป็นผู้ช่วยเสมือนที่ใช้เสียงเท่านั้นและมีการตรวจสอบสิทธิ์แบบเดียว[ 44 ] [ 45 ] [ 46 ]อุปกรณ์ที่สั่งงานด้วยเสียงนี้เข้าถึงข้อมูลผู้ใช้เพื่อทำงานทั่วไป เช่น ตรวจสอบสภาพอากาศหรือโทรออก ซึ่งก่อให้เกิดความกังวลเกี่ยวกับความเป็นส่วนตัวเนื่องจากไม่มีการตรวจสอบสิทธิ์แบบที่สอง[ 47 ] [ 48 ]
ความสนใจของผู้บริโภค
คาดว่าเพิ่มมูลค่าโดยการเปิดโอกาสให้เกิดปฏิสัมพันธ์รูปแบบใหม่
คุณค่าเพิ่มเติมของผู้ช่วยเสมือนจริงนั้นอาจมาจากหลายด้าน เช่น:
- บางครั้งการสื่อสารด้วยเสียงอาจเป็นวิธีการสื่อสารระหว่างมนุษย์กับเครื่องจักร ที่ดีที่สุด :
- มันสะดวก: ในบางภาคส่วนที่เสียงเป็นวิธีการสื่อสารเพียงวิธีเดียวที่เป็นไปได้ และโดยทั่วไปแล้ว มันช่วยให้สามารถใช้มือและสายตาทั้งสองข้างทำกิจกรรมอื่นควบคู่กันไปได้ หรือช่วยผู้พิการได้ด้วย
- เร็วกว่า: การพูดมีประสิทธิภาพมากกว่าการเขียนบนแป้นพิมพ์: เราสามารถพูดได้ถึง 200 คำต่อนาทีในขณะที่การเขียนบนแป้นพิมพ์ทำได้เพียง 60 คำต่อนาที นอกจากนี้ยังเป็นธรรมชาติมากกว่า จึงใช้ความพยายามน้อยกว่า (อย่างไรก็ตาม การอ่านข้อความอาจถึง 700 คำต่อนาที) [ 49 ]
- ผู้ช่วยเสมือนช่วยประหยัดเวลาได้มากด้วยระบบอัตโนมัติ: พวกเขาสามารถรับนัดหมายหรืออ่านข่าวในขณะที่ผู้บริโภคทำอย่างอื่นได้ นอกจากนี้ยังสามารถขอให้ผู้ช่วยเสมือนจัดตารางการประชุมได้ ซึ่งจะช่วยจัดระเบียบเวลาได้ นักออกแบบโปรแกรมจัดตารางเวลาดิจิทัลใหม่ได้อธิบายถึงความทะเยอทะยานของพวกเขาว่าปฏิทินเหล่านี้สามารถจัดตารางเวลาชีวิตเพื่อให้ผู้บริโภคใช้เวลาได้อย่างมีประสิทธิภาพมากขึ้น ผ่านกระบวนการเรียนรู้ของเครื่อง และการจัดระเบียบเวลาทำงานและเวลาว่างอย่างสมบูรณ์ ตัวอย่างเช่น เมื่อผู้บริโภคแสดงความต้องการที่จะกำหนดเวลาพัก ผู้ช่วยเสมือนจะกำหนดเวลาพักในเวลาที่เหมาะสมที่สุดสำหรับจุดประสงค์นี้ (เช่น ในช่วงเวลาของสัปดาห์ที่พวกเขามีประสิทธิภาพน้อยลง) โดยมีเป้าหมายระยะยาวเพิ่มเติมคือสามารถกำหนดตารางเวลาและจัดระเบียบเวลาว่างของผู้บริโภค เพื่อให้มั่นใจได้ถึงประสิทธิภาพการทำงานที่ดีที่สุด[ 50 ]
ความสนใจที่รับรู้ได้

- จากการศึกษาล่าสุด (ปี 2019) พบว่าเหตุผลสองประการที่ผู้บริโภคใช้ผู้ช่วยเสมือนจริง ได้แก่ การรับรู้ถึงประโยชน์และการรับรู้ถึงความเพลิดเพลิน ผลการศึกษาข้อแรกคือ การรับรู้ถึงประโยชน์และการรับรู้ถึงความเพลิดเพลินมีอิทธิพลอย่างมากต่อความเต็มใจของผู้บริโภคในการใช้ผู้ช่วยเสมือนจริง
- ผลการศึกษาข้อที่สองคือ:
- คุณภาพของเนื้อหาที่นำเสนอมีอิทธิพลอย่างมากต่อการรับรู้ถึงประโยชน์ และมีอิทธิพลอย่างมากต่อการรับรู้ถึงความเพลิดเพลิน
- ความสวยงามทางสายตามีอิทธิพลอย่างมากต่อความรู้สึกเพลิดเพลินที่รับรู้ได้
- ระบบอัตโนมัติมีอิทธิพลอย่างมากต่อประโยชน์ที่รับรู้ได้[ 51 ]
ประเด็นถกเถียง
ประเด็นถกเถียงเกี่ยวกับปัญญาประดิษฐ์
- ผู้ช่วยเสมือนกระตุ้นให้เกิดฟิลเตอร์บับเบิล : เช่นเดียวกับโซเชียลมีเดียอัลกอริทึมของผู้ช่วยเสมือนได้รับการฝึกฝนให้แสดงข้อมูลที่เกี่ยวข้องและละทิ้งข้อมูลอื่น ๆ โดยอิงจากกิจกรรมก่อนหน้าของผู้บริโภค: ข้อมูลที่เกี่ยวข้องคือข้อมูลที่ผู้บริโภคสนใจหรือพึงพอใจ ส่งผลให้พวกเขาถูกแยกออกจากข้อมูลที่ไม่สอดคล้องกับมุมมองของพวกเขา ทำให้พวกเขาถูกแยกเข้าไปอยู่ในฟองสบู่ทางปัญญาของตนเอง และเสริมสร้างความคิดเห็นของพวกเขา ปรากฏการณ์นี้เป็นที่ทราบกันดีว่าช่วยเสริมสร้างข่าวปลอมและห้องสะท้อนเสียง[ 52 ]
- บางครั้งผู้ช่วยเสมือนก็ถูกวิพากษ์วิจารณ์ว่าถูกประเมินค่าสูงเกินไป โดยเฉพาะอย่างยิ่งเอ. คาสิลลีชี้ให้เห็นว่าปัญญาประดิษฐ์ (AI) ของผู้ช่วยเสมือนนั้นไม่ได้ฉลาดหรือเป็นเทียมอย่างแท้จริงด้วยเหตุผลสองประการ:
- พวกมันไม่ฉลาด เพราะสิ่งที่พวกมันทำก็คือเป็นผู้ช่วยของมนุษย์ และทำเพียงงานที่มนุษย์ทำได้ง่ายๆ และอยู่ในขอบเขตที่จำกัดมาก เช่น ค้นหา จัดประเภท และนำเสนอข้อมูล ข้อเสนอ หรือเอกสาร นอกจากนี้ ผู้ช่วยเสมือนยังไม่สามารถตัดสินใจด้วยตนเองหรือคาดการณ์สิ่งต่างๆ ได้
- และไม่ใช่สิ่งประดิษฐ์เพราะจะเป็นไปไม่ได้หากปราศจากการติดฉลากโดยมนุษย์ผ่านการทำงานระดับจุลภาค[ 53 ]
- ผู้ช่วยเสมือนยังก่อให้เกิดข้อถกเถียงเกี่ยวกับบทบาททางเพศเนื่องจากโดยทั่วไปแล้วจะมีเสียงและบุคลิกที่ฟังดูเป็นผู้หญิง J. Lingel และ K. Crawford โต้แย้งว่าผู้ช่วยเสมือนนั้นอ้างอิงถึงภาพลักษณ์ทางวัฒนธรรมของเลขานุการ ซึ่งเป็นตัวแทนของบทบาทรองที่ให้การสนับสนุน มีความสามารถ และมีลักษณะเป็นผู้หญิง[ 54 ]การเลือกออกแบบนี้รับใช้โครงสร้างอำนาจตามลำดับชั้น ซึ่งสะท้อนให้เห็นว่าผลประโยชน์ของใครได้รับการให้ความสำคัญเป็นอันดับแรก ในอดีต บทบาทของเลขานุการถือเป็นตำแหน่งสูงสุดสำหรับผู้หญิง ในขณะที่ผู้ชายสามารถใช้ประโยชน์จากตำแหน่งนี้เพื่อความก้าวหน้าในอาชีพการงาน[ 55 ]ดังนั้น ข้อถกเถียงนี้จึงเชื่อมโยงกับความกังวลที่กว้างขึ้นเกี่ยวกับการลดคุณค่าของงานเมื่อเกี่ยวข้องกับแรงงานของผู้หญิง[ 56 ]
ผลกระทบทางจริยธรรม
ในปี 2019 อันโตนิโอ เอ. คาซิลลีนักสังคมวิทยาชาวฝรั่งเศสได้วิพากษ์วิจารณ์ปัญญาประดิษฐ์และผู้ช่วยเสมือนจริงโดยเฉพาะในลักษณะดังต่อไปนี้:
ในประเด็นแรก การที่ผู้บริโภคให้ข้อมูลฟรีเพื่อใช้ในการฝึกฝนและพัฒนาผู้ช่วยเสมือนจริง โดยที่ผู้บริโภคมักไม่รู้ตัว ถือเป็นเรื่องที่น่ากังวลในเชิงจริยธรรม
แต่ในอีกระดับหนึ่ง การรู้ว่า AI เหล่านี้ ได้รับการฝึกฝนด้วยข้อมูลเหล่านี้ อย่างไร อาจเป็นเรื่องที่น่ากังวลทางด้านจริยธรรมยิ่งกว่า
ปัญญาประดิษฐ์นี้ได้รับการฝึกฝนผ่านเครือข่ายประสาทเทียม ซึ่งต้องใช้ ข้อมูลที่มีการติดป้ายกำกับจำนวนมหาศาลอย่างไรก็ตาม ข้อมูลนี้จำเป็นต้องได้รับการติดป้ายกำกับผ่านกระบวนการของมนุษย์ ซึ่งอธิบายถึงการเพิ่มขึ้นของงานขนาดเล็กในช่วงทศวรรษที่ผ่านมา กล่าวคือ การใช้คนบางคนทั่วโลกทำงานซ้ำๆ และง่ายๆ บางอย่างจากระยะไกลในราคาไม่กี่เซ็นต์ เช่น การฟังข้อมูลเสียงจากผู้ช่วยเสมือน และจดบันทึกสิ่งที่พูด งานขนาดเล็กถูกวิพากษ์วิจารณ์ในเรื่องความไม่มั่นคงของงาน และการขาดกฎระเบียบโดยสิ้นเชิง: เงินเดือนเฉลี่ยอยู่ที่ 1.38 ดอลลาร์ต่อชั่วโมงในปี 2010 [ 57 ]และไม่มีสวัสดิการด้านการดูแลสุขภาพหรือการเกษียณอายุค่าจ้างป่วยหรือค่าแรงขั้นต่ำดังนั้น ผู้ช่วยเสมือนและนักออกแบบจึงเป็นที่ถกเถียงกันในเรื่องการกระตุ้นความไม่มั่นคงของงาน และ AI ที่พวกเขานำเสนอก็ยังคงเป็นมนุษย์ในแง่ที่ว่ามันจะเป็นไปไม่ได้หากปราศจากงานขนาดเล็กของคนงานนับล้านคน[ 53 ]
ข้อกังวลด้านความเป็นส่วนตัวเกิดขึ้นจากข้อเท็จจริงที่ว่าคำสั่งเสียงมีให้ผู้ให้บริการผู้ช่วยเสมือนในรูปแบบที่ไม่ได้เข้ารหัส และสามารถแบ่งปันกับบุคคลที่สามและประมวลผลในลักษณะที่ไม่ได้รับอนุญาตหรือไม่คาดคิดได้[ 58 ]นอกจากเนื้อหาทางภาษาของคำพูดที่บันทึกไว้แล้ว ลักษณะการแสดงออกและลักษณะเสียงของผู้ใช้สามารถมีข้อมูลเกี่ยวกับเอกลักษณ์ทางชีวภาพ ลักษณะบุคลิกภาพ รูปร่าง สภาพสุขภาพกายและจิตใจ เพศ เพศสภาพ อารมณ์และความรู้สึก สถานะทางเศรษฐกิจและสังคม และแหล่งกำเนิดทางภูมิศาสตร์ได้โดยปริยาย[ 59 ]
การทำให้ผู้ช่วยเสมือนจริงมีลักษณะเป็นเพศหญิงมากขึ้น
ผู้ช่วยเสมือนส่วนใหญ่ เช่น Siri, Cortana และ Alexa ต่างก็มีเสียงและบุคลิกที่เป็นผู้หญิงเป็นค่าเริ่มต้น ซึ่งดึงดูดความสนใจไปที่ประเด็นเรื่องการเมืองแรงงานของงานเลขานุการ การทำให้เสียงของผู้ช่วยเสมือนเหล่านี้เป็นผู้หญิงก่อให้เกิดความกังวลเกี่ยวกับอคติทางเพศที่ฝังแน่นในงานของผู้หญิง และตอกย้ำความคิดเรื่องการยอมจำนนของผู้หญิงเมื่อผู้ใช้โต้ตอบกับพวกเธอ ในฐานะเลขานุการเสมือน ผู้ช่วยเหล่านี้เชื่อมโยงกับแบบแผนทางเพศที่เลขานุการเชื่อมโยงกับแบบแผนของงานบริการที่เป็นผู้หญิง สนับสนุน และไม่เป็นภัยคุกคาม[ 60 ]
นักวิชาการให้ความสนใจกับเสียงของผู้หญิงในผู้ช่วยเสมือนจริง โดยกล่าวถึงประเด็นเรื่องเพศในเทคโนโลยี นี่เป็นประเด็นที่น่าสนใจ เนื่องจากเทคโนโลยีที่มีอคติทางเพศอาจทำให้ผู้หญิงถูกมองเป็นวัตถุและถูกเหมารวมทางเพศมากขึ้น รวมถึงทำให้ช่องว่างทางเพศกว้างขึ้น นอกจากนี้ ยังมีความกังวลเกี่ยวกับการบังคับใช้เรื่องเล่าที่เหยียดเพศ เนื่องจากอคติโดยไม่รู้ตัวปรากฏให้เห็นในเด็กและผู้ใหญ่ที่ฝังความคิดเรื่องผู้หญิงและคำสั่งไว้[ 61 ]
แพลตฟอร์มสำหรับนักพัฒนา
แพลตฟอร์มพัฒนาซอฟต์แวร์ที่โดดเด่นสำหรับผู้ช่วยเสมือน ได้แก่:
- Amazon Lexเปิดให้ผู้พัฒนาใช้งานได้ในเดือนเมษายน พ.ศ. 2560 โดยใช้ เทคโนโลยี การเข้าใจภาษาธรรมชาติร่วมกับการรู้จำเสียงพูดอัตโนมัติ และเปิดตัวในเดือนพฤศจิกายน พ.ศ. 2559 [ 62 ]
- Google จัดเตรียมActions on Googleและ แพลตฟอร์ม Dialogflowสำหรับนักพัฒนาเพื่อสร้าง "Actions" สำหรับ Google Assistant [ 63 ]
- Apple จัดเตรียม SiriKit ให้กับนักพัฒนาเพื่อสร้างส่วนขยายสำหรับSiri
- WatsonของIBMแม้บางครั้งจะถูกกล่าวถึงว่าเป็นผู้ช่วยเสมือน แต่ในความเป็นจริงแล้วเป็นแพลตฟอร์มและชุมชนปัญญาประดิษฐ์ ทั้งหมดที่ขับเคลื่อนผู้ช่วยเสมือน แชทบอทและโซลูชันประเภทอื่นๆ อีกมากมาย[ 64 ] [ 65 ]
รุ่นก่อนๆ
ในระบบผู้ช่วยเสมือนจริงแบบแชทข้อความรุ่นก่อนๆ ผู้ช่วยมักจะถูกแทนด้วยอวตาร (หรือที่เรียกว่าตัวละครออนไลน์แบบโต้ตอบหรือตัวละครอัตโนมัติ ) ซึ่งเรียกอีกอย่างว่าเอเจนต์ที่มีตัวตน
ความเกี่ยวข้องทางเศรษฐกิจ
สำหรับบุคคลทั่วไป
ประสบการณ์ดิจิทัลที่เปิดใช้งานโดยผู้ช่วยเสมือนถือเป็นหนึ่งในความก้าวหน้าทางเทคโนโลยีที่สำคัญล่าสุดและเป็นเทรนด์ผู้บริโภคที่มีแนวโน้มดีที่สุด ผู้เชี่ยวชาญอ้างว่าประสบการณ์ดิจิทัลจะได้รับการยอมรับในระดับเดียวกับประสบการณ์ 'จริง' หรืออาจกลายเป็นที่ต้องการและมีคุณค่ามากกว่า[ 66 ]แนวโน้มนี้ได้รับการยืนยันจากจำนวนผู้ใช้บ่อยจำนวนมากและการเติบโตอย่างมากของจำนวนผู้ใช้ผู้ช่วยดิจิทัลเสมือนทั่วโลก ในช่วงกลางปี 2017 จำนวนผู้ใช้ผู้ช่วยดิจิทัลเสมือนบ่อยทั่วโลกคาดว่าจะอยู่ที่ประมาณ 1 พันล้านคน[ 67 ]นอกจากนี้ ยังสามารถสังเกตได้ว่าเทคโนโลยีผู้ช่วยดิจิทัลเสมือนไม่ได้จำกัดอยู่เฉพาะแอปพลิเคชันบนสมาร์ทโฟนอีกต่อไป แต่มีอยู่ในหลายภาคอุตสาหกรรม (รวมถึงยานยนต์โทรคมนาคม ค้าปลีก การดูแลสุขภาพ และการศึกษา) [ 68 ] เพื่อตอบสนองต่อค่าใช้จ่ายด้านการวิจัยและพัฒนาที่สำคัญของบริษัทต่างๆ ในทุกภาคส่วน และการใช้งานอุปกรณ์เคลื่อนที่ที่เพิ่มมากขึ้น ตลาดเทคโนโลยีการรู้จำเสียงพูดคาดว่าจะเติบโตในอัตราCAGR 34.9% ทั่วโลกในช่วงปี 2016 ถึง 2024 และจะแซงหน้าขนาดตลาดโลกที่ 7.5 พันล้านดอลลาร์สหรัฐภายในปี 2024 [ 68 ]จาก การศึกษาของ Ovumคาดการณ์ว่า "ฐานผู้ใช้งานผู้ช่วยดิจิทัลดั้งเดิม" จะมีจำนวนมากกว่าประชากรโลกภายในปี 2021 โดยมีอุปกรณ์ที่รองรับ AI เสียงที่ใช้งานอยู่ 7.5 พันล้านเครื่อง[ 69 ]จากข้อมูลของ Ovum ในเวลานั้น "Google Assistant จะครองตลาดอุปกรณ์ที่รองรับ AI เสียงด้วยส่วนแบ่งการตลาด 23.3% ตามมาด้วย Bixby ของ Samsung (14.5%), Siri ของ Apple (13.1%), Alexa ของ Amazon (3.9%) และ Cortana ของ Microsoft (2.3%)" [ 69 ]
เมื่อพิจารณาถึงการกระจายตัวตามภูมิภาคของผู้นำตลาด บริษัทในอเมริกาเหนือ (เช่นNuance Communications , IBM , eGain ) คาดว่าจะครองอุตสาหกรรมในอีกหลายปีข้างหน้า เนื่องจากผลกระทบที่สำคัญของ BYOD ( Bring Your Own Device ) และโมเดลธุรกิจการเคลื่อนที่ขององค์กร นอกจากนี้ ความต้องการที่เพิ่มขึ้นสำหรับแพลตฟอร์มที่ใช้สมาร์ทโฟนช่วยคาดว่าจะช่วยกระตุ้นการเติบโตของอุตสาหกรรมผู้ช่วยเสมือนอัจฉริยะ (IVA) ในอเมริกาเหนือต่อไป แม้ว่าจะมีขนาดเล็กกว่าเมื่อเทียบกับตลาดอเมริกาเหนือ อุตสาหกรรมผู้ช่วยเสมือนอัจฉริยะจาก ภูมิภาค เอเชียแปซิฟิกซึ่งมีผู้เล่นหลักอยู่ในอินเดียและจีน คาดว่าจะเติบโตในอัตราการเติบโตต่อปีที่ 40% (สูงกว่าค่าเฉลี่ยทั่วโลก) ในช่วงปี 2016–2024 [ 68 ]
โอกาสทางเศรษฐกิจสำหรับวิสาหกิจ
ผู้ช่วยเสมือนไม่ควรถูกมองว่าเป็นเพียงอุปกรณ์สำหรับบุคคลทั่วไปเท่านั้น เพราะอาจมีประโยชน์ทางเศรษฐกิจอย่างแท้จริงสำหรับองค์กรต่างๆ ตัวอย่างเช่น ผู้ช่วยเสมือนสามารถทำหน้าที่เป็นผู้ช่วยที่พร้อมให้บริการตลอดเวลาด้วยความรู้ที่ครอบคลุม และสามารถจัดการประชุม ตรวจสอบสินค้าคงคลัง ตรวจสอบข้อมูลต่างๆ ได้ ผู้ช่วยเสมือนมีความสำคัญมากยิ่งขึ้นเนื่องจากการบูรณาการเข้ากับวิสาหกิจขนาดเล็กและขนาดกลางมักเป็นขั้นตอนแรกที่ง่ายดายผ่านการปรับใช้และการใช้งานInternet of Things (IoT) ในวงกว้างมากขึ้น อันที่จริง เทคโนโลยี IoT ในตอนแรกถูกมองโดยวิสาหกิจขนาดเล็กและขนาดกลางว่าเป็นเทคโนโลยีที่มีความสำคัญอย่างยิ่ง แต่ซับซ้อน เสี่ยง หรือมีค่าใช้จ่ายสูงเกินกว่าจะนำมาใช้ได้[ 70 ]
ความปลอดภัย
ในเดือนพฤษภาคม 2018 นักวิจัยจากมหาวิทยาลัยแคลิฟอร์เนีย เบิร์กลีย์ได้ตีพิมพ์เอกสารที่แสดงให้เห็นว่าคำสั่งเสียงที่หูมนุษย์ไม่สามารถตรวจจับได้นั้น สามารถฝังลงในเพลงหรือข้อความที่พูดได้โดยตรง ซึ่งจะทำให้ผู้ช่วยเสมือนสามารถควบคุมการกระทำบางอย่างได้โดยที่ผู้ใช้ไม่ต้องสังเกตเห็น[ 71 ]นักวิจัยได้ทำการเปลี่ยนแปลงเล็กน้อยกับไฟล์เสียง ซึ่งทำให้รูปแบบเสียงที่ระบบการรู้จำเสียงพูดควรจะตรวจจับนั้นหายไป และถูกแทนที่ด้วยเสียงที่ระบบจะตีความแตกต่างออกไปและสั่งให้ระบบโทรออก เปิดเว็บไซต์ หรือแม้แต่โอนเงิน[ 71 ]ความเป็นไปได้ของเรื่องนี้เป็นที่ทราบกันมาตั้งแต่ปี 2016 [ 71 ]และส่งผลกระทบต่ออุปกรณ์จาก Apple, Amazon และ Google [ 72 ]
นอกเหนือจากการกระทำโดยไม่ตั้งใจและการบันทึกเสียงแล้ว ความเสี่ยงด้านความปลอดภัยและความเป็นส่วนตัวอีกประการหนึ่งที่เกี่ยวข้องกับผู้ช่วยเสมือนอัจฉริยะคือคำสั่งเสียงที่เป็นอันตราย: ผู้โจมตีที่ปลอมตัวเป็นผู้ใช้และออกคำสั่งเสียงที่เป็นอันตราย เช่น เพื่อปลดล็อกประตูอัจฉริยะเพื่อเข้าบ้านหรือโรงรถโดยไม่ได้รับอนุญาต หรือสั่งซื้อสินค้าออนไลน์โดยที่ผู้ใช้ไม่รู้ แม้ว่า IVA บางตัวจะมีคุณสมบัติการฝึกเสียงเพื่อป้องกันการปลอมตัวดังกล่าว แต่ระบบอาจแยกแยะเสียงที่คล้ายกันได้ยาก ดังนั้น บุคคลที่เป็นอันตรายที่สามารถเข้าถึงอุปกรณ์ที่เปิดใช้งาน IVA อาจหลอกระบบให้คิดว่าพวกเขาเป็นเจ้าของตัวจริงและกระทำการที่เป็นอาชญากรรมหรือก่อกวนได้[ 73 ]
การเปรียบเทียบผู้ช่วยที่โดดเด่น
| ผู้ช่วยส่วนตัวอัจฉริยะ | นักพัฒนา | ซอฟต์แวร์ฟรี | ฮาร์ดแวร์ฟรีและโอเพนซอร์ส | ช่อง ต่อ HDMI | อินพุต/เอาต์พุตภายนอก | อินเทอร์เน็ตของสิ่งต่างๆ (IoT) | การผสานรวม Chromecast | แอปสมาร์ทโฟน | เปิดใช้งานตลอดเวลา | ช่องทางการสื่อสารด้วยเสียงระหว่างหน่วย | ทักษะภาษา |
|---|---|---|---|---|---|---|---|---|---|---|---|
| อเล็กซ่า (หรือที่รู้จักกันในชื่อ เอคโค่ ) | อเมซอน.คอม | เลขที่ | เลขที่ | เลขที่ | เลขที่ | ใช่ | เลขที่ | ใช่ | ใช่ | ? | สคริปต์ |
| อลิซ | แยนเด็กซ์ | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ใช่ | เลขที่ | ใช่ | ใช่ | ไม่มีข้อมูล | ? |
| อาลีจีนี | กลุ่มบริษัทอาลีบาบา | เลขที่ | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ใช่ | เลขที่ | ใช่ | ใช่ | ไม่มีข้อมูล | ? |
| ผู้ช่วย | สปีคโทอิท | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | เลขที่ | เลขที่ | ใช่ | เลขที่ | ไม่มีข้อมูล | ? |
| บิกซ์บี้ | ซัมซุง อิเล็กโทรนิคส์ | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | เลขที่ | เลขที่ | ใช่ | ไม่มีข้อมูล | ไม่มีข้อมูล | สคริปต์ |
| ผู้ช่วยแบล็กเบอร์รี่ | บริษัท แบล็กเบอร์รี่ จำกัด | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | เลขที่ | เลขที่ | ใช่ | เลขที่ | ไม่มีข้อมูล | ? |
| ไบรน่า | เบรนนาซอฟต์ | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | เลขที่ | เลขที่ | ใช่ | เลขที่ | ไม่มีข้อมูล | ? |
| โคลวา | บริษัท นาเวอร์ คอร์ปอเรชั่น | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ใช่ | เลขที่ | ใช่ | ใช่ | ไม่มีข้อมูล | ? |
| คอร์ทานา | ไมโครซอฟต์ | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ใช่ | เลขที่ | ใช่ | ใช่ | ไม่มีข้อมูล | ? |
| ดูเออร์ | ไบดู[ 74 ] | ||||||||||
| เอวี | Amazon.comและTrue Knowledge | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | เลขที่ | เลขที่ | ใช่ | เลขที่ | ไม่มีข้อมูล | ? |
| Google Assistant | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ใช่ | ใช่ | ใช่ | ใช่ | ไม่มีข้อมูล | ซี++ | |
| กูเกิล นาว | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ใช่ | ใช่ | ใช่ | ใช่ | ไม่มีข้อมูล | ? | |
| ไมครอฟต์[ 75 ] | ไมครอฟต์ AI | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | ไพธอน |
| ซิลเวีย | รหัสความรู้ความเข้าใจ | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | เลขที่ | เลขที่ | ใช่ | เลขที่ | ไม่มีข้อมูล | ? |
| สิริ | บริษัท แอปเปิล อิงค์ | เลขที่ | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ใช่ | เลขที่ | ใช่ | ใช่ | ไม่มีข้อมูล | ? |
| วิฟ | ซัมซุง อิเล็กโทรนิคส์ | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ไม่มีข้อมูล | ใช่ | เลขที่ | ใช่ | เลขที่ | ไม่มีข้อมูล | ? |
| เสี่ยวเหว่ย | เทนเซ็นต์ | ? | |||||||||
| เซเลีย | หัวเว่ย | เลขที่ | เลขที่ | ไม่มีข้อมูล | ไม่มีข้อมูล | ใช่ | เลขที่ | ใช่ | ใช่ | ไม่มีข้อมูล | ? |
ดูเพิ่มเติม
- การประยุกต์ใช้ปัญญาประดิษฐ์
- สิ่งมีชีวิตสนทนาเทียม
- ปัญญาประดิษฐ์ที่เป็นเพื่อนมนุษย์
- เอเจนต์อิสระ
- ภาพเคลื่อนไหวใบหน้าด้วยคอมพิวเตอร์
- ระบบผู้เชี่ยวชาญ
- ปัญญาประดิษฐ์ที่เป็นมิตร
- เครือข่ายภายในบ้าน
- ระบบอัจฉริยะแบบไฮบริด
- ตัวแทนอัจฉริยะ
- บริษัท อินเตอร์แอคชั่นส์ คอร์ปอเรชั่น
- นักนำทางความรู้
- ผู้ช่วยสำนักงาน
- ระบบหลายเอเจนต์
- สมมติฐานการจำลอง
- บอทโซเชียล
- การปฏิวัติข้อมูลทางสังคม
- ซอฟต์แวร์บอท
- วิซาร์ด (ซอฟต์แวร์)
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ ผู้ช่วยเสมือนจริง
ผู้ ช่วยเสมือน (Virtual Assistant หรือ VA ) คือ โปรแกรม ที่สามารถทำงานหรือให้บริการต่างๆ แก่ผู้ใช้ตามข้อมูลที่ผู้ใช้ป้อน เช่น คำสั่งหรือคำถาม รวมถึงคำถามด้วยเสียง...
ทศวรรษแห่งการทดลอง: ทศวรรษ 1910–1980
Radio Rex เป็นของเล่นที่สั่งงานด้วยเสียงตัวแรกที่ได้รับสิทธิบัตรในปี พ.ศ. 2459 [ 7 ] และวางจำหน่ายในปี พ.ศ. 2465 [ 8 ] เป็นของเล่นไม้รูปสุนัขที่จะออกมาจากบ้านเมื่อมีคนเรียกชื่อมัน
กำเนิดผู้ช่วยเสมือนอัจฉริยะ: ทศวรรษ 1990–2010
ในช่วงทศวรรษ 1990 เทคโนโลยีการรู้จำเสียงพูดแบบดิจิทัลกลายเป็นคุณสมบัติสำคัญของคอมพิวเตอร์ส่วนบุคคล โดยมี บริษัท IBM , Philips และ Lernout & Hauspie แข่งขันกันเพื่อแย่งชิงลูกค้า ต่อมา การเปิดตัว สมาร์ทโฟนเครื่อง แรก ของ IBM Simon ในปี 1994...
แบบจำลองภาษาขนาดใหญ่: ทศวรรษ 2020 ถึงปัจจุบัน
ในช่วงทศวรรษ 2020 ระบบปัญญาประดิษฐ์ (AI) เช่น ChatGPT ได้รับความนิยมมากขึ้นเนื่องจากความสามารถในการสร้างคำตอบที่เหมือนมนุษย์สำหรับการสนทนาแบบข้อความ ในเดือนกุมภาพันธ์ 2020 ไมโครซอฟต์ได้เปิดตัว Turing Natural Language Generation (T-NLG) ซึ่งในขณะนั้นเป็น...