กลับไปหน้าบทความ

อ่าน 2 นาที

เครื่องมือค้นหาเสียง

เครื่องมือค้นหาเสียง เป็น เครื่องมือค้นหาบนเว็บที่ค้นหา เนื้อหา เสียงจากทั่วเว็บข้อมูลอาจประกอบด้วยหน้าเว็บ รูปภาพ ไฟล์เสียง หรือเอกสารประเภทอื่น ๆ มีเทคนิคต่าง ๆ...

เครื่องมือค้นหาเสียง

เครื่องมือค้นหาเสียง เป็น เครื่องมือค้นหาบนเว็บที่ค้นหา เนื้อหา เสียงจากทั่วเว็บข้อมูลอาจประกอบด้วยหน้าเว็บ รูปภาพ ไฟล์เสียง หรือเอกสารประเภทอื่น ๆ มีเทคนิคต่าง ๆ มากมายสำหรับการค้นหาในเครื่องมือค้นหาเหล่านี้

ค้นหาไฟล์เสียงจากข้อความ

ข้อความที่ผู้ใช้ป้อนลงในช่องค้นหาจะถูกนำไปเปรียบเทียบกับฐานข้อมูลของเครื่องมือ ค้นหา

ผลการค้นหาจะแสดงคำอธิบายโดยย่อของไฟล์เสียงและคุณลักษณะต่างๆ เช่นความถี่ ในการสุ่มตัวอย่าง อัตราบิตประเภทไฟล์ ความยาวระยะเวลาหรือประเภทการเข้ารหัส ผู้ใช้สามารถดาวน์โหลดไฟล์ที่ได้

ค้นหาเสียงจากภาพ

ระบบ Query by Example (QBE) เป็นอัลกอริธึมการค้นหาที่ใช้การดึงภาพตามเนื้อหา (CBIR)

ระบบจะสร้างคำสำคัญจากภาพที่วิเคราะห์แล้ว จากนั้นจะใช้คำสำคัญเหล่านี้ในการค้นหาไฟล์เสียงในฐานข้อมูล

ผลการค้นหาจะแสดงตามความต้องการของผู้ใช้เกี่ยวกับประเภทไฟล์ ( wav , mp3 , aiff …) หรือคุณลักษณะอื่นๆ

ด้านบน:รูปคลื่นเสียงด้านล่าง:สเปกโทรแกรมเสียง

ค้นหาไฟล์เสียงจากไฟล์เสียง

ในการค้นหาไฟล์เสียงจากไฟล์เสียงผู้ใช้ต้องเล่นเสียงเพลงโดยใช้โปรแกรมเล่นเพลง ร้องเพลง หรือฮัมเพลงผ่านไมโครโฟนของคอมพิวเตอร์ จากนั้น ระบบจะสร้างรูปแบบเสียงจากรูปคลื่นเสียง และสร้างการแสดงความถี่จากฟูริเยร์ทรานส์ฟอร์มรูปแบบนี้จะถูกนำไปเปรียบเทียบกับรูปแบบที่สอดคล้องกับรูปคลื่นและฟูริเยร์ทรานส์ฟอร์มของไฟล์เสียงที่พบในฐานข้อมูล ไฟล์เสียงทั้งหมดในฐานข้อมูลที่มีรูปแบบคล้ายกับรูปแบบที่ค้นหาจะแสดงเป็นผลการค้นหา

การออกแบบและอัลกอริธึม

สเปกโทรแกรมของเสียงไวโอลิน
พื้นที่เป้าหมายของเพลงที่สแกนโดย Shazam

การค้นหาด้วยเสียงได้พัฒนาอย่างช้าๆ ผ่านรูปแบบการค้นหาพื้นฐานหลายรูปแบบที่มีอยู่ในปัจจุบัน ซึ่งทั้งหมดใช้คำหลักคำหลักสำหรับการค้นหาแต่ละครั้งสามารถพบได้ในชื่อของสื่อ ข้อความใดๆ ที่แนบมากับสื่อ และเนื้อหาที่เชื่อมโยงไปยังหน้าเว็บ ซึ่งกำหนดโดยผู้เขียนและผู้ใช้ของแหล่งข้อมูลวิดีโอที่โฮสต์อยู่

เครื่องมือค้นหาบางตัวสามารถค้นหาเสียงที่บันทึกไว้ เช่น พอดแคสต์ได้ แม้ว่าอาจทำได้ยากหากมีเสียงรบกวนรอบข้าง ในแต่ละภาษามี หน่วยเสียง ประมาณ 40 หน่วย และมีหน่วยเสียงประมาณ 400 หน่วยในภาษาพูดทั้งหมด แทนที่จะใช้ขั้นตอนวิธีค้นหาข้อความหลังจากประมวลผลเสียงเป็นข้อความเสร็จแล้ว เครื่องมือค้นหาบางตัวใช้ขั้นตอนวิธีค้นหาตามหลักสัทศาสตร์เพื่อค้นหาผลลัพธ์ภายในคำพูด ส่วนเครื่องมือค้นหาอื่นๆ ทำงานโดยการฟังพอดแคสต์ทั้งหมดและสร้างการถอดเสียงเป็นข้อความ

แอปพลิเคชันอย่าง Munax ใช้ขั้นตอนวิธีจัดอันดับอิสระหลายขั้นตอน โดยใช้ดัชนีผกผันร่วมกับพารามิเตอร์การค้นหาหลายร้อยรายการเพื่อสร้างการจัดอันดับสุดท้ายสำหรับแต่ละเอกสาร เช่นเดียวกับ Shazam ที่ทำงานโดยการวิเคราะห์เสียงที่บันทึกและค้นหาการจับคู่โดยใช้ลายนิ้วมือเสียงในฐานข้อมูลเพลงมากกว่า 11 ล้านเพลง Shazam ระบุเพลงโดยใช้ลายนิ้วมือเสียงที่สร้างจากกราฟความถี่เวลาที่เรียกว่าสเปกโตรแกรม Shazam จัดเก็บแคตตาล็อกลายนิ้วมือเสียงไว้ในฐานข้อมูล ผู้ใช้แท็กเพลงเป็นเวลา 10 วินาที และแอปพลิเคชันจะสร้างลายนิ้วมือเสียง เมื่อสร้างลายนิ้วมือเสียงแล้ว Shazam จะเริ่มค้นหาการจับคู่ในฐานข้อมูล หากพบการจับคู่ ระบบจะส่งข้อมูลกลับไปยังผู้ใช้ มิฉะนั้นจะแสดงข้อความ "ไม่รู้จักเพลง" Shazam สามารถระบุเพลงที่บันทึกไว้ล่วงหน้าซึ่งกำลังออกอากาศจากแหล่งใดก็ได้ เช่น วิทยุ โทรทัศน์ โรงภาพยนตร์ หรือดนตรีในคลับ ตราบใดที่ระดับเสียงรบกวนพื้นหลังไม่สูงพอที่จะขัดขวางการสร้างลายนิ้วมือเสียง และเพลงนั้นมีอยู่ในฐานข้อมูลของซอฟต์แวร์

เครื่องยนต์ที่โดดเด่น

  • Picsearch Audio Search ได้รับการอนุญาตให้ใช้ในการค้นหาพอร์ทัลตั้งแต่ปี 2006 Picsearch เป็นผู้ให้บริการเทคโนโลยีการค้นหาที่ให้บริการค้นหารูปภาพ วิดีโอ และเสียงสำหรับเครื่องมือค้นหาหลักกว่า 100 แห่งทั่วโลก บริการ Picsearch ยุติการดำเนินงานในปี 2022 [ 1 ]

สำหรับสมาร์ทโฟน

  • SoundHound (เดิมชื่อMidomi ) เป็นทั้งซอฟต์แวร์และบริษัท (ใช้ชื่อเดียวกัน) ที่ช่วยให้ผู้ใช้ค้นหาผลลัพธ์ด้วยเสียง คุณสมบัติของมันคือ บริการ ปัญญาประดิษฐ์ ที่ใช้เสียงเป็นหลัก และบริการค้นหาเพลงและรายละเอียดเกี่ยวกับเพลงเหล่านั้นโดยการร้องเพลงฮัมเพลงหรือบันทึกเสียง
  • Shazamเป็นแอปพลิเคชันสำหรับสมาร์ทโฟนหรือ Mac ที่รู้จักกันดีในด้านความสามารถในการระบุเพลง แอปนี้ใช้ไมโครโฟนในตัวเพื่อเก็บตัวอย่างเสียงที่กำลังเล่นอยู่ จากนั้นจะสร้างลายนิ้วมือเสียงจากตัวอย่างนั้น และเปรียบเทียบกับฐานข้อมูลส่วนกลางเพื่อหาเพลงที่ตรงกัน หากพบเพลงที่ตรงกัน แอปจะส่งข้อมูล เช่น ศิลปิน ชื่อเพลง และอัลบั้ม กลับไปยังผู้ใช้
  • Doresoสามารถระบุเพลงได้โดยการฮัมหรือร้องทำนองเพลงผ่านไมโครโฟน และโดยการป้อนชื่อเพลงหรือชื่อนักร้องโดยตรง แอปจะให้ข้อมูลเกี่ยวกับชื่อเพลง นักร้อง และช่วยให้คุณสามารถซื้อเพลงได้
  • Munax (บริษัทที่เลิกกิจการไปแล้ว) เป็นบริษัทที่เปิดตัวเครื่องมือค้นหาเนื้อหาทุกประเภทในเวอร์ชันแรกเมื่อปี 2548 ส่วนเครื่องมือค้นหามัลติมีเดีย PlayAudioVideo ที่สร้างขึ้นในเดือนกรกฎาคม 2550 นั้น เป็นเครื่องมือค้นหามัลติมีเดียตัวแรกอย่างแท้จริง โดยสามารถค้นหาภาพ วิดีโอ และเสียงบนเว็บได้ในเครื่องมือค้นหาเดียวกัน และยังอนุญาตให้ผู้ใช้ดูตัวอย่างได้ในหน้าเดียวกัน ปัจจุบัน Munax ได้ปิดตัวลงแล้ว

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=Audio_search_engine&oldid=1333081348 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ เครื่องมือค้นหาเสียง

เครื่องมือค้นหาเสียง เป็น เครื่องมือค้นหาบนเว็บที่ค้นหา เนื้อหา เสียงจากทั่วเว็บข้อมูลอาจประกอบด้วยหน้าเว็บ รูปภาพ ไฟล์เสียง หรือเอกสารประเภทอื่น ๆ มีเทคนิคต่าง ๆ...

ค้นหาไฟล์เสียงจากข้อความ

ข้อความที่ผู้ใช้ป้อนลงในช่องค้นหาจะถูกนำไปเปรียบเทียบกับฐานข้อมูลของเครื่องมือ ค้นหา

ค้นหาเสียงจากภาพ

ระบบ Query by Example (QBE) เป็นอัลกอริธึมการค้นหาที่ใช้ การดึงภาพตามเนื้อหา (CBIR)

ค้นหาไฟล์เสียงจากไฟล์เสียง

ใน การค้นหาไฟล์เสียงจากไฟล์เสียง ผู้ใช้ต้องเล่นเสียงเพลงโดยใช้โปรแกรมเล่นเพลง ร้องเพลง หรือ ฮัมเพลง ผ่านไมโครโฟนของคอมพิวเตอร์ จากนั้น ระบบจะสร้างรูปแบบเสียงจากรูปคลื่นเสียง และสร้างการแสดงความถี่จาก ฟูริเยร์ทรานส์ฟอร์ม...