กลับไปหน้าบทความ

อ่าน 25 นาที

ศิลปะ AI

ศิลปะภาพปัญญาประดิษฐ์หรือศิลปะ AIคือผลงานศิลปะภาพที่สร้างหรือปรับปรุงผ่านการใช้งาน โปรแกรม ปัญญาประดิษฐ์ (AI)...

ศิลปะ AI

ภาพวาดแนวอิมเพรสชันนิสต์ depicting ตัวละครในฉากโอเปร่าแห่งอนาคต
Théâtre D'opéra Spatial (โรงละครโอเปร่าอวกาศ; 2022) ได้รับรางวัลชนะ เลิศการประกวด ศิลปะประจำปี 2022 ของงาน Colorado State Fairในประเภท "ศิลปินหน้าใหม่" (ไม่ใช่มืออาชีพ) ในหมวด "ศิลปะดิจิทัล/ภาพถ่ายดัดแปลงดิจิทัล"

ศิลปะภาพปัญญาประดิษฐ์หรือศิลปะ AIคือผลงานศิลปะภาพที่สร้างหรือปรับปรุงผ่านการใช้งาน โปรแกรม ปัญญาประดิษฐ์ (AI) ซึ่งส่วนใหญ่มักใช้โมเดลข้อความเป็นภาพกระบวนการสร้างงานศิลปะอัตโนมัติมีมาตั้งแต่สมัยโบราณ สาขาปัญญาประดิษฐ์ก่อตั้งขึ้นในช่วงทศวรรษ 1950 และศิลปินเริ่มสร้างงานศิลปะด้วยปัญญาประดิษฐ์ไม่นานหลังจากนั้น ผลงานสร้างสรรค์เหล่านี้จำนวนหนึ่งได้รับการจัดแสดงในพิพิธภัณฑ์และได้รับการยอมรับด้วยรางวัล[ 1 ]ตลอดประวัติศาสตร์ AI ได้ก่อให้เกิด คำถามเชิงปรัชญามากมายที่เกี่ยวข้องกับจิตใจมนุษย์สิ่งมีชีวิตเทียมและธรรมชาติของศิลปะในการทำงานร่วมกันระหว่างมนุษย์และ AI

ในช่วงที่ปัญญาประดิษฐ์เฟื่องฟูในทศวรรษ 2020 โมเดลแปลงข้อความเป็นภาพ เช่นMidjourney , DALL-EและStable Diffusionได้กลายเป็นที่แพร่หลายในหมู่ประชาชน ทำให้ผู้ใช้สามารถสร้างภาพได้อย่างรวดเร็วโดยใช้ความพยายามเพียงเล็กน้อย[ 2 ] [ 3 ]ความคิดเห็นเกี่ยวกับศิลปะปัญญาประดิษฐ์ในทศวรรษ 2020 มักมุ่งเน้นไปที่ประเด็นที่เกี่ยวข้องกับลิขสิทธิ์การหลอกลวงการหมิ่นประมาทและผลกระทบต่อศิลปินแบบดั้งเดิม รวมถึงการว่างงานจากเทคโนโลยี

ในเดือนสิงหาคม พ.ศ. 2566 ศาลฎีกาสหรัฐฯตัดสินว่างานศิลปะที่สร้างโดย AI ไม่สามารถได้รับลิขสิทธิ์ได้เนื่องจากไม่ตรงตามเกณฑ์การสร้างสรรค์โดยมนุษย์[ 4 ] [ 5 ]ในเดือนมีนาคม พ.ศ. 2569 ศาลปฏิเสธที่จะพิจารณาคดีเกี่ยวกับว่างานศิลปะที่สร้างโดย AI สามารถได้รับลิขสิทธิ์ได้หรือไม่[ 6 ] [ 7 ] [ 8 ]

ประวัติศาสตร์

ประวัติศาสตร์ยุคแรก

หุ่นยนต์ของไมลลาร์เดต์กำลังวาดภาพ

ศิลปะอัตโนมัติมีมาอย่างน้อยตั้งแต่สมัยหุ่นยนต์ของอารยธรรมกรีกโบราณเมื่อนักประดิษฐ์อย่างเดดาลัสและฮีโรแห่งอเล็กซานเดรียได้รับการอธิบายว่าออกแบบเครื่องจักรที่สามารถเขียนข้อความ สร้างเสียง และเล่นดนตรีได้[ 9 ] [ 10 ]หุ่นยนต์สร้างสรรค์เฟื่องฟูตลอดประวัติศาสตร์ เช่นหุ่นยนต์ของไมลลาร์เดต์ซึ่งสร้างขึ้นราวปี 1800 และสามารถสร้างภาพวาดและบทกวีได้หลายชิ้น[ 11 ]

ในศตวรรษที่ 19 เช่นกันAda Lovelaceเขียนว่า "การดำเนินการคำนวณ" อาจใช้ในการสร้างดนตรีและบทกวีได้[ 12 ] [ 13 ]ในปี 1950 บทความของAlan Turing เรื่อง " เครื่องจักรคำนวณและสติปัญญา " มุ่งเน้นไปที่ว่าเครื่องจักรสามารถเลียนแบบพฤติกรรมของมนุษย์ได้อย่างน่าเชื่อถือหรือไม่[ 14 ] หลังจากนั้นไม่นาน สาขาวิชาปัญญาประดิษฐ์ก็ถูกก่อตั้งขึ้นในการ ประชุมเชิงปฏิบัติการวิจัยที่วิทยาลัย Dartmouthในปี 1956 [ 15 ]

นับตั้งแต่เริ่มก่อตั้ง นักวิจัย AI ได้สำรวจคำถามเชิงปรัชญาเกี่ยวกับธรรมชาติของจิตใจมนุษย์และผลที่ตามมาจากการสร้างสิ่งมีชีวิตเทียมที่มีสติปัญญาคล้ายมนุษย์ ประเด็นเหล่านี้เคยถูกสำรวจโดยตำนานนิยายและปรัชญามาตั้งแต่สมัยโบราณแล้ว[ 16 ]

ประวัติศาสตร์ศิลปะ

ผลงานศิลปะจัดวาง " กาลาปากอส " ของคาร์ล ซิมส์เปิดโอกาสให้ผู้เข้าชมได้สร้างสรรค์รูปทรงแอนิเมชั่นสามมิติ

นับตั้งแต่มีการก่อตั้ง AI ในช่วงทศวรรษ 1950 ศิลปินได้ใช้ปัญญาประดิษฐ์ในการสร้างสรรค์ผลงานศิลปะ ผลงานเหล่า นี้บางครั้งถูกเรียกว่าศิลปะเชิงอัลกอริทึม [ 17 ]ศิลปะคอมพิวเตอร์ศิลปะดิจิทัลหรือศิลปะสื่อใหม่[ 18 ]

หนึ่งในระบบศิลปะ AI ที่สำคัญระบบแรกคือAARONซึ่งพัฒนาโดยHarold Cohenในช่วงปลายทศวรรษ 1960 ที่มหาวิทยาลัยแคลิฟอร์เนียซานดิเอโก[ 19 ] AARON ใช้แนวทางตามกฎเชิงสัญลักษณ์เพื่อสร้างภาพทางเทคนิคในยุคของ การเขียนโปรแกรม GOFAIและ Cohen พัฒนาระบบนี้โดยมีเป้าหมายเพื่อให้สามารถเขียนโค้ดสำหรับการวาดภาพได้[ 20 ] AARON ได้รับการจัดแสดงในปี 1972 ที่พิพิธภัณฑ์ศิลปะลอสแอนเจลิสเคาน์ตี้ [ 21 ] ตั้งแต่ปี 1973 ถึง 1975 Cohen ได้ปรับปรุง AARON ในระหว่างการพำนักที่ห้องปฏิบัติการปัญญาประดิษฐ์ที่มหาวิทยาลัยสแตนฟอร์ด [ 22 ] ในปี 2024 พิพิธภัณฑ์ศิลปะอเมริกันวิทนีย์ได้จัดแสดงงานศิลปะ AI จากตลอดอาชีพการงานของ Cohen รวมถึงเวอร์ชันที่สร้างขึ้นใหม่ของเครื่องจักรวาดภาพหุ่นยนต์ รุ่นแรกๆ ของเขา [ 22 ]

คาร์ล ซิมส์ได้จัดแสดงงานศิลปะที่สร้างขึ้นด้วยสิ่งมีชีวิตเทียมมาตั้งแต่ทศวรรษ 1980 เขาได้รับปริญญาโทสาขากราฟิกคอมพิวเตอร์จากMIT Media Labในปี 1987 และเป็นศิลปินประจำตั้งแต่ปี 1990 ถึง 1996 ที่ บริษัทผู้ผลิต ซูเปอร์คอมพิวเตอร์และปัญญาประดิษฐ์Thinking Machines [ 23 ] [ 24 ] [ 25 ]ในปี 1991 และ 1992 ซิมส์ได้รับรางวัล Golden Nica จากPrix Ars Electronicaสำหรับวิดีโอของเขาที่ใช้การวิวัฒนาการเทียม[ 26 ] [ 27 ] [ 28 ]ในปี 1997 ซิมส์ได้สร้างงานติดตั้งการวิวัฒนาการเทียมแบบโต้ตอบGalápagosสำหรับNTT InterCommunication Centerในโตเกียว[ 29 ]ซิมส์ได้รับรางวัล Emmy Awardในปี 2019 สำหรับความสำเร็จที่โดดเด่นในการพัฒนาด้านวิศวกรรม[ 30 ]

ตัวอย่างผลงานElectric SheepโดยScott Draves

ในปี พ.ศ. 2542 สก็อตต์ เดรฟส์และทีมวิศวกรหลายคนได้สร้างและเผยแพร่Electric Sheepเป็น โปรแกรม รักษาหน้าจอแบบฟรี[ 31 ] Electric Sheepเป็นโครงการคอมพิวเตอร์อาสาสมัครสำหรับการสร้างภาพเคลื่อนไหวและวิวัฒนาการของเปลวไฟแฟรกทัลซึ่งกระจายไปยังคอมพิวเตอร์เครือข่ายที่แสดงผลเป็นโปรแกรมรักษาหน้าจอ โปรแกรมรักษาหน้าจอนี้ใช้ AI ในการสร้างภาพเคลื่อนไหวที่ไม่มีที่สิ้นสุดโดยการเรียนรู้จากผู้ชม ในปี พ.ศ. 2544 เดรฟส์ได้รับรางวัล Fundacion Telefónica Life 4.0 สำหรับElectric Sheep [ 32 ]

ในปี 2014 สเตฟานี ดิงกินส์เริ่มทำงานในซีรีส์ Conversations with Bina48 [ 33 ] สำหรับซีรีส์นี้ ดิงกินส์ได้บันทึกบทสนทนาของเธอกับBINA48ซึ่งเป็นหุ่นยนต์สังคมที่มีลักษณะคล้ายหญิงผิวดำวัยกลางคน[ 34 ] [ 35 ]ในปี 2019 ดิงกินส์ได้รับ รางวัล Creative Capitalจากการสร้างปัญญาประดิษฐ์ที่พัฒนาตาม "ความสนใจและวัฒนธรรมของคนผิวสี" [ 36 ]

ในปี 2015 ซูกเวน ชุงได้เริ่มโครงการ Mimicry (Drawing Operations Unit: Generation 1)ซึ่งเป็นการทำงานร่วมกันอย่างต่อเนื่องระหว่างศิลปินและแขนหุ่นยนต์[ 37 ]ในปี 2019 ชุงได้รับรางวัล Lumen Prizeจากการแสดงอย่างต่อเนื่องกับแขนหุ่นยนต์ที่ใช้ AI เพื่อพยายามวาดภาพในลักษณะที่คล้ายกับชุง[ 38 ]

Edmond de Belamyสร้างขึ้นด้วยโครงข่ายประสาทเทียมแบบปฏิปักษ์เชิงสร้างสรรค์ (Generative Adversarial Network)ในปี 2018

ในปี 2018 มีการจัดการประมูลขายงานศิลปะปัญญาประดิษฐ์ที่Christie'sในนิวยอร์ก โดยงานศิลปะ AI ชื่อEdmond de Belamyขายได้ใน ราคา 432,500 ดอลลาร์สหรัฐซึ่งสูงกว่าราคาประเมินที่ 7,000–10,000 ดอลลาร์สหรัฐเกือบ 45 เท่า งานศิลปะชิ้นนี้สร้างโดย Obvious ซึ่งเป็นกลุ่มศิลปินในปารีส[ 39 ] [ 40 ] [ 41 ]

ในปี 2024 ภาพยนตร์ญี่ปุ่นเรื่อง generAIdoscopeได้ออกฉาย ภาพยนตร์เรื่องนี้กำกับร่วมโดยฮิโรทากะ อาดาจิทาเคชิ โซเนะ และฮิโรคิ ยามากุจิ วิดีโอ เสียง และดนตรีทั้งหมดในภาพยนตร์เรื่องนี้สร้างขึ้นด้วยปัญญาประดิษฐ์[ 42 ]

ในปี 2025 ซีรีส์ อนิเมะโทรทัศน์ ญี่ปุ่นเรื่อง Twins Hinahimaได้ออกฉาย อนิเมะเรื่องนี้ผลิตและสร้างแอนิเมชั่นโดยใช้ AI ช่วยในกระบวนการตัดต่อและแปลงภาพถ่ายเป็นภาพประกอบอนิเมะ และต่อมาได้รับการปรับแต่งโดยทีมงานศิลปะ ส่วนที่เหลือส่วนใหญ่ เช่น ตัวละครและโลโก้ ถูกวาดด้วยมือโดยใช้ซอฟต์แวร์ต่างๆ[ 43 ] [ 44 ]

ประวัติทางเทคนิค

การเรียนรู้เชิงลึกซึ่งมีลักษณะเฉพาะคือโครงสร้างหลายชั้นที่พยายามเลียนแบบสมองของมนุษย์ เกิดขึ้นครั้งแรกในช่วงทศวรรษ 2010 ทำให้เกิดการเปลี่ยนแปลงครั้งสำคัญในโลกของศิลปะ AI [ 45 ]ในยุคของการเรียนรู้เชิงลึก มีการออกแบบศิลปะเชิงกำเนิดเป็นหลักดังนี้: โมเดลอัตถารีเกรสซีฟ โมเดลการแพร่กระจายGANsและการ ไหล แบบปกติ

ในปี 2014 Ian Goodfellowและเพื่อนร่วมงานที่Université de Montréalได้พัฒนาเครือข่ายปฏิปักษ์เชิงสร้างสรรค์ (GAN) ซึ่งเป็น เครือข่ายประสาทเทียมเชิงลึกประเภทหนึ่งที่สามารถเรียนรู้ที่จะเลียนแบบการกระจายทางสถิติของข้อมูลอินพุต เช่น รูปภาพ GAN ใช้ "ตัวสร้าง" เพื่อสร้างรูปภาพใหม่ และ "ตัวจำแนก" เพื่อตัดสินว่ารูปภาพที่สร้างขึ้นใดถือว่าประสบความสำเร็จ[ 46 ]แตกต่างจากศิลปะเชิงอัลกอริทึมก่อนหน้านี้ที่ปฏิบัติตามกฎที่เขียนด้วยมือ เครือข่ายปฏิปักษ์เชิงสร้างสรรค์สามารถเรียนรู้สุนทรียภาพ เฉพาะ โดยการวิเคราะห์ชุดข้อมูลของรูปภาพตัวอย่าง[ 17 ]

ในปี 2015 ทีมงานของGoogleได้เปิดตัวDeepDreamซึ่งเป็นโปรแกรมที่ใช้โครงข่ายประสาทเทียมแบบ Convolutionalเพื่อค้นหาและปรับปรุงรูปแบบในภาพผ่านPareidolia แบบอัลกอริ ทึม[ 47 ] [ 48 ] [ 49 ]กระบวนการนี้สร้างภาพที่ผ่านการประมวลผลมากเกินไปโดยเจตนา ซึ่งมีลักษณะคล้ายความฝันที่ชวนให้นึกถึงประสบการณ์หลอนประสาท[ 47 ]ต่อมาในปี 2017 GAN แบบมีเงื่อนไขได้เรียนรู้ที่จะสร้างคลาสภาพ 1,000 คลาสของImageNet ซึ่งเป็น ฐานข้อมูลภาพขนาดใหญ่ที่ออกแบบมาเพื่อใช้ในการวิจัยซอฟต์แวร์การจดจำวัตถุภาพ[ 50 ] [ 51 ]ด้วยการกำหนดเงื่อนไข GAN ทั้งจากสัญญาณรบกวนแบบสุ่มและป้ายกำกับคลาสเฉพาะ วิธีการนี้ช่วยเพิ่มคุณภาพของการสังเคราะห์ภาพสำหรับโมเดลแบบมีเงื่อนไขคลาส[ 52 ]

โมเดลอัตถารีเกรสซีฟถูกใช้สำหรับการสร้างภาพ เช่น PixelRNN (2016) ซึ่งสร้างพิกเซลทีละพิกเซลโดยใช้โครงข่ายประสาทแบบวนซ้ำ [ 53 ] ทันทีหลังจากที่ สถาปัตยกรรม Transformerได้รับการเสนอในAttention Is All You Need (2018) ก็ถูกนำมาใช้สำหรับการสร้างภาพแบบอัตถารีเกรสซีฟ แต่ไม่มีการปรับเงื่อนไขข้อความ[ 54 ]

เว็บไซต์Artbreederซึ่งเปิดตัวในปี 2018 ใช้โมเดลStyleGANและ BigGAN [ 55 ] [ 56 ]เพื่อให้ผู้ใช้สามารถสร้างและแก้ไขรูปภาพ เช่น ใบหน้า ทิวทัศน์ และภาพวาด[ 57 ]

ในช่วงทศวรรษ 2020 โมเดลข้อความเป็นภาพซึ่งสร้างภาพตามคำสั่ง ได้ ถูกนำมาใช้อย่างแพร่หลาย ถือเป็นการเปลี่ยนแปลงครั้งสำคัญอีกประการหนึ่งในการสร้างงานศิลปะที่สร้างโดย AI [ 2 ]

ตัวอย่างภาพที่สร้างด้วย VQGAN-CLIP (NightCafe Studio, มีนาคม 2023)
ตัวอย่างภาพที่สร้างด้วย Flux 1.1 Pro ในโหมด Raw (พฤศจิกายน 2024) โหมดนี้ออกแบบมาเพื่อสร้างภาพที่สมจริง

ในปี 2021 OpenAIได้เผยแพร่ชุดภาพที่สร้างขึ้นด้วยโมเดล AI แปลงข้อความเป็นภาพDALL-E 1โดย ใช้โมเดล Transformer ที่ได้รับการฝึกฝนล่วงหน้าสำหรับการสร้างภาษาขนาดใหญ่ ที่มีอิทธิพล ซึ่งใช้ในGPT-2และGPT-3 [ 58 ] ซึ่งเป็นโมเดลการสร้างแบบอัตถารีเกรสซีฟที่มีสถาปัตยกรรมพื้นฐานเหมือนกับ GPT-3 นอกจากนี้ ในช่วงปลายปี 2021 EleutherAIยังได้เผยแพร่VQGAN-CLIP [ 59 ] ซึ่งเป็น โอเพนซอร์สโดยอิงจากโมเดล CLIP ของ OpenAI [ 60 ]โมเดลการแพร่กระจาย (Diffusion models)ซึ่งเป็นโมเดลเชิงกำเนิดที่ใช้สร้างข้อมูลสังเคราะห์โดยอิงจากข้อมูลที่มีอยู่[ 61 ]ได้รับการเสนอครั้งแรกในปี 2015 [ 62 ]แต่เพิ่งจะดีกว่า GANs ในช่วงต้นปี 2021 [ 63 ]โมเดลการแพร่กระจายแฝง (Latent diffusion model ) ได้รับการเผยแพร่ในเดือนธันวาคม 2021 และกลายเป็นพื้นฐานสำหรับStable Diffusion ในภายหลัง (สิงหาคม 2022) ซึ่งพัฒนาขึ้นจากการทำงานร่วมกันระหว่าง Stability AI, CompVis Group ที่ LMU Munich และ Runway [ 64 ]

ในปี 2022 Midjourney [ 65 ]ได้รับการเผยแพร่ ตามมาด้วยImagen และ Parti ของGoogle Brainซึ่งประกาศในเดือนพฤษภาคม 2022, NUWA-Infinity ของMicrosoft [ 66 ] [ 2 ]และStable Diffusion ที่มีซอร์สโค้ดให้ใช้งานได้ซึ่งเผยแพร่ในเดือนสิงหาคม 2022 [ 67 ] [ 68 ] [ 69 ] DALL-E 2 ซึ่งเป็นรุ่นต่อจาก DALL-E ได้รับการทดสอบเบต้าและเผยแพร่ (โดยมีรุ่นต่อยอดคือ DALL-E 3 เผยแพร่ในปี 2023) Stability AI มีเว็บอินเทอร์เฟซ Stable Diffusion ที่เรียกว่า DreamStudio [ 70 ] ปลั๊กอินสำหรับKrita , Photoshop , BlenderและGIMP [ 71 ]และ เว็บอินเทอ ร์เฟซผู้ใช้แบบโอเพนซอร์สAutomatic1111 [ 72 ] [ 73 ] [ 74 ]โมเดลหลักที่ฝึกฝนล่วงหน้าของ Stable Diffusion จะถูกแชร์บนHugging Face Hub [ 75 ]  

Ideogramเปิดตัวในเดือนสิงหาคม พ.ศ. 2566 โมเดลนี้เป็นที่รู้จักในด้านความสามารถในการสร้างข้อความที่อ่านได้[ 76 ] [ 77 ]

ในปี 2024 Fluxได้ถูกปล่อยออกมา โมเดลนี้สามารถสร้างภาพที่สมจริงและถูกรวมเข้ากับGrok ซึ่ง เป็นแชทบอทที่ใช้บนX (เดิมคือ Twitter)และLe Chatซึ่งเป็นแชทบอทของMistral AI [ 3 ] [ 78 ] [ 79 ] [ 80 ] Flux ได้รับการพัฒนาโดย Black Forest Labs ซึ่งก่อตั้งโดยนักวิจัยเบื้องหลัง Stable Diffusion [ 81 ] ต่อมา Grok ได้เปลี่ยนไปใช้โมเดลแปลงข้อความเป็นภาพ Auroraของตนเองในเดือนธันวาคมของปีเดียวกัน[ 82 ]หลายบริษัทพร้อมกับผลิตภัณฑ์ของพวกเขายังได้พัฒนาโมเดล AI ที่รวมเข้ากับบริการแก้ไขภาพAdobeได้เปิดตัวและรวมโมเดล AI Fireflyเข้ากับPremiere Pro , PhotoshopและIllustrator [ 83 ] [ 84 ] Microsoft ยังได้ประกาศคุณสมบัติการสร้างภาพ AI สำหรับMicrosoft Paintอย่างเป็น ทางการอีกด้วย [ 85 ]นอกจากนี้ ตัวอย่างของโมเดลแปลงข้อความเป็นวิดีโอในช่วงกลางทศวรรษ 2020 ได้แก่Gen-4 ของ Runway, VideoPoet ของ Google, Soraของ OpenAI ซึ่งเปิดตัวในเดือนธันวาคม 2024 และLTX-2ซึ่งเปิดตัวในปี 2025 [ 86 ] [ 87 ] [ 88 ]

ในปี 2025 มีการเปิดตัวโมเดลหลายรุ่นGPT Image 1จากOpenAIซึ่งเปิดตัวในเดือนมีนาคม 2025 ได้นำเสนอการเรนเดอร์ข้อความและความสามารถแบบมัลติโมดอลใหม่ ทำให้สามารถสร้างภาพจากอินพุตที่หลากหลาย เช่น ภาพร่างและข้อความ[ 89 ] MidJourney v7เปิดตัวในเดือนเมษายน 2025 โดยมีการปรับปรุงการประมวลผลข้อความแจ้งเตือน[ 90 ]ในเดือนพฤษภาคม 2025 Flux.1 Kontextจาก Black Forest Labs ได้ปรากฏตัวขึ้นในฐานะโมเดลที่มีประสิทธิภาพสำหรับการสร้างภาพที่มีความละเอียดสูง[ 91 ]ในขณะที่Imagen 4 ของ Google ได้รับการเผยแพร่พร้อมกับความสมจริงของภาพถ่ายที่ได้รับการปรับปรุง[ 92 ] Flux.2 เปิดตัวในเดือนพฤศจิกายน 2025 พร้อมกับการอ้างอิงภาพ การพิมพ์ และความเข้าใจข้อความแจ้งเตือนที่ได้รับการปรับปรุง[ 93 ]

เครื่องมือและกระบวนการ

แนวทาง

ศิลปินใช้วิธีการมากมายในการพัฒนาศิลปะภาพ AI เมื่อ ใช้ การแปลงข้อความเป็นภาพ AI จะสร้างภาพตามคำอธิบายข้อความ โดยใช้โมเดล เช่น สถาปัตยกรรมแบบกระจายหรือแบบทรานส์ฟอร์เมอร์ ผู้ใช้ป้อนข้อความแจ้ง และ AI จะสร้างภาพที่สอดคล้องกัน[ 94 ] [ 95 ]เมื่อใช้การแปลงภาพเป็นภาพ AI จะแปลงภาพที่ป้อนเข้ามาเป็นสไตล์หรือรูปแบบใหม่ตามข้อความแจ้งหรือการอ้างอิงสไตล์ เช่น การเปลี่ยนภาพร่างให้เป็นภาพที่สมจริง หรือการใช้สไตล์ศิลปะ[ 96 ] [ 97 ]เมื่อใช้การแปลงภาพเป็นวิดีโอ AI จะสร้างคลิปวิดีโอสั้นหรือแอนิเมชันจากภาพเดียวหรือลำดับภาพ โดยมักจะเพิ่มการเคลื่อนไหวหรือการเปลี่ยนภาพ ซึ่งอาจรวมถึงการสร้างแอนิเมชันจากภาพนิ่งหรือการสร้างฉากแบบไดนามิก[ 98 ] [ 99 ]เมื่อ ใช้ การแปลงข้อความเป็นวิดีโอ AI จะสร้างวิดีโอโดยตรงจากข้อความแจ้ง สร้างแอนิเมชัน ฉากที่สมจริง หรือภาพนามธรรม นี่เป็นการต่อยอดจากการแปลงข้อความเป็นภาพ แต่เน้นที่ลำดับเวลา[ 100 ]

ภาพ

ตัวอย่างการใช้งานComfyUIสำหรับ Stable Diffusion XL ผู้ใช้สามารถปรับตัวแปรต่างๆ (เช่น CFG, seed และ sampler) ที่จำเป็นในการสร้างภาพได้

มีเครื่องมือมากมายให้ศิลปินเลือกใช้เมื่อทำงานกับแบบจำลองการแพร่กระจาย พวกเขาสามารถกำหนดทั้งคำแนะนำเชิงบวกและเชิงลบได้ แต่พวกเขายังมีทางเลือกในการใช้ (หรือไม่ใช้) VAE , LoRA , ไฮเปอร์เน็ตเวิร์ก, IP-adapter และการฝัง/การกลับข้อความ ศิลปินสามารถปรับแต่งการตั้งค่าต่างๆ เช่น มาตราส่วนการนำทาง (ซึ่งสร้างสมดุลระหว่างความคิดสร้างสรรค์และความแม่นยำ), เมล็ดพันธุ์ (เพื่อควบคุมความสุ่ม) และตัวเพิ่มความละเอียด (เพื่อเพิ่มความละเอียดของภาพ) เป็นต้น นอกจากนี้ยังสามารถเพิ่มอิทธิพลได้ในระหว่างขั้นตอนก่อนการอนุมานโดยการจัดการสัญญาณรบกวน ในขณะที่เทคนิคการประมวลผลภายหลังแบบดั้งเดิมมักใช้ในขั้นตอนหลังการอนุมาน ผู้คนยังสามารถฝึกฝนแบบจำลองของตนเองได้อีกด้วย

นอกจากนี้ ยังมีการพัฒนาเทคนิคการสร้างภาพแบบ "อิงตามกฎ" โดยใช้รูปแบบทางคณิตศาสตร์ อัลกอริทึมที่จำลองการลงพู่กันและเอฟเฟกต์การวาดภาพอื่นๆ รวมถึงแบบจำลองการเรียนรู้เชิงลึก เช่นเครือข่ายปฏิปักษ์เชิงกำเนิด (GANs) และทรานส์ฟอร์เมอร์ บริษัทหลายแห่งได้เปิดตัวแอปพลิเคชันและเว็บไซต์ที่อนุญาตให้ผู้ใช้มุ่งเน้นเฉพาะคำแนะนำเชิงบวก โดยไม่ต้องกำหนดค่าพารามิเตอร์อื่นๆ ด้วยตนเอง นอกจากนี้ยังมีโปรแกรมที่สามารถแปลงภาพถ่ายให้เป็นภาพที่มีสไตล์ซึ่งเลียนแบบสุนทรียภาพของรูปแบบการวาดภาพที่เป็นที่รู้จักกันดี[ 101 ] [ 102 ]

มีตัวเลือกมากมาย ตั้งแต่แอปมือถือที่ใช้งานง่ายสำหรับผู้บริโภค ไปจนถึงJupyter notebooks และเว็บ UI ที่ต้องใช้ GPU ที่ทรงพลังในการทำงานอย่างมีประสิทธิภาพ[ 103 ]ฟังก์ชันเพิ่มเติม ได้แก่ "การผกผันข้อความ" ซึ่งหมายถึงการเปิดใช้งานการใช้แนวคิดที่ผู้ใช้ให้มา (เช่น วัตถุหรือรูปแบบ) ที่เรียนรู้จากภาพไม่กี่ภาพ จากนั้นสามารถสร้างงานศิลปะใหม่จากคำที่เกี่ยวข้อง (ข้อความที่ถูกกำหนดให้กับแนวคิดที่เรียนรู้ ซึ่งมักจะเป็นนามธรรม) [ 104 ] [ 105 ]และการขยายโมเดลหรือการปรับแต่งอย่างละเอียด (เช่นDreamBooth )

ผลกระทบและการประยุกต์ใช้

AI มีศักยภาพในการเปลี่ยนแปลงสังคมซึ่งอาจรวมถึงการเปิดใช้งานการขยายตัวของแนวเฉพาะกลุ่มที่ไม่ใช่เชิงพาณิชย์ (เช่นอนุพันธ์ไซเบอร์พังก์อย่างโซลาร์พังก์ ) โดยมือสมัครเล่น ความบันเทิงรูปแบบใหม่ การสร้างต้นแบบอย่างรวดเร็ว[ 106 ]การเพิ่มการเข้าถึงการสร้างสรรค์งานศิลปะ[ 106 ]และผลผลิตทางศิลปะต่อความพยายาม ค่าใช้จ่าย หรือเวลา[ 106 ]เช่น ผ่านการสร้างร่าง ร่างคำจำกัดความ และส่วนประกอบของภาพ ( การเติมสี ) ภาพที่สร้างขึ้นบางครั้งใช้เป็นภาพร่าง[ 107 ]การทดลองต้นทุนต่ำ[ 108 ]แรงบันดาลใจ หรือภาพประกอบของแนวคิดในขั้นตอนการพิสูจน์แนวคิด ฟังก์ชันการทำงานเพิ่มเติมหรือการปรับปรุงอาจเกี่ยวข้องกับการแก้ไขด้วยตนเองหลังการสร้าง (เช่น การขัดเกลา) เช่น การปรับแต่งเพิ่มเติมด้วยโปรแกรมแก้ไขภาพ[ 108 ]

ศิลปินและนักออกแบบทัศนศิลป์มืออาชีพใช้ AI แบบสร้างสรรค์ในการวางแนวคิดในระยะเริ่มต้น (การคิดแบบกระจาย) มากกว่าการผลิตขั้นสุดท้าย (การคิดแบบรวม) และแนวปฏิบัติที่สร้างผลลัพธ์ดิจิทัลหรือชั่วคราว (เช่น การออกแบบ UI/UX ศิลปะแนวคิด) มักจะบูรณาการสิ่งเหล่านี้ได้ง่ายกว่าแนวปฏิบัติที่สร้างสิ่งประดิษฐ์ทางกายภาพที่ถาวร (เช่น ประติมากรรม สถาปัตยกรรม) [ 109 ]ในโดเมนทางกายภาพ ความกังวลเกี่ยวกับความสมบูรณ์ของโครงสร้าง ข้อจำกัดของวัสดุ และ "การคำนวณทางชาติพันธุ์" ทางวัฒนธรรม มักจำกัด AI ให้มีบทบาทเป็น "การเสริมเพิ่มเติม" มากกว่าการทดแทนการผลิต[ 110 ]นอกจากนี้ ทัศนคติต่อการนำไปใช้ยังแตกต่างกันอย่างมากตามช่วงอาชีพ โดยผู้เชี่ยวชาญระดับเริ่มต้นมองว่า AI แบบสร้างสรรค์เป็นส่วนขยายที่ใช้งานได้จริงของเครื่องมือดิจิทัลที่จำเป็นสำหรับการแข่งขันในตลาด ในขณะที่ผู้ปฏิบัติงานอาวุโสมักแสดงความสงสัยเชิงวิพากษ์เกี่ยวกับการลดคุณค่าของความเชี่ยวชาญเฉพาะด้านและการพัฒนาทักษะในระยะยาว[ 109 ]

วิศวกรรมและการแบ่งปันที่รวดเร็ว

ข้อความแจ้งเตือนสำหรับโมเดลแปลงข้อความเป็นภาพบางโมเดลอาจรวมถึงรูปภาพ คำหลัก และพารามิเตอร์ที่กำหนดค่าได้ เช่น สไตล์ศิลปะ ซึ่งมักใช้ผ่านวลีสำคัญ เช่น "ในสไตล์ของ [ชื่อศิลปิน]" ในข้อความแจ้งเตือน[ 111 ] /หรือการเลือกสไตล์สุนทรียศาสตร์/ศิลปะแบบกว้างๆ[ 112 ] [ 107 ]มีแพลตฟอร์มสำหรับการแบ่งปัน แลกเปลี่ยน ค้นหา แยก/ปรับปรุง หรือทำงานร่วมกันในข้อความแจ้งเตือนสำหรับการสร้างภาพเฉพาะจากตัวสร้างภาพ[ 113 ] [ 114 ] [ 115 ] [ 116 ]ข้อความแจ้งเตือนมักถูกแบ่งปันพร้อมกับรูปภาพบน เว็บไซต์ แบ่งปันรูปภาพเช่นRedditและเว็บไซต์ที่อุทิศให้กับศิลปะ AI ข้อความแจ้งเตือนไม่ใช่ข้อมูลป้อนเข้าทั้งหมดที่จำเป็นสำหรับการสร้างภาพ ข้อมูลป้อนเข้าเพิ่มเติมที่กำหนดภาพที่สร้างขึ้น ได้แก่ความละเอียดเอาต์พุตเมล็ดพันธุ์สุ่มและพารามิเตอร์การสุ่มตัวอย่างแบบสุ่ม[ 117 ]

สื่อสังเคราะห์ซึ่งรวมถึงศิลปะ AI ได้รับการอธิบายในปี 2022 ว่าเป็นเทรนด์สำคัญที่ขับเคลื่อนด้วยเทคโนโลยีซึ่งจะส่งผลกระทบต่อธุรกิจในอีกไม่กี่ปีข้างหน้า[ 106 ] นักวิจัย จาก Harvard Kennedy Schoolแสดงความกังวลเกี่ยวกับสื่อสังเคราะห์ที่ทำหน้าที่เป็นพาหะของข้อมูลเท็จทางการเมืองหลังจากศึกษาการแพร่กระจายของศิลปะ AI บนแพลตฟอร์ม X ไม่นาน[ 118 ] Synthographyเป็นคำที่เสนอสำหรับการสร้างภาพที่คล้ายกับภาพถ่ายโดยใช้ AI [ 119 ]

บริบททางปรัชญา

งานศิลปะภาพที่สร้างโดย AI ได้รับการกล่าวถึงในประเด็นต่างๆ เช่น ความคิดสร้างสรรค์ ความเป็นเจ้าของผลงาน การแสดงออกทางกาย และสถานะของภาพ เทคโนโลยีนี้ยังจุดประกายการถกเถียงเกี่ยวกับดัชนีชี้วัดของภาพถ่ายและภาพยนตร์อีกครั้ง เนื่องจากระบบสร้างภาพสามารถสร้างภาพได้โดยไม่ต้องบันทึกเหตุการณ์ทางกายภาพที่เกิดขึ้นต่อหน้ากล้อง

ในบทความปี 2026 ของเขาเรื่อง "แถลงการณ์แห่งความเป็นจริง: ภาพยนตร์หลังร่องรอยทางกายภาพ" ผู้สร้างภาพยนตร์และศิลปินJohannes Grenzfurthnerได้โต้แย้งถึง "การเปิดเผยเชิงภววิทยา" โดยแยกแยะระหว่างภาพที่อ้างอิงถึงทางกายภาพ ภาพแบบผสม และภาพสังเคราะห์อย่างสมบูรณ์[ 120 ]ศิลปินและนักการศึกษา Matt Ballou ได้กล่าวถึงข้อโต้แย้งของ Grenzfurthner ในการบรรยายปี 2026 เกี่ยวกับ AI และการสอน โดยเชื่อมโยงกับความกังวลเกี่ยวกับร่างกาย ลิขสิทธิ์ และความสามารถในการตรวจสอบว่าภาพ เอกสาร หรือเหตุการณ์มีต้นกำเนิดทางกายภาพหรือไม่[ 121 ]ข้อโต้แย้งนี้ยังได้รับการกล่าวถึงในบทความปี 2026 ที่ตีพิมพ์โดยparaflowsซึ่งอธิบายลักษณะการแยกแยะของ Grenzfurthner ระหว่างภาพที่อิงตามเหตุการณ์ ภาพแบบผสม และภาพสังเคราะห์อย่างสมบูรณ์ว่าเป็นปฏิกิริยาทางสุนทรียศาสตร์และการเมืองต่อการอ่อนแอลงของขอบเขตแบบดั้งเดิมระหว่างสารคดีและนิยาย[ 122 ]

การวิเคราะห์งานศิลปะที่มีอยู่โดยใช้ปัญญาประดิษฐ์

นอกเหนือจากการสร้างงานศิลปะต้นฉบับแล้ว ยังมีการสร้างวิธีการวิจัยที่ใช้ AI เพื่อวิเคราะห์คอลเลกชันงานศิลปะดิจิทัลในเชิงปริมาณ ซึ่งเป็นไปได้เนื่องจากการแปลงงานศิลปะเป็นดิจิทัลในวงกว้างในช่วงไม่กี่ทศวรรษที่ผ่านมา ตามที่ CETINIC และ SHE (2022) กล่าวไว้ การใช้ปัญญาประดิษฐ์ในการวิเคราะห์คอลเลกชันงานศิลปะที่มีอยู่แล้วสามารถให้มุมมองใหม่เกี่ยวกับการพัฒนารูปแบบศิลปะและการระบุอิทธิพลทางศิลปะได้[ 123 ] [ 124 ]

วิธีการคำนวณสองวิธี ได้แก่ การอ่านอย่างใกล้ชิดและการดูจากระยะไกล เป็นแนวทางทั่วไปที่ใช้ในการวิเคราะห์งานศิลปะดิจิทัล[ 125 ]การอ่านอย่างใกล้ชิดมุ่งเน้นไปที่ลักษณะภาพเฉพาะของชิ้นงานหนึ่งชิ้น งานบางอย่างที่เครื่องจักรดำเนินการในวิธีการอ่านอย่างใกล้ชิด ได้แก่ การตรวจสอบความถูกต้องของศิลปินด้วยคอมพิวเตอร์และการวิเคราะห์ฝีแปรงหรือคุณสมบัติของพื้นผิว ในทางตรงกันข้าม วิธีการดูจากระยะไกลช่วยให้สามารถแสดงภาพความคล้ายคลึงกันในคอลเลกชันทั้งหมดสำหรับคุณลักษณะเฉพาะในเชิงสถิติได้ งานทั่วไปที่เกี่ยวข้องกับวิธีนี้ ได้แก่ การจำแนกประเภทอัตโนมัติการตรวจจับวัตถุงานหลายรูปแบบการค้นพบความรู้ในประวัติศาสตร์ศิลปะ และสุนทรียศาสตร์เชิงคำนวณ[ 124 ]ภาพสังเคราะห์ยังสามารถใช้ในการฝึกอัลกอริธึม AI สำหรับ การตรวจ สอบความถูกต้องของงานศิลปะและการตรวจจับการปลอมแปลงได้อีก ด้วย [ 126 ]

นักวิจัยยังได้นำเสนอแบบจำลองที่ทำนายการตอบสนองทางอารมณ์ต่อศิลปะ แบบจำลองหนึ่งคือ ArtEmis ซึ่งเป็นชุดข้อมูลขนาดใหญ่ที่จับคู่กับแบบจำลองการเรียนรู้ของเครื่อง ArtEmis ประกอบด้วยคำอธิบายประกอบทางอารมณ์จากผู้เข้าร่วมกว่า 6,500 คน พร้อมคำอธิบายเป็นข้อความ โดยการวิเคราะห์ทั้งข้อมูลภาพและคำอธิบายข้อความประกอบจากชุดข้อมูลนี้ ArtEmis ช่วยให้สามารถสร้างการทำนายทางอารมณ์ที่ละเอียดอ่อนได้[ 127 ] [ 128 ]

ศิลปะ AI รูปแบบอื่นๆ

AI ยังถูกนำไปใช้ในงานศิลปะนอกเหนือจากทัศนศิลป์ด้วย AI แบบสร้างสรรค์ถูกนำไปใช้ในการสร้างดนตรีรวมถึงในการผลิตวิดีโอเกมที่นอกเหนือจากภาพโดยเฉพาะอย่างยิ่งสำหรับการออกแบบระดับ (เช่น สำหรับแผนที่แบบกำหนดเอง ) และการสร้างเนื้อหาใหม่ (เช่น เควสต์หรือบทสนทนา) หรือเรื่องราวแบบโต้ตอบในวิดีโอเกม[ 129 ] [ 130 ] AI ยังถูกนำไปใช้ในศิลปะวรรณกรรมด้วย[ 131 ]เช่น การช่วยเหลือเมื่อเขียนไม่ออก การสร้าง แรงบันดาลใจ หรือการเขียนใหม่บางส่วน[ 132 ] [ 133 ] [ 134 ] [ 135 ]ในศิลปะการทำอาหาร หุ่นยนต์ทำอาหาร ต้นแบบบางตัว สามารถชิมรสชาติ ได้แบบไดนามิก ซึ่งสามารถช่วยเชฟในการวิเคราะห์เนื้อหาและรสชาติของอาหารในระหว่างกระบวนการปรุงอาหาร[ 136 ]

การใช้คำว่า "ศิลปะ"

การใช้คำว่า "ศิลปะ" เมื่อนำไปใช้กับผลงานที่สร้างโดยซอฟต์แวร์ AI ก่อให้เกิดการถกเถียงในหมู่ศิลปิน นักปรัชญา นักวิชาการ และบุคคลอื่นๆ ผู้สังเกตการณ์หลายคนโต้แย้งว่า การเรียกภาพที่สร้างโดยเครื่องจักรว่า "ศิลปะ" เป็นการบั่นทอนลักษณะดั้งเดิมของศิลปะของมนุษย์ เช่น ความคิดสร้างสรรค์ ทักษะ และเจตนา คำจำกัดความของการสร้างสรรค์ทางศิลปะที่แท้จริงในปัจจุบันมักเน้นย้ำถึงข้อกำหนดของเจตนาในระดับมนุษย์ ประสบการณ์ส่วนตัวและอารมณ์ ตลอดจนบริบททางประวัติศาสตร์และ/หรือศิลปะ[ 137 ]

จากการศึกษาวิจัยของห้องสมุดการแพทย์แห่งชาติ พบว่ามนุษย์โดยธรรมชาติมักมีอคติต่อผลงานศิลปะที่อธิบายว่าสร้างขึ้นโดย AI เมื่อผู้เข้าร่วมการศึกษาได้รับชมภาพที่เทียบเคียงกันได้สองภาพ โดยมีเพียงภาพเดียวที่แสดงว่าสร้างขึ้นโดย AI ผู้เข้าร่วมมีแนวโน้มที่จะให้คะแนนภาพที่อธิบายว่าสร้างขึ้นโดยปัญญาประดิษฐ์ต่ำกว่าในด้านคุณค่าทางศิลปะ ซึ่งแสดงให้เห็นว่าทัศนคติทางสังคมและวัฒนธรรมสามารถกำหนดการตัดสินว่าภาพนั้นถือเป็นศิลปะหรือไม่ โดยไม่คำนึงถึงคุณลักษณะทางภาพอื่นๆ ของภาพ[ 138 ]

ในรายงานที่ส่งไปยังการประชุมประจำปีของผู้สังเกตการณ์ศิลปะดิจิทัล ในปี 2023 ซามูเอล ลูมิส เขียนว่าคำว่า "ศิลปะ AI" ยอมรับลักษณะสองด้านของมันในฐานะที่เป็นผลผลิตจากการชี้นำของมนุษย์และระบบสร้างอัตโนมัติที่ขับเคลื่อนด้วยเครื่องจักร เมื่อประเมินโดยใช้มาตรฐานวิจารณ์เดียวกันกับที่ใช้กับศิลปะแบบดั้งเดิม[ 139 ]

ดูเพิ่มเติม

ดึงข้อมูลมาจาก " https://en.wikipedia.org/w/index.php?title=AI_art&oldid=1361422829 "

สรุปเนื้อหา

ข้อมูลสำคัญจากบทความ

ข้อมูลสำคัญเกี่ยวกับ ศิลปะ AI

ศิลปะภาพปัญญาประดิษฐ์หรือศิลปะ AIคือผลงานศิลปะภาพที่สร้างหรือปรับปรุงผ่านการใช้งาน โปรแกรม ปัญญาประดิษฐ์ (AI)...

ประวัติศาสตร์ยุคแรก

ศิลปะอัตโนมัติมีมาอย่างน้อยตั้งแต่สมัย หุ่นยนต์ ของ อารยธรรมกรีกโบราณ เมื่อนักประดิษฐ์อย่าง เดดาลัส และ ฮีโรแห่งอเล็กซานเดรีย ได้รับการอธิบายว่าออกแบบเครื่องจักรที่สามารถเขียนข้อความ สร้างเสียง และเล่นดนตรีได้ [ 9 ] [ 10 ]...

ประวัติศาสตร์ศิลปะ

นับตั้งแต่มีการก่อตั้ง AI ในช่วงทศวรรษ 1950 ศิลปินได้ใช้ปัญญาประดิษฐ์ในการสร้างสรรค์ผลงานศิลปะ ผลงานเหล่า นี้ บางครั้งถูกเรียกว่า ศิลปะเชิงอัลกอริทึม [ 17 ] ศิลปะคอมพิวเตอร์ ศิลปะ ดิจิทัล หรือศิลปะ สื่อใหม่ [ 18 ]

ประวัติทางเทคนิค

การเรียนรู้เชิงลึก ซึ่งมีลักษณะเฉพาะคือโครงสร้างหลายชั้นที่พยายามเลียนแบบสมองของมนุษย์ เกิดขึ้นครั้งแรกในช่วงทศวรรษ 2010 ทำให้เกิดการเปลี่ยนแปลงครั้งสำคัญในโลกของศิลปะ AI [ 45 ] ในยุคของการเรียนรู้เชิงลึก มีการออกแบบศิลปะเชิงกำเนิดเป็นหลักดังนี้:...