ศิลปะ AI

ศิลปะภาพปัญญาประดิษฐ์หรือศิลปะ AIคือผลงานศิลปะภาพที่สร้างหรือปรับปรุงผ่านการใช้งาน โปรแกรม ปัญญาประดิษฐ์ (AI) ซึ่งส่วนใหญ่มักใช้โมเดลข้อความเป็นภาพกระบวนการสร้างงานศิลปะอัตโนมัติมีมาตั้งแต่สมัยโบราณ สาขาปัญญาประดิษฐ์ก่อตั้งขึ้นในช่วงทศวรรษ 1950 และศิลปินเริ่มสร้างงานศิลปะด้วยปัญญาประดิษฐ์ไม่นานหลังจากนั้น ผลงานสร้างสรรค์เหล่านี้จำนวนหนึ่งได้รับการจัดแสดงในพิพิธภัณฑ์และได้รับการยอมรับด้วยรางวัล^{[ 1 ]}ตลอดประวัติศาสตร์ AI ได้ก่อให้เกิด คำถามเชิงปรัชญามากมายที่เกี่ยวข้องกับจิตใจมนุษย์สิ่งมีชีวิตเทียมและธรรมชาติของศิลปะในการทำงานร่วมกันระหว่างมนุษย์และ AI

ในช่วงที่ปัญญาประดิษฐ์เฟื่องฟูในทศวรรษ 2020 โมเดลแปลงข้อความเป็นภาพ เช่นMidjourney , DALL-EและStable Diffusionได้กลายเป็นที่แพร่หลายในหมู่ประชาชน ทำให้ผู้ใช้สามารถสร้างภาพได้อย่างรวดเร็วโดยใช้ความพยายามเพียงเล็กน้อย^{[ 2 ]}^{[ 3 ]}ความคิดเห็นเกี่ยวกับศิลปะปัญญาประดิษฐ์ในทศวรรษ 2020 มักมุ่งเน้นไปที่ประเด็นที่เกี่ยวข้องกับลิขสิทธิ์การหลอกลวงการหมิ่นประมาทและผลกระทบต่อศิลปินแบบดั้งเดิม รวมถึงการว่างงานจากเทคโนโลยี

ในเดือนสิงหาคม พ.ศ. 2566 ศาลฎีกาสหรัฐฯตัดสินว่างานศิลปะที่สร้างโดย AI ไม่สามารถได้รับลิขสิทธิ์ได้เนื่องจากไม่ตรงตามเกณฑ์การสร้างสรรค์โดยมนุษย์^{[ 4 ]}^{[ 5 ]}ในเดือนมีนาคม พ.ศ. 2569 ศาลปฏิเสธที่จะพิจารณาคดีเกี่ยวกับว่างานศิลปะที่สร้างโดย AI สามารถได้รับลิขสิทธิ์ได้หรือไม่^{[ 6 ]}^{[ 7 ]}^{[ 8 ]}

ประวัติศาสตร์

ประวัติศาสตร์ยุคแรก

หุ่นยนต์ของไมลลาร์เดต์กำลังวาดภาพ

ศิลปะอัตโนมัติมีมาอย่างน้อยตั้งแต่สมัยหุ่นยนต์ของอารยธรรมกรีกโบราณเมื่อนักประดิษฐ์อย่างเดดาลัสและฮีโรแห่งอเล็กซานเดรียได้รับการอธิบายว่าออกแบบเครื่องจักรที่สามารถเขียนข้อความ สร้างเสียง และเล่นดนตรีได้^{[ 9 ]}^{[ 10 ]}หุ่นยนต์สร้างสรรค์เฟื่องฟูตลอดประวัติศาสตร์ เช่นหุ่นยนต์ของไมลลาร์เดต์ซึ่งสร้างขึ้นราวปี 1800 และสามารถสร้างภาพวาดและบทกวีได้หลายชิ้น^{[ 11 ]}

ในศตวรรษที่ 19 เช่นกันAda Lovelaceเขียนว่า "การดำเนินการคำนวณ" อาจใช้ในการสร้างดนตรีและบทกวีได้^{[ 12 ]}^{[ 13 ]}ในปี 1950 บทความของAlan Turing เรื่อง " เครื่องจักรคำนวณและสติปัญญา " มุ่งเน้นไปที่ว่าเครื่องจักรสามารถเลียนแบบพฤติกรรมของมนุษย์ได้อย่างน่าเชื่อถือหรือไม่^{[ 14 ]} หลังจากนั้นไม่นาน สาขาวิชาปัญญาประดิษฐ์ก็ถูกก่อตั้งขึ้นในการ ประชุมเชิงปฏิบัติการวิจัยที่วิทยาลัย Dartmouthในปี 1956 ^{[ 15 ]}

นับตั้งแต่เริ่มก่อตั้ง นักวิจัย AI ได้สำรวจคำถามเชิงปรัชญาเกี่ยวกับธรรมชาติของจิตใจมนุษย์และผลที่ตามมาจากการสร้างสิ่งมีชีวิตเทียมที่มีสติปัญญาคล้ายมนุษย์ ประเด็นเหล่านี้เคยถูกสำรวจโดยตำนานนิยายและปรัชญามาตั้งแต่สมัยโบราณแล้ว^[¹⁶^]

ประวัติศาสตร์ศิลปะ

*ผลงานศิลปะจัดวาง " กาลาปากอส* " ของคาร์ล ซิมส์เปิดโอกาสให้ผู้เข้าชมได้สร้างสรรค์รูปทรงแอนิเมชั่นสามมิติ

^{นับตั้งแต่มีการก่อตั้ง AI ในช่วงทศวรรษ 1950 ศิลปินได้ใช้ปัญญาประดิษฐ์ในการสร้างสรรค์ผลงานศิลปะ ผลงานเหล่า นี้}บางครั้งถูกเรียกว่าศิลปะเชิงอัลกอริทึม [ ^{17 ]}ศิลปะคอมพิวเตอร์ศิลปะดิจิทัลหรือศิลปะสื่อใหม่^{[ 18 ]}

หนึ่งในระบบศิลปะ AI ที่สำคัญระบบแรกคือAARONซึ่งพัฒนาโดยHarold Cohenในช่วงปลายทศวรรษ 1960 ที่มหาวิทยาลัยแคลิฟอร์เนียซานดิเอโก^{[ 19 ]} AARON ใช้แนวทางตามกฎเชิงสัญลักษณ์เพื่อสร้างภาพทางเทคนิคในยุคของ การเขียนโปรแกรม GOFAIและ Cohen พัฒนาระบบนี้โดยมีเป้าหมายเพื่อให้สามารถเขียนโค้ดสำหรับการวาดภาพได้^{[ 20 ]} AARON ได้รับการจัดแสดงในปี 1972 ที่พิพิธภัณฑ์ศิลปะลอสแอนเจลิสเคาน์ตี้ [ ^{21 ] ตั้งแต่}ปี 1973 ถึง 1975 Cohen ได้ปรับปรุง AARON ในระหว่างการพำนักที่ห้องปฏิบัติการปัญญาประดิษฐ์ที่มหาวิทยาลัยสแตนฟอร์ด [ ^{22 ] ใน}ปี 2024 พิพิธภัณฑ์ศิลปะอเมริกันวิทนีย์ได้จัดแสดงงานศิลปะ AI จากตลอดอาชีพการงานของ Cohen รวมถึงเวอร์ชันที่สร้างขึ้นใหม่ของเครื่องจักรวาดภาพหุ่นยนต์ รุ่นแรกๆ ของเขา ^{[ 22 ]}

คาร์ล ซิมส์ได้จัดแสดงงานศิลปะที่สร้างขึ้นด้วยสิ่งมีชีวิตเทียมมาตั้งแต่ทศวรรษ 1980 เขาได้รับปริญญาโทสาขากราฟิกคอมพิวเตอร์จากMIT Media Labในปี 1987 และเป็นศิลปินประจำตั้งแต่ปี 1990 ถึง 1996 ที่ บริษัทผู้ผลิต ซูเปอร์คอมพิวเตอร์และปัญญาประดิษฐ์Thinking Machines ^{[ 23 ]}^{[ 24 ]}^{[ 25 ]}ในปี 1991 และ 1992 ซิมส์ได้รับรางวัล Golden Nica จากPrix Ars Electronicaสำหรับวิดีโอของเขาที่ใช้การวิวัฒนาการเทียม^{[ 26 ]}^{[ 27 ]}^{[ 28 ]}ในปี 1997 ซิมส์ได้สร้างงานติดตั้งการวิวัฒนาการเทียมแบบโต้ตอบGalápagosสำหรับNTT InterCommunication Centerในโตเกียว^{[ 29 ]}ซิมส์ได้รับรางวัล Emmy Awardในปี 2019 สำหรับความสำเร็จที่โดดเด่นในการพัฒนาด้านวิศวกรรม^{[ 30 ]}

ตัวอย่างผลงาน*Electric Sheep*โดยScott Draves

ในปี พ.ศ. 2542 สก็อตต์ เดรฟส์และทีมวิศวกรหลายคนได้สร้างและเผยแพร่Electric Sheepเป็น โปรแกรม รักษาหน้าจอแบบฟรี^{[ 31 ]} Electric Sheepเป็นโครงการคอมพิวเตอร์อาสาสมัครสำหรับการสร้างภาพเคลื่อนไหวและวิวัฒนาการของเปลวไฟแฟรกทัลซึ่งกระจายไปยังคอมพิวเตอร์เครือข่ายที่แสดงผลเป็นโปรแกรมรักษาหน้าจอ โปรแกรมรักษาหน้าจอนี้ใช้ AI ในการสร้างภาพเคลื่อนไหวที่ไม่มีที่สิ้นสุดโดยการเรียนรู้จากผู้ชม ในปี พ.ศ. 2544 เดรฟส์ได้รับรางวัล Fundacion Telefónica Life 4.0 สำหรับElectric Sheep ^{[ 32 ]}

ในปี 2014 สเตฟานี ดิงกินส์เริ่มทำงานในซีรีส์ Conversations with Bina48 [ ^{33 ] สำหรับ}ซีรีส์นี้ ดิงกินส์ได้บันทึกบทสนทนาของเธอกับBINA48ซึ่งเป็นหุ่นยนต์สังคมที่มีลักษณะคล้ายหญิงผิวดำวัยกลางคน^{[ 34 ]}^{[ 35 ]}ในปี 2019 ดิงกินส์ได้รับ รางวัล Creative Capitalจากการสร้างปัญญาประดิษฐ์ที่พัฒนาตาม "ความสนใจและวัฒนธรรมของคนผิวสี" ^{[ 36 ]}

ในปี 2015 ซูกเวน ชุงได้เริ่มโครงการ Mimicry (Drawing Operations Unit: Generation 1)ซึ่งเป็นการทำงานร่วมกันอย่างต่อเนื่องระหว่างศิลปินและแขนหุ่นยนต์^{[ 37 ]}ในปี 2019 ชุงได้รับรางวัล Lumen Prizeจากการแสดงอย่างต่อเนื่องกับแขนหุ่นยนต์ที่ใช้ AI เพื่อพยายามวาดภาพในลักษณะที่คล้ายกับชุง^{[ 38 ]}

ในปี 2018 มีการจัดการประมูลขายงานศิลปะปัญญาประดิษฐ์ที่Christie'sในนิวยอร์ก โดยงานศิลปะ AI ชื่อEdmond de Belamyขายได้ใน ราคา 432,500 ดอลลาร์สหรัฐซึ่งสูงกว่าราคาประเมินที่ 7,000–10,000 ดอลลาร์สหรัฐเกือบ 45 เท่า งานศิลปะชิ้นนี้สร้างโดย Obvious ซึ่งเป็นกลุ่มศิลปินในปารีส^{[ 39 ]}^{[ 40 ]}^{[ 41 ]}

ในปี 2024 ภาพยนตร์ญี่ปุ่นเรื่อง generAIdoscopeได้ออกฉาย ภาพยนตร์เรื่องนี้กำกับร่วมโดยฮิโรทากะ อาดาจิทาเคชิ โซเนะ และฮิโรคิ ยามากุจิ วิดีโอ เสียง และดนตรีทั้งหมดในภาพยนตร์เรื่องนี้สร้างขึ้นด้วยปัญญาประดิษฐ์^{[ 42 ]}

ในปี 2025 ซีรีส์ อนิเมะโทรทัศน์ ญี่ปุ่นเรื่อง Twins Hinahimaได้ออกฉาย อนิเมะเรื่องนี้ผลิตและสร้างแอนิเมชั่นโดยใช้ AI ช่วยในกระบวนการตัดต่อและแปลงภาพถ่ายเป็นภาพประกอบอนิเมะ และต่อมาได้รับการปรับแต่งโดยทีมงานศิลปะ ส่วนที่เหลือส่วนใหญ่ เช่น ตัวละครและโลโก้ ถูกวาดด้วยมือโดยใช้ซอฟต์แวร์ต่างๆ^{[ 43 ]}^{[ 44 ]}

ประวัติทางเทคนิค

การเรียนรู้เชิงลึกซึ่งมีลักษณะเฉพาะคือโครงสร้างหลายชั้นที่พยายามเลียนแบบสมองของมนุษย์ เกิดขึ้นครั้งแรกในช่วงทศวรรษ 2010 ทำให้เกิดการเปลี่ยนแปลงครั้งสำคัญในโลกของศิลปะ AI ^{[ 45 ]}ในยุคของการเรียนรู้เชิงลึก มีการออกแบบศิลปะเชิงกำเนิดเป็นหลักดังนี้: โมเดลอัตถารีเกรส ซีฟ โมเดลการแพร่กระจายGANsและการ ไหล แบบปกติ

ในปี 2014 Ian Goodfellowและเพื่อนร่วมงานที่Université de Montréalได้พัฒนาเครือข่ายปฏิปักษ์เชิงสร้างสรรค์ (GAN) ซึ่งเป็น เครือข่ายประสาทเทียมเชิงลึกประเภทหนึ่งที่สามารถเรียนรู้ที่จะเลียนแบบการกระจายทางสถิติของข้อมูลอินพุต เช่น รูปภาพ GAN ใช้ "ตัวสร้าง" เพื่อสร้างรูปภาพใหม่ และ "ตัวจำแนก" เพื่อตัดสินว่ารูปภาพที่สร้างขึ้นใดถือว่าประสบความสำเร็จ^{[ 46 ]}แตกต่างจากศิลปะเชิงอัลกอริทึมก่อนหน้านี้ที่ปฏิบัติตามกฎที่เขียนด้วยมือ เครือข่ายปฏิปักษ์เชิงสร้างสรรค์สามารถเรียนรู้สุนทรียภาพ เฉพาะ โดยการวิเคราะห์ชุดข้อมูลของรูปภาพตัวอย่าง^{[ 17 ]}

ในปี 2015 ทีมงานของGoogleได้เปิดตัวDeepDreamซึ่งเป็นโปรแกรมที่ใช้โครงข่ายประสาทเทียมแบบ Convolutionalเพื่อค้นหาและปรับปรุงรูปแบบในภาพผ่านPareidolia แบบอัลกอริ ทึม^{[ 47 ]}^{[ 48 ]}^{[ 49 ]}กระบวนการนี้สร้างภาพที่ผ่านการประมวลผลมากเกินไปโดยเจตนา ซึ่งมีลักษณะคล้ายความฝันที่ชวนให้นึกถึงประสบการณ์หลอนประสาท^{[ 47 ]}ต่อมาในปี 2017 GAN แบบมีเงื่อนไขได้เรียนรู้ที่จะสร้างคลาสภาพ 1,000 คลาสของImageNet ซึ่งเป็น ฐานข้อมูลภาพขนาดใหญ่ที่ออกแบบมาเพื่อใช้ในการวิจัยซอฟต์แวร์การจดจำวัตถุภาพ^{[ 50 ]}^{[ 51 ]}ด้วยการกำหนดเงื่อนไข GAN ทั้งจากสัญญาณรบกวนแบบสุ่มและป้ายกำกับคลาสเฉพาะ วิธีการนี้ช่วยเพิ่มคุณภาพของการสังเคราะห์ภาพสำหรับโมเดลแบบมีเงื่อนไขคลาส^{[ 52 ]}

โมเดลอัตถารีเกรสซีฟถูกใช้สำหรับการสร้างภาพ เช่น PixelRNN (2016) ซึ่งสร้างพิกเซลทีละพิกเซลโดยใช้โครงข่ายประสาทแบบวนซ้ำ [ ^{53 ] ทันที}หลังจากที่ สถาปัตยกรรม Transformerได้รับการเสนอในAttention Is All You Need (2018) ก็ถูกนำมาใช้สำหรับการสร้างภาพแบบอัตถารีเกรสซีฟ แต่ไม่มีการปรับเงื่อนไขข้อความ^{[ 54 ]}

เว็บไซต์Artbreederซึ่งเปิดตัวในปี 2018 ใช้โมเดลStyleGANและ BigGAN ^{[ 55 ]}^{[ 56 ]}เพื่อให้ผู้ใช้สามารถสร้างและแก้ไขรูปภาพ เช่น ใบหน้า ทิวทัศน์ และภาพวาด^{[ 57 ]}

ในช่วงทศวรรษ 2020 โมเดลข้อความเป็นภาพซึ่งสร้างภาพตามคำสั่ง ได้ ถูกนำมาใช้อย่างแพร่หลาย ถือเป็นการเปลี่ยนแปลงครั้งสำคัญอีกประการหนึ่งในการสร้างงานศิลปะที่สร้างโดย AI ^{[ 2 ]}

ตัวอย่างภาพที่สร้างด้วย VQGAN-CLIP (NightCafe Studio, มีนาคม 2023)

ตัวอย่างภาพที่สร้างด้วย Flux 1.1 Pro ในโหมด Raw (พฤศจิกายน 2024) โหมดนี้ออกแบบมาเพื่อสร้างภาพที่สมจริง

ในปี 2021 OpenAIได้เผยแพร่ชุดภาพที่สร้างขึ้นด้วยโมเดล AI แปลงข้อความเป็นภาพDALL-E 1โดย ใช้โมเดล Transformer ที่ได้รับการฝึกฝนล่วงหน้าสำหรับการสร้าง ภาษาขนาดใหญ่ ที่มีอิทธิพล ซึ่งใช้ในGPT-2และGPT-3 [ ⁵⁸^]^ซึ่งเป็นโมเดลการสร้างแบบอัตถารีเกรสซีฟที่มีสถาปัตยกรรมพื้นฐานเหมือนกับ GPT-3 นอกจากนี้ ในช่วงปลายปี 2021 EleutherAIยังได้เผยแพร่VQGAN-CLIP ^[⁵⁹^] ซึ่งเป็น โอเพนซอร์สโดยอิงจากโมเดล CLIP ของ OpenAI ^[⁶⁰^]โมเดลการแพร่กระจาย (Diffusion models)ซึ่งเป็นโมเดลเชิงกำเนิดที่ใช้สร้างข้อมูลสังเคราะห์โดยอิงจากข้อมูลที่มีอยู่^[⁶¹^]ได้รับการเสนอครั้งแรกในปี 2015 ^[⁶²^]แต่เพิ่งจะดีกว่า GANs ในช่วงต้นปี 2021 ^[⁶³^]โมเดลการแพร่กระจายแฝง (Latent diffusion model ) ได้รับการเผยแพร่ในเดือนธันวาคม 2021 และกลายเป็นพื้นฐานสำหรับStable Diffusion ในภายหลัง (สิงหาคม 2022) ซึ่งพัฒนาขึ้นจากการทำงานร่วมกันระหว่าง Stability AI, CompVis Group ที่ LMU Munich และ Runway ^[⁶⁴^]

ในปี 2022 Midjourney ^{[ 65 ]}ได้รับการเผยแพร่ ตามมาด้วยImagen และ Parti ของGoogle Brainซึ่งประกาศในเดือนพฤษภาคม 2022, NUWA-Infinity ของMicrosoft ^[⁶⁶^]^[²^]และStable Diffusion ที่มีซอร์สโค้ดให้ใช้งานได้ซึ่งเผยแพร่ในเดือนสิงหาคม 2022 ^[⁶⁷^]^[⁶⁸^]^[⁶⁹^] DALL-E 2 ซึ่งเป็นรุ่นต่อจาก DALL-E ได้รับการทดสอบเบต้าและเผยแพร่ (โดยมีรุ่นต่อยอดคือ DALL-E 3 เผยแพร่ในปี 2023) Stability AI มีเว็บอินเทอร์เฟซ Stable Diffusion ที่เรียกว่า DreamStudio ^[⁷⁰^]^{ปลั๊กอิน}สำหรับKrita , Photoshop , BlenderและGIMP [ ⁷¹^]และ เว็บอินเทอ ร์เฟซผู้ใช้แบบโอเพนซอร์สAutomatic1111 ^[⁷²^]^[⁷³^]^[⁷⁴^]โมเดลหลักที่ฝึกฝนล่วงหน้าของ Stable Diffusion จะถูกแชร์บนHugging Face Hub ^[⁷⁵^]

Ideogramเปิดตัวในเดือนสิงหาคม พ.ศ. 2566 โมเดลนี้เป็นที่รู้จักในด้านความสามารถในการสร้างข้อความที่อ่านได้^{[ 76 ]}^{[ 77 ]}

ในปี 2024 Fluxได้ถูกปล่อยออกมา โมเดลนี้สามารถสร้างภาพที่สมจริงและถูกรวมเข้ากับGrok ซึ่ง ^เป็นแชทบอทที่ใช้บนX (เดิมคือ Twitter)และLe Chatซึ่งเป็นแชทบอทของMistral AI [ ^{3 ]}^{[ 78 ]}^{[ 79 ]}^{[ 80 ]} Flux ได้รับการพัฒนาโดย Black Forest Labs ซึ่งก่อตั้งโดยนักวิจัยเบื้องหลัง Stable Diffusion ^{[ 81 ]} ต่อมา Grok ได้เปลี่ยนไปใช้โมเดลแปลงข้อความเป็นภาพ Auroraของตนเองในเดือนธันวาคมของปีเดียวกัน^{[ 82 ]}หลายบริษัทพร้อมกับผลิตภัณฑ์ของพวกเขายังได้พัฒนาโมเดล AI ที่รวมเข้ากับบริการแก้ไขภาพAdobeได้เปิดตัวและรวมโมเดล AI Fireflyเข้ากับPremiere Pro , PhotoshopและIllustrator ^{[ 83 ]}^{[ 84} ] Microsoft ยังได้ประกาศคุณสมบัติการสร้างภาพ AI สำหรับMicrosoft Paintอย่าง^{เป็น ทางการอีกด้วย}^{[ 85 ]}นอกจากนี้ ตัวอย่างของโมเดลแปลงข้อความเป็นวิดีโอในช่วงกลางทศวรรษ 2020 ได้แก่Gen-4 ของ Runway, VideoPoet ของ Google, Soraของ OpenAI ซึ่งเปิดตัวในเดือนธันวาคม 2024 และLTX-2ซึ่งเปิดตัวในปี 2025 ^{[ 86 ]}^{[ 87 ]}^{[ 88 ]}

ในปี 2025 มีการเปิดตัวโมเดลหลายรุ่นGPT Image 1จากOpenAIซึ่งเปิดตัวในเดือนมีนาคม 2025 ได้นำเสนอการเรนเดอร์ข้อความและความสามารถแบบมัลติโมดอลใหม่ ทำให้สามารถสร้างภาพจากอินพุตที่หลากหลาย เช่น ภาพร่างและข้อความ^{[ 89 ]} MidJourney v7เปิดตัวในเดือนเมษายน 2025 โดยมีการปรับปรุงการประมวลผลข้อความแจ้งเตือน^{[ 90 ]}ในเดือนพฤษภาคม 2025 Flux.1 Kontextจาก Black Forest Labs ได้ปรากฏตัวขึ้นในฐานะโมเดลที่มีประสิทธิภาพสำหรับการสร้างภาพที่มีความละเอียดสูง^{[ 91 ]}ในขณะที่Imagen 4 ของ Google ได้รับการเผยแพร่พร้อมกับความสมจริงของภาพถ่ายที่ได้รับการปรับปรุง^[⁹²^] Flux.2 เปิดตัวในเดือนพฤศจิกายน 2025 พร้อมกับการอ้างอิงภาพ การพิมพ์ และความเข้าใจข้อความแจ้งเตือนที่ได้รับการปรับปรุง^[⁹³^]

เครื่องมือและกระบวนการ

แนวทาง

ศิลปินใช้วิธีการมากมายในการพัฒนาศิลปะภาพ AI เมื่อ ใช้ การแปลงข้อความเป็นภาพ AI จะสร้างภาพตามคำอธิบายข้อความ โดยใช้โมเดล เช่น สถาปัตยกรรมแบบกระจายหรือแบบทรานส์ฟอร์เมอร์ ผู้ใช้ป้อนข้อความแจ้ง และ AI จะสร้างภาพที่สอดคล้องกัน^{[ 94 ]}^{[ 95 ]}เมื่อใช้การแปลงภาพเป็นภาพ AI จะแปลงภาพที่ป้อนเข้ามาเป็นสไตล์หรือรูปแบบใหม่ตามข้อความแจ้งหรือการอ้างอิงสไตล์ เช่น การเปลี่ยนภาพร่างให้เป็นภาพที่สมจริง หรือการใช้สไตล์ศิลปะ^{[ 96 ]}^{[ 97 ]}เมื่อใช้การแปลงภาพเป็นวิดีโอ AI จะสร้างคลิปวิดีโอสั้นหรือแอนิเมชันจากภาพเดียวหรือลำดับภาพ โดยมักจะเพิ่มการเคลื่อนไหวหรือการเปลี่ยนภาพ ซึ่งอาจรวมถึงการสร้างแอนิเมชันจากภาพนิ่งหรือการสร้างฉากแบบไดนามิก^{[ 98 ]}^{[ 99 ]}เมื่อ ใช้ การแปลงข้อความเป็นวิดีโอ AI จะสร้างวิดีโอโดยตรงจากข้อความแจ้ง สร้างแอนิเมชัน ฉากที่สมจริง หรือภาพนามธรรม นี่เป็นการต่อยอดจากการแปลงข้อความเป็นภาพ แต่เน้นที่ลำดับเวลา^{[ 100 ]}

ภาพ

มีเครื่องมือมากมายให้ศิลปินเลือกใช้เมื่อทำงานกับแบบจำลองการแพร่กระจาย พวกเขาสามารถกำหนดทั้งคำแนะนำเชิงบวกและเชิงลบได้ แต่พวกเขายังมีทางเลือกในการใช้ (หรือไม่ใช้) VAE , LoRA , ไฮเปอร์เน็ตเวิร์ก, IP-adapter และการฝัง/การกลับข้อความ ศิลปินสามารถปรับแต่งการตั้งค่าต่างๆ เช่น มาตราส่วนการนำทาง (ซึ่งสร้างสมดุลระหว่างความคิดสร้างสรรค์และความแม่นยำ), เมล็ดพันธุ์ (เพื่อควบคุมความสุ่ม) และตัวเพิ่มความละเอียด (เพื่อเพิ่มความละเอียดของภาพ) เป็นต้น นอกจากนี้ยังสามารถเพิ่มอิทธิพลได้ในระหว่างขั้นตอนก่อนการอนุมานโดยการจัดการสัญญาณรบกวน ในขณะที่เทคนิคการประมวลผลภายหลังแบบดั้งเดิมมักใช้ในขั้นตอนหลังการอนุมาน ผู้คนยังสามารถฝึกฝนแบบจำลองของตนเองได้อีกด้วย

นอกจากนี้ ยังมีการพัฒนาเทคนิคการสร้างภาพแบบ "อิงตามกฎ" โดยใช้รูปแบบทางคณิตศาสตร์ อัลกอริทึมที่จำลองการลงพู่กันและเอฟเฟกต์การวาดภาพอื่นๆ รวมถึงแบบจำลองการเรียนรู้เชิงลึก เช่นเครือข่ายปฏิปักษ์เชิงกำเนิด (GANs) และทรานส์ฟอร์เมอร์ บริษัทหลายแห่งได้เปิดตัวแอปพลิเคชันและเว็บไซต์ที่อนุญาตให้ผู้ใช้มุ่งเน้นเฉพาะคำแนะนำเชิงบวก โดยไม่ต้องกำหนดค่าพารามิเตอร์อื่นๆ ด้วยตนเอง นอกจากนี้ยังมีโปรแกรมที่สามารถแปลงภาพถ่ายให้เป็นภาพที่มีสไตล์ซึ่งเลียนแบบสุนทรียภาพของรูปแบบการวาดภาพที่เป็นที่รู้จักกันดี^{[ 101 ]}^{[ 102 ]}

มีตัวเลือกมากมาย ตั้งแต่แอปมือถือที่ใช้งานง่ายสำหรับผู้บริโภค ไปจนถึงJupyter notebooks และเว็บ UI ที่ต้องใช้ GPU ที่ทรงพลังในการทำงานอย่างมีประสิทธิภาพ^{[ 103 ]}ฟังก์ชันเพิ่มเติม ได้แก่ "การผกผันข้อความ" ซึ่งหมายถึงการเปิดใช้งานการใช้แนวคิดที่ผู้ใช้ให้มา (เช่น วัตถุหรือรูปแบบ) ที่เรียนรู้จากภาพไม่กี่ภาพ จากนั้นสามารถสร้างงานศิลปะใหม่จากคำที่เกี่ยวข้อง (ข้อความที่ถูกกำหนดให้กับแนวคิดที่เรียนรู้ ซึ่งมักจะเป็นนามธรรม) ^{[ 104 ]}^{[ 105 ]}และการขยายโมเดลหรือการปรับแต่งอย่างละเอียด (เช่นDreamBooth )

ผลกระทบและการประยุกต์ใช้

AI มีศักยภาพในการเปลี่ยนแปลงสังคมซึ่งอาจรวมถึงการเปิดใช้งานการขยายตัวของแนวเฉพาะกลุ่มที่ไม่ใช่เชิงพาณิชย์ (เช่นอนุพันธ์ไซเบอร์พังก์อย่างโซลาร์พังก์ ) โดยมือสมัครเล่น ความบันเทิงรูปแบบใหม่ การสร้างต้นแบบอย่างรวดเร็ว^{[ 106 ]}การเพิ่มการเข้าถึงการสร้างสรรค์งานศิลปะ^{[ 106 ]}และผลผลิตทางศิลปะต่อความพยายาม ค่าใช้จ่าย หรือเวลา^{[ 106 ]}เช่น ผ่านการสร้างร่าง ร่างคำจำกัดความ และส่วนประกอบของภาพ ( การเติมสี ) ภาพที่สร้างขึ้นบางครั้งใช้เป็นภาพร่าง^{[ 107 ]}การทดลองต้นทุนต่ำ^{[ 108 ]}แรงบันดาลใจ หรือภาพประกอบของแนวคิดในขั้นตอนการพิสูจน์แนวคิด ฟังก์ชันการทำงานเพิ่มเติมหรือการปรับปรุงอาจเกี่ยวข้องกับการแก้ไขด้วยตนเองหลังการสร้าง (เช่น การขัดเกลา) เช่น การปรับแต่งเพิ่มเติมด้วยโปรแกรมแก้ไขภาพ^{[ 108 ]}

ศิลปินและนักออกแบบทัศนศิลป์มืออาชีพใช้ AI แบบสร้างสรรค์ในการวางแนวคิดในระยะเริ่มต้น (การคิดแบบกระจาย) มากกว่าการผลิตขั้นสุดท้าย (การคิดแบบรวม) และแนวปฏิบัติที่สร้างผลลัพธ์ดิจิทัลหรือชั่วคราว (เช่น การออกแบบ UI/UX ศิลปะแนวคิด) มักจะบูรณาการสิ่งเหล่านี้ได้ง่ายกว่าแนวปฏิบัติที่สร้างสิ่งประดิษฐ์ทางกายภาพที่ถาวร (เช่น ประติมากรรม สถาปัตยกรรม) ^{[ 109 ]}ในโดเมนทางกายภาพ ความกังวลเกี่ยวกับความสมบูรณ์ของโครงสร้าง ข้อจำกัดของวัสดุ และ "การคำนวณทางชาติพันธุ์" ทางวัฒนธรรม มักจำกัด AI ให้มีบทบาทเป็น "การเสริมเพิ่มเติม" มากกว่าการทดแทนการผลิต^{[ 110 ]}นอกจากนี้ ทัศนคติต่อการนำไปใช้ยังแตกต่างกันอย่างมากตามช่วงอาชีพ โดยผู้เชี่ยวชาญระดับเริ่มต้นมองว่า AI แบบสร้างสรรค์เป็นส่วนขยายที่ใช้งานได้จริงของเครื่องมือดิจิทัลที่จำเป็นสำหรับการแข่งขันในตลาด ในขณะที่ผู้ปฏิบัติงานอาวุโสมักแสดงความสงสัยเชิงวิพากษ์เกี่ยวกับการลดคุณค่าของความเชี่ยวชาญเฉพาะด้านและการพัฒนาทักษะในระยะยาว^{[ 109 ]}

วิศวกรรมและการแบ่งปันที่รวดเร็ว

ข้อความแจ้งเตือนสำหรับโมเดลแปลงข้อความเป็นภาพบางโมเดลอาจรวมถึงรูปภาพ คำหลัก และพารามิเตอร์ที่กำหนดค่าได้ เช่น สไตล์ศิลปะ ซึ่งมักใช้ผ่านวลีสำคัญ เช่น "ในสไตล์ของ [ชื่อศิลปิน]" ในข้อความแจ้งเตือน^{[ 111 ]} /หรือการเลือกสไตล์สุนทรียศาสตร์/ศิลปะแบบกว้างๆ^{[ 112 ]}^{[ 107 ]}มีแพลตฟอร์มสำหรับการแบ่งปัน แลกเปลี่ยน ค้นหา แยก/ปรับปรุง หรือทำงานร่วมกันในข้อความแจ้งเตือนสำหรับการสร้างภาพเฉพาะจากตัวสร้างภาพ^{[ 113 ]}^{[ 114 ]}^{[ 115 ]}^{[ 116 ]}ข้อความแจ้งเตือนมักถูกแบ่งปันพร้อมกับรูปภาพบน เว็บไซต์ แบ่งปันรูปภาพเช่นRedditและเว็บไซต์ที่อุทิศให้กับศิลปะ AI ข้อความแจ้งเตือนไม่ใช่ข้อมูลป้อนเข้าทั้งหมดที่จำเป็นสำหรับการสร้างภาพ ข้อมูลป้อนเข้าเพิ่มเติมที่กำหนดภาพที่สร้างขึ้น ได้แก่ความละเอียดเอาต์พุตเมล็ดพันธุ์สุ่มและพารามิเตอร์การสุ่มตัวอย่างแบบสุ่ม^{[ 117 ]}

คำศัพท์ที่เกี่ยวข้อง

สื่อสังเคราะห์ซึ่งรวมถึงศิลปะ AI ได้รับการอธิบายในปี 2022 ว่าเป็นเทรนด์สำคัญที่ขับเคลื่อนด้วยเทคโนโลยีซึ่งจะส่งผลกระทบต่อธุรกิจในอีกไม่กี่ปีข้างหน้า^{[ 106 ]} นักวิจัย จาก Harvard Kennedy Schoolแสดงความกังวลเกี่ยวกับสื่อสังเคราะห์ที่ทำหน้าที่เป็นพาหะของข้อมูลเท็จทางการเมืองหลังจากศึกษาการแพร่กระจายของศิลปะ AI บนแพลตฟอร์ม X ไม่นาน^{[ 118 ]} Synthographyเป็นคำที่เสนอสำหรับการสร้างภาพที่คล้ายกับภาพถ่ายโดยใช้ AI ^{[ 119 ]}

บริบททางปรัชญา

งานศิลปะภาพที่สร้างโดย AI ได้รับการกล่าวถึงในประเด็นต่างๆ เช่น ความคิดสร้างสรรค์ ความเป็นเจ้าของผลงาน การแสดงออกทางกาย และสถานะของภาพ เทคโนโลยีนี้ยังจุดประกายการถกเถียงเกี่ยวกับดัชนีชี้วัดของภาพถ่ายและภาพยนตร์อีกครั้ง เนื่องจากระบบสร้างภาพสามารถสร้างภาพได้โดยไม่ต้องบันทึกเหตุการณ์ทางกายภาพที่เกิดขึ้นต่อหน้ากล้อง

ในบทความปี 2026 ของเขาเรื่อง "แถลงการณ์แห่งความเป็นจริง: ภาพยนตร์หลังร่องรอยทางกายภาพ" ผู้สร้างภาพยนตร์และศิลปินJohannes Grenzfurthnerได้โต้แย้งถึง "การเปิดเผยเชิงภววิทยา" โดยแยกแยะระหว่างภาพที่อ้างอิงถึงทางกายภาพ ภาพแบบผสม และภาพสังเคราะห์อย่างสมบูรณ์^{[ 120 ]}ศิลปินและนักการศึกษา Matt Ballou ได้กล่าวถึงข้อโต้แย้งของ Grenzfurthner ในการบรรยายปี 2026 เกี่ยวกับ AI และการสอน โดยเชื่อมโยงกับความกังวลเกี่ยวกับร่างกาย ลิขสิทธิ์ และความสามารถในการตรวจสอบว่าภาพ เอกสาร หรือเหตุการณ์มีต้นกำเนิดทางกายภาพหรือไม่^{[ 121 ]}ข้อโต้แย้งนี้ยังได้รับการกล่าวถึงในบทความปี 2026 ที่ตีพิมพ์โดยparaflowsซึ่งอธิบายลักษณะการแยกแยะของ Grenzfurthner ระหว่างภาพที่อิงตามเหตุการณ์ ภาพแบบผสม และภาพสังเคราะห์อย่างสมบูรณ์ว่าเป็นปฏิกิริยาทางสุนทรียศาสตร์และการเมืองต่อการอ่อนแอลงของขอบเขตแบบดั้งเดิมระหว่างสารคดีและนิยาย^{[ 122 ]}

การวิเคราะห์งานศิลปะที่มีอยู่โดยใช้ปัญญาประดิษฐ์

นอกเหนือจากการสร้างงานศิลปะต้นฉบับแล้ว ยังมีการสร้างวิธีการวิจัยที่ใช้ AI เพื่อวิเคราะห์คอลเลกชันงานศิลปะดิจิทัลในเชิงปริมาณ ซึ่งเป็นไปได้เนื่องจากการแปลงงานศิลปะเป็นดิจิทัลในวงกว้างในช่วงไม่กี่ทศวรรษที่ผ่านมา ตามที่ CETINIC และ SHE (2022) กล่าวไว้ การใช้ปัญญาประดิษฐ์ในการวิเคราะห์คอลเลกชันงานศิลปะที่มีอยู่แล้วสามารถให้มุมมองใหม่เกี่ยวกับการพัฒนารูปแบบศิลปะและการระบุอิทธิพลทางศิลปะได้^{[ 123 ]}^{[ 124 ]}

วิธีการคำนวณสองวิธี ได้แก่ การอ่านอย่างใกล้ชิดและการดูจากระยะไกล เป็นแนวทางทั่วไปที่ใช้ในการวิเคราะห์งานศิลปะดิจิทัล^{[ 125 ]}การอ่านอย่างใกล้ชิดมุ่งเน้นไปที่ลักษณะภาพเฉพาะของชิ้นงานหนึ่งชิ้น งานบางอย่างที่เครื่องจักรดำเนินการในวิธีการอ่านอย่างใกล้ชิด ได้แก่ การตรวจสอบความถูกต้องของศิลปินด้วยคอมพิวเตอร์และการวิเคราะห์ฝีแปรงหรือคุณสมบัติของพื้นผิว ในทางตรงกันข้าม วิธีการดูจากระยะไกลช่วยให้สามารถแสดงภาพความคล้ายคลึงกันในคอลเลกชันทั้งหมดสำหรับคุณลักษณะเฉพาะในเชิงสถิติได้ งานทั่วไปที่เกี่ยวข้องกับวิธีนี้ ได้แก่ การจำแนกประเภทอัตโนมัติการตรวจจับวัตถุ งานหลายรูปแบบการค้นพบความรู้ในประวัติศาสตร์ศิลปะ และสุนทรียศาสตร์เชิงคำนวณ^{[ 124 ]}ภาพสังเคราะห์ยังสามารถใช้ในการฝึกอัลกอริธึม AI สำหรับ การตรวจ สอบความถูกต้องของงานศิลปะและการตรวจจับการปลอมแปลงได้อีก ด้วย ^{[ 126 ]}

นักวิจัยยังได้นำเสนอแบบจำลองที่ทำนายการตอบสนองทางอารมณ์ต่อศิลปะ แบบจำลองหนึ่งคือ ArtEmis ซึ่งเป็นชุดข้อมูลขนาดใหญ่ที่จับคู่กับแบบจำลองการเรียนรู้ของเครื่อง ArtEmis ประกอบด้วยคำอธิบายประกอบทางอารมณ์จากผู้เข้าร่วมกว่า 6,500 คน พร้อมคำอธิบายเป็นข้อความ โดยการวิเคราะห์ทั้งข้อมูลภาพและคำอธิบายข้อความประกอบจากชุดข้อมูลนี้ ArtEmis ช่วยให้สามารถสร้างการทำนายทางอารมณ์ที่ละเอียดอ่อนได้^{[ 127 ]}^{[ 128 ]}

ศิลปะ AI รูปแบบอื่นๆ

AI ยังถูกนำไปใช้ในงานศิลปะนอกเหนือจากทัศนศิลป์ด้วย AI แบบสร้างสรรค์ถูกนำไปใช้ในการสร้างดนตรีรวมถึงในการผลิตวิดีโอเกมที่นอกเหนือจากภาพโดยเฉพาะอย่างยิ่งสำหรับการออกแบบระดับ (เช่น สำหรับแผนที่แบบกำหนดเอง ) และการสร้างเนื้อหาใหม่ (เช่น เควสต์หรือบทสนทนา) หรือเรื่องราวแบบโต้ตอบในวิดีโอเกม^{[ 129 ]}^{[ 130 ]} AI ยังถูกนำไปใช้ในศิลปะวรรณกรรมด้วย^{[ 131 ]}เช่น การช่วยเหลือเมื่อเขียนไม่ออก การสร้าง แรงบันดาลใจ หรือการเขียนใหม่บางส่วน^{[ 132 ]}^{[ 133 ]}^{[ 134 ]}^{[ 135 ]}ในศิลปะการทำอาหาร หุ่นยนต์ทำอาหาร ต้นแบบบางตัว สามารถชิมรสชาติ ได้แบบไดนามิก ซึ่งสามารถช่วยเชฟในการวิเคราะห์เนื้อหาและรสชาติของอาหารในระหว่างกระบวนการปรุงอาหาร^{[ 136 ]}

การใช้คำว่า "ศิลปะ"

การใช้คำว่า "ศิลปะ" เมื่อนำไปใช้กับผลงานที่สร้างโดยซอฟต์แวร์ AI ก่อให้เกิดการถกเถียงในหมู่ศิลปิน นักปรัชญา นักวิชาการ และบุคคลอื่นๆ ผู้สังเกตการณ์หลายคนโต้แย้งว่า การเรียกภาพที่สร้างโดยเครื่องจักรว่า "ศิลปะ" เป็นการบั่นทอนลักษณะดั้งเดิมของศิลปะของมนุษย์ เช่น ความคิดสร้างสรรค์ ทักษะ และเจตนา คำจำกัดความของการสร้างสรรค์ทางศิลปะที่แท้จริงในปัจจุบันมักเน้นย้ำถึงข้อกำหนดของเจตนาในระดับมนุษย์ ประสบการณ์ส่วนตัวและอารมณ์ ตลอดจนบริบททางประวัติศาสตร์และ/หรือศิลปะ^{[ 137 ]}

จากการศึกษาวิจัยของห้องสมุดการแพทย์แห่งชาติ พบว่ามนุษย์โดยธรรมชาติมักมีอคติต่อผลงานศิลปะที่อธิบายว่าสร้างขึ้นโดย AI เมื่อผู้เข้าร่วมการศึกษาได้รับชมภาพที่เทียบเคียงกันได้สองภาพ โดยมีเพียงภาพเดียวที่แสดงว่าสร้างขึ้นโดย AI ผู้เข้าร่วมมีแนวโน้มที่จะให้คะแนนภาพที่อธิบายว่าสร้างขึ้นโดยปัญญาประดิษฐ์ต่ำกว่าในด้านคุณค่าทางศิลปะ ซึ่งแสดงให้เห็นว่าทัศนคติทางสังคมและวัฒนธรรมสามารถกำหนดการตัดสินว่าภาพนั้นถือเป็นศิลปะหรือไม่ โดยไม่คำนึงถึงคุณลักษณะทางภาพอื่นๆ ของภาพ^{[ 138 ]}

ในรายงานที่ส่งไปยังการประชุมประจำปีของผู้สังเกตการณ์ศิลปะดิจิทัล ในปี 2023 ซามูเอล ลูมิส เขียนว่าคำว่า "ศิลปะ AI" ยอมรับลักษณะสองด้านของมันในฐานะที่เป็นผลผลิตจากการชี้นำของมนุษย์และระบบสร้างอัตโนมัติที่ขับเคลื่อนด้วยเครื่องจักร เมื่อประเมินโดยใช้มาตรฐานวิจารณ์เดียวกันกับที่ใช้กับศิลปะแบบดั้งเดิม^{[ 139 ]}

ดูเพิ่มเติม

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[ 15 ]

[

นับตั้งแต่มีการก่อตั้ง AI ในช่วงทศวรรษ 1950 ศิลปินได้ใช้ปัญญาประดิษฐ์ในการสร้างสรรค์ผลงานศิลปะ ผลงานเหล่า นี้

[ 18 ]

[ 19 ]

[ 20 ]

21 ] ตั้งแต่

22 ] ใน

[ 23 ]

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[ 30 ]

[ 31 ]

[ 32 ]

33 ] สำหรับ

[ 34 ]

[ 35 ]

[ 36 ]

[ 37 ]

[ 38 ]

[ 39 ]

[ 40 ]

[ 41 ]

[ 42 ]

[ 43 ]

[ 44 ]

[ 45 ]

[ 46 ]

[ 47 ]

[ 48 ]

[ 49 ]

[ 50 ]

[ 51 ]

[ 52 ]

53 ] ทันที

[ 54 ]

[ 55 ]

[ 56 ]

[ 57 ]

58

[

[

[

[

[

[

[ 65 ]

[

[

[

[

[

70

[

[

[

[

[ 76 ]

[ 77 ]

[ 78 ]

[ 79 ]

[ 80 ]

[ 81 ]

[ 82 ]

[ 83 ]

[ 84

[ 85 ]

[ 86 ]

[ 87 ]

[ 88 ]

[ 89 ]

[ 90 ]

[ 91 ]

[

[

[ 94 ]

[ 95 ]

[ 96 ]

[ 97 ]

[ 98 ]

[ 99 ]

[ 100 ]