อ่าน 6 นาที
รูปแบบไฟล์ GIS
รูป แบบไฟล์ GIS หรือ รูปแบบไฟล์เชิงพื้นที่ทางภูมิศาสตร์ คือมาตรฐานสำหรับการเข้ารหัส ข้อมูลทางภูมิศาสตร์ ลงใน ไฟล์คอมพิวเตอร์ เป็นรูปแบบ ไฟล์ เฉพาะ สำหรับใช้ใน...
รูปแบบไฟล์ GIS
รูปแบบไฟล์ GISหรือรูปแบบไฟล์เชิงพื้นที่ทางภูมิศาสตร์คือมาตรฐานสำหรับการเข้ารหัสข้อมูลทางภูมิศาสตร์ลงในไฟล์คอมพิวเตอร์เป็นรูปแบบไฟล์ เฉพาะ สำหรับใช้ในระบบสารสนเทศทางภูมิศาสตร์ (GIS) เครื่องมือ ประมวลผลภาพจากระยะไกล และแอปพลิเคชันเชิงพื้นที่อื่นๆ นับตั้งแต่ทศวรรษ 1970 เป็นต้นมา มีการสร้างรูปแบบไฟล์ขึ้นมาหลายสิบรูปแบบโดยอิงจากแบบจำลองข้อมูล ต่างๆ เพื่อวัตถุประสงค์ที่หลากหลาย รูปแบบไฟล์เหล่านี้ถูกสร้างขึ้นโดยหน่วยงานทำแผนที่ของรัฐบาล (เช่นUSGSหรือNational Geospatial-Intelligence Agency ) ผู้จำหน่ายซอฟต์แวร์ GIS องค์กรมาตรฐาน เช่นOpen Geospatial Consortiumชุมชนผู้ใช้ที่ไม่เป็นทางการ และแม้แต่ผู้พัฒนาแต่ละราย
ประวัติศาสตร์
ระบบสารสนเทศภูมิศาสตร์ (GIS) ชุดแรกในช่วงทศวรรษ 1960 เช่นระบบสารสนเทศภูมิศาสตร์ของแคนาดา (Canada Geographic Information System)นั้นใช้ซอฟต์แวร์เฉพาะและจัดเก็บข้อมูลในโครงสร้างไฟล์เฉพาะที่ออกแบบมาเพื่อตอบสนองความต้องการของโครงการนั้นๆ เมื่อมีการใช้งานมากขึ้น ก็สามารถนำมาเปรียบเทียบกันเพื่อหาแนวทางปฏิบัติที่ดีที่สุดและโครงสร้างทั่วไปได้[ 1 ]เมื่อมีการพัฒนาซอฟต์แวร์ GIS ทั่วไปในช่วงทศวรรษ 1970 และต้นทศวรรษ 1980 ซึ่งรวมถึงโปรแกรมจากห้องปฏิบัติการทางวิชาการ เช่นห้องปฏิบัติการคอมพิวเตอร์กราฟิกและการวิเคราะห์เชิงพื้นที่ของมหาวิทยาลัยฮาร์ วาร์ ด หน่วยงานของรัฐ (เช่นระบบการซ้อนทับแผนที่และสถิติ (MOSS) ที่พัฒนาโดยกรมประมงและสัตว์ป่า แห่งสหรัฐอเมริกา และสำนักงานจัดการที่ดิน ) และบริษัทซอฟต์แวร์ GIS ใหม่ๆ เช่นEsriและIntergraphแต่ละโปรแกรมถูกสร้างขึ้นโดยใช้รูปแบบไฟล์ที่เป็นกรรมสิทธิ์ของตนเอง (และมักเป็นความลับ) [ 2 ]เนื่องจากระบบ GIS แต่ละระบบแยกออกจากกันอย่างมีประสิทธิภาพ การแลกเปลี่ยนข้อมูลระหว่างกันจึงไม่ใช่เรื่องสำคัญ
ในช่วงต้นทศวรรษ 1990 การแพร่หลายของ GIS ทั่วโลกและความต้องการที่เพิ่มขึ้นสำหรับการแบ่งปันข้อมูล ซึ่งเร่งตัวขึ้นอย่างรวดเร็วโดยการเกิดขึ้นของเวิลด์ไวด์เว็บและโครงสร้างพื้นฐานข้อมูลเชิงพื้นที่นำไปสู่ความต้องการข้อมูลที่สามารถใช้งานร่วมกันได้และรูปแบบมาตรฐาน ความพยายามในการกำหนดมาตรฐานในช่วงแรกคือมาตรฐานการถ่ายโอนข้อมูลเชิงพื้นที่ของสหรัฐอเมริกา (US Spatial Data Transfer Standard ) ซึ่งเผยแพร่ในปี 1994 และออกแบบมาเพื่อเข้ารหัสข้อมูลที่หลากหลายของรัฐบาลกลาง[ 3 ]แม้ว่ารูปแบบเฉพาะนี้จะไม่ได้รับการสนับสนุนอย่างกว้างขวาง แต่ก็นำไปสู่ความพยายามในการกำหนดมาตรฐานอื่นๆ โดยเฉพาะอย่างยิ่งOpen Geospatial Consortium (OGC) ซึ่งได้พัฒนาหรือนำมาตรฐานที่เป็นกลางต่อผู้ขายหลายมาตรฐานมาใช้ ซึ่งบางส่วนได้รับการนำไปใช้โดยองค์การมาตรฐานสากล (ISO) [ 4 ]
พัฒนาการอีกอย่างหนึ่งในช่วงทศวรรษ 1990 คือการเผยแพร่รูปแบบไฟล์ที่เป็นกรรมสิทธิ์โดยผู้จำหน่ายซอฟต์แวร์ GIS สู่สาธารณะ ทำให้ซอฟต์แวร์อื่นสามารถนำไปใช้ได้ ตัวอย่างที่โดดเด่นที่สุดคือการเผยแพร่รูปแบบ Esri Shapefile [ 5 ]ซึ่งในช่วงปลายทศวรรษ 1990 ได้กลายเป็น มาตรฐาน โดยพฤตินัยที่ได้รับ ความนิยมมากที่สุด สำหรับการแบ่งปันข้อมูลโดยอุตสาหกรรมภูมิสารสนเทศทั้งหมด[ 6 ]เมื่อรูปแบบที่เป็นกรรมสิทธิ์ไม่ได้รับการแบ่งปัน (เช่น การครอบคลุม ESRI ARC/INFO) นักพัฒนาซอฟต์แวร์มักจะทำการวิศวกรรมย้อนกลับเพื่อเปิดใช้งานการนำเข้าและส่งออกในซอฟต์แวร์อื่น ซึ่งช่วยอำนวยความสะดวกในการแลกเปลี่ยนข้อมูลมากยิ่งขึ้น ผลลัพธ์ประการหนึ่งคือการเกิดขึ้นของไลบรารีซอฟต์แวร์ฟรีและโอเพนซอร์ส เช่นGeospatial Data Abstraction Library (GDAL)ซึ่งช่วยอำนวยความสะดวกอย่างมากในการบูรณาการข้อมูลเชิงพื้นที่ในรูปแบบใด ๆ เข้ากับซอฟต์แวร์ที่หลากหลาย[ 7 ]
ในช่วงทศวรรษ 2000 ความต้องการไฟล์ข้อมูลเชิงพื้นที่เฉพาะทางลดลงบ้างเนื่องจากการเกิดขึ้นของฐานข้อมูลเชิงพื้นที่ซึ่งได้รวมข้อมูลเชิงพื้นที่เข้ากับฐานข้อมูลเชิงสัมพันธ์ทั่วไป อย่างไรก็ตาม รูปแบบไฟล์ใหม่ๆ ยังคงปรากฏขึ้นอย่างต่อเนื่อง โดยเฉพาะอย่างยิ่งกับการแพร่หลายของการทำแผนที่บนเว็บ รูปแบบต่างๆ เช่นKeyhole Markup Language (KML) และGeoJSONสามารถบูรณาการเข้ากับภาษาการพัฒนาเว็บได้ง่ายกว่าไฟล์ GIS แบบดั้งเดิม
ลักษณะรูปแบบ
มีการสร้างรูปแบบที่แตกต่างกันมากกว่าร้อยรูปแบบสำหรับการจัดเก็บข้อมูลเชิงพื้นที่ โดยปัจจุบันมีการใช้งานทั่วไปประมาณ 20-30 รูปแบบสำหรับวัตถุประสงค์ต่างๆ ซึ่งสามารถจำแนกได้หลายวิธี:
- รูปแบบ เปิดได้รับการพัฒนาร่วมกันโดยชุมชนและเปิดให้ทุกคนสามารถนำไปใช้งานและมีส่วนร่วมในการปรับปรุง ในขณะที่ รูปแบบ กรรมสิทธิ์ได้รับการพัฒนาโดยบริษัทซอฟต์แวร์เพื่อใช้เฉพาะในซอฟต์แวร์ของตนเองและโดยทั่วไปจะถูกเก็บรักษาไว้เป็นความลับทางการค้า (แม้ว่ามักจะถูกวิศวกรรมย้อนกลับโดยผู้อื่นก็ตาม) หมวดหมู่ที่สามระหว่างสองประเภทนี้จะรวมถึงรูปแบบที่เป็นกรรมสิทธิ์เฉพาะของบริษัทหรือองค์กรหนึ่ง แต่ได้รับการเผยแพร่และเปิดให้ทุกคนสามารถนำไปใช้งาน เช่นEsri Shapefile [ 5 ]
- ไฟล์บางรูปแบบเป็นไฟล์ข้อความที่มนุษย์สามารถอ่านได้ (เช่น ไฟล์ที่ใช้XMLหรือJSON ) โดยเฉพาะไฟล์ที่ใช้สำหรับการแลกเปลี่ยนข้อมูล ในขณะที่ไฟล์บางรูปแบบเป็น ไฟล์ไบนารีซึ่งส่วนใหญ่เป็นไฟล์ที่ออกแบบมาเพื่อใช้งานในซอฟต์แวร์ GIS โดยตรง
- โดยพื้นฐานแล้ว รูปแบบข้อมูลเชิงพื้นที่ได้รับการออกแบบมาโดยเฉพาะสำหรับการจัดเก็บข้อมูลทางภูมิศาสตร์ ในขณะที่รูปแบบอื่นๆ เป็นส่วนขยายเชิงพื้นที่ของรูปแบบที่ออกแบบมาเพื่อการใช้งานทั่วไปมากกว่า (เช่นGeoTIFF , ฐานข้อมูลเชิงพื้นที่ )
- รูปแบบข้อมูลจำนวนมากมีการบีบอัดข้อมูล บางรูปแบบ โดยเฉพาะไฟล์แรสเตอร์ โดยทั่วไปแล้ว วิธีการบีบอัดแบบไม่สูญเสียข้อมูลจะดีกว่า วิธีการบีบอัดแบบ สูญเสียข้อมูลเนื่องจากจำเป็นต้องเรียกคืนค่าข้อมูลดั้งเดิม[ 8 ]
รูปแบบแรสเตอร์

เช่นเดียวกับภาพดิจิทัลทั่วไป ข้อมูล GIS แบบแรสเตอร์นั้นสร้างขึ้นจากการแบ่งพื้นที่ออกเป็นตารางสี่เหลี่ยมผืนผ้าที่มีแถวและคอลัมน์ของเซลล์ (หรือที่เรียกว่าพิกเซล ) โดยแต่ละเซลล์จะมีค่าที่วัดได้เก็บไว้ ความแตกต่างที่สำคัญจากภาพถ่ายคือ ตารางนั้นถูกกำหนดตำแหน่งตามพื้นที่ทางภูมิศาสตร์ ไม่ใช่ขอบเขตการมองเห็นความละเอียดของชุดข้อมูลแรสเตอร์คือความกว้างของเซลล์ในหน่วยพื้นดิน
เนื่องจากตารางเป็นตัวอย่างของพื้นที่ต่อเนื่อง ข้อมูลแรสเตอร์จึงมักใช้เพื่อแสดงข้อมูลทางภูมิศาสตร์ซึ่งคุณสมบัติจะเปลี่ยนแปลงอย่างต่อเนื่องหรือเป็นช่วงๆ ในพื้นที่ ตัวอย่างทั่วไป ได้แก่ภาพถ่ายจากดาวเทียมภูมิประเทศ/ระดับความสูงความหนาแน่นของประชากร สภาพอากาศ และภูมิอากาศคุณสมบัติของดินและอื่นๆ อีกมากมาย ข้อมูลแรสเตอร์อาจเป็นภาพที่แต่ละพิกเซล (หรือเซลล์) มีค่าสี ค่าที่บันทึกไว้สำหรับแต่ละเซลล์อาจมีระดับการวัด ใดก็ได้ รวมถึงค่าเชิงคุณภาพที่ไม่ต่อเนื่อง เช่น ประเภทการใช้ที่ดิน หรือค่าเชิงปริมาณที่ต่อเนื่อง เช่น อุณหภูมิ หรือ ค่า ว่างหากไม่มีข้อมูล ในขณะที่เซลล์แรสเตอร์เก็บค่าเดียว แต่สามารถขยายได้โดยใช้แถบแรสเตอร์เพื่อแสดงสี RGB (แดง เขียว น้ำเงิน) แผนที่สี (การจับคู่ระหว่างรหัสเฉพาะเรื่องกับค่า RGB) หรือตารางคุณลักษณะแบบขยายที่มีหนึ่งแถวสำหรับแต่ละค่าเซลล์ที่ไม่ซ้ำกัน นอกจากนี้ยังสามารถใช้เพื่อแสดงคุณลักษณะทางภูมิศาสตร์ ที่ไม่ต่อเนื่องได้ แต่โดยปกติจะใช้เฉพาะในกรณีที่จำเป็นอย่างยิ่งเท่านั้น
ข้อมูลแรสเตอร์ถูกจัดเก็บในรูปแบบต่างๆ ตั้งแต่โครงสร้างไฟล์มาตรฐาน เช่น TIFF, JPEG เป็นต้น ไปจนถึงข้อมูลไบนารีขนาดใหญ่ (BLOB) ที่จัดเก็บโดยตรงใน ระบบจัดการฐานข้อมูลเชิงสัมพันธ์ (RDBMS) คล้ายกับคลาสคุณลักษณะแบบเวกเตอร์อื่นๆ การจัดเก็บในฐานข้อมูล เมื่อมีการจัดทำดัชนีอย่างเหมาะสม มักจะช่วยให้เรียกค้นข้อมูลแรสเตอร์ได้เร็วขึ้น แต่ก็อาจต้องจัดเก็บข้อมูลจำนวนหลายล้านรายการที่มีขนาดใหญ่มาก
ตัวอย่างรูปแบบแรสเตอร์
- ADRG – กราฟิกแรสเตอร์ดิจิทัล ARC ของหน่วยงานข่าวกรองทางภูมิศาสตร์แห่งชาติ (NGA) [ 9 ]
- ไฟล์ไบนารี – ไฟล์ที่ไม่มีรูปแบบซึ่งประกอบด้วยข้อมูลแรสเตอร์ที่เขียนในรูปแบบข้อมูลหลายประเภทโดยที่แบนด์หลายแบนด์จะถูกจัดเก็บในรูปแบบ BSQ (band sequential), BIP (band interleaved by pixel) หรือ BIL (band interleaved by line) การอ้างอิงทางภูมิศาสตร์และข้อมูลเมตาอื่นๆ จะถูกจัดเก็บไว้ในไฟล์ไซด์คาร์ หนึ่ง ไฟล์ หรือมากกว่า [ 10 ]
- ภาพกราฟิกแรสเตอร์ดิจิทัล (DRG) – การสแกนดิจิทัลของแผนที่ภูมิประเทศ กระดาษ ของ USGS
- ECRG – Enhanced Compressed ARC Raster Graphics ของสำนักงานข่าวกรองทางภูมิศาสตร์แห่งชาติ (NGA) (มีความละเอียดดีกว่า CADRG และไม่มีการสูญเสียสี)
- ECW – Enhanced Compressed Wavelet (จาก ERDAS) รูปแบบเวฟเล็ตแบบบีบอัด ซึ่งมักมีการสูญเสียข้อมูลบางส่วน
- Esri Grid – รูปแบบข้อมูลแรสเตอร์ ไบนารี ที่เป็นกรรมสิทธิ์ ของEsri ซึ่งใช้ มาตั้งแต่กลางทศวรรษ 1980
- GeoTIFF – รูปแบบ ไฟล์ TIFFที่เสริมด้วยเมตาเดตาที่เกี่ยวข้องกับ GIS โดยเฉพาะข้อมูลอ้างอิงทางภูมิศาสตร์เป็นรูปแบบเปิดที่กลายเป็นหนึ่งในรูปแบบที่ใช้กันอย่างแพร่หลายที่สุดสำหรับการแบ่งปันข้อมูล
- IMG – รูปแบบไฟล์ภาพERDAS IMAGINE
- JPEG2000 – รูปแบบไฟล์ภาพแรสเตอร์แบบโอเพนซอร์ส เป็นรูปแบบการบีบอัดข้อมูลที่รองรับทั้งการบีบอัดแบบสูญเสียข้อมูลและไม่สูญเสียข้อมูล
- MrSID – ฐานข้อมูลภาพไร้รอยต่อหลายความละเอียด (โดย Lizardtech) รูปแบบเวฟเล็ตแบบบีบอัด รองรับทั้งการบีบอัดแบบสูญเสียข้อมูลและไม่สูญเสียข้อมูล
- netCDF -CF – รูปแบบไฟล์ netCDF ที่ใช้มาตรฐานเมดาต้า CFสำหรับข้อมูลวิทยาศาสตร์โลก จัดเก็บในรูปแบบไบนารีแบบเปิด พร้อมตัวเลือกการบีบอัด ช่วยให้สามารถเข้าถึงชุดย่อย/กลุ่มของแผนที่ได้โดยตรงจากเว็บผ่านโปรโตคอลOPeNDAP
- RPF – รูปแบบผลิตภัณฑ์แรสเตอร์ รูปแบบไฟล์ทางทหารที่ระบุในMIL-STD-2411 [ 11 ]
- USGS DEM – แบบจำลองระดับความสูงดิจิทัลของ USGS
- GTOPO30 – แบบจำลองระดับความสูงของโลกขนาดใหญ่ที่สมบูรณ์แบบที่ความละเอียด 30 อาร์คเซค ส่งมอบในรูปแบบ DEM ของ USGS
- DTED – ข้อมูลระดับความสูงภูมิประเทศดิจิทัลของสำนักงานข่าวกรองทางภูมิศาสตร์แห่งชาติ (NGA) ซึ่งเป็นมาตรฐานข้อมูลระดับความสูงทางทหาร
- ไฟล์ World file – การกำหนดพิกัดทางภูมิศาสตร์ให้กับไฟล์ภาพแรสเตอร์ (เช่น JPEG, BMP)
รูปแบบเวกเตอร์

ชุด ข้อมูล เวกเตอร์ (บางครั้งเรียกว่า ชุดข้อมูล คุณลักษณะ ) จัดเก็บข้อมูลเกี่ยวกับวัตถุที่ไม่ต่อเนื่อง โดยใช้การเข้ารหัสของแบบจำลองข้อมูลเชิงตรรกะเวกเตอร์เพื่อแสดงตำแหน่งหรือรูปทรงเรขาคณิตของแต่ละวัตถุ และการเข้ารหัสคุณสมบัติอื่นๆ ซึ่งโดยทั่วไปจะอิงตาม เทคโนโลยี ฐานข้อมูลเชิงสัมพันธ์โดยทั่วไป ชุดข้อมูลเดียวจะรวบรวมข้อมูลเกี่ยวกับชุดของวัตถุที่เกี่ยวข้องกันอย่างใกล้ชิดหรือคล้ายคลึงกัน เช่น ถนนทั้งหมดในเมือง
แบบจำลองข้อมูลเวกเตอร์ใช้เรขาคณิตพิกัดเพื่อแสดงรูปร่างแต่ละแบบเป็นหนึ่งในรูปทรงเรขาคณิตพื้นฐาน หลายแบบ ซึ่งโดยทั่วไปแล้วได้แก่จุด (พิกัดเดียวที่มีมิติ เป็นศูนย์ ) เส้น (รายการพิกัดหนึ่งมิติที่เรียงลำดับและเชื่อมต่อกันด้วยเส้นตรง) และรูปหลายเหลี่ยม (เส้นขอบปิดตัวเองที่ล้อมรอบพื้นที่สองมิติ) มีโครงสร้างข้อมูลมากมายที่ถูกพัฒนาขึ้นเพื่อเข้ารหัสรูปทรงเรขาคณิตพื้นฐานเหล่านี้เป็นข้อมูลดิจิทัล แต่รูปแบบไฟล์เวกเตอร์สมัยใหม่ส่วนใหญ่จะอิงตามข้อกำหนดSimple Features ของ Open Geospatial Consortium (OGC) ซึ่งมักจะรวมการเข้ารหัส Well-known text (WKT) หรือ Well-known binary (WKB) เข้าไว้โดยตรง
นอกจากรูปทรงเรขาคณิตของแต่ละวัตถุแล้ว ชุดข้อมูลเวกเตอร์ยังต้องสามารถจัดเก็บคุณลักษณะ ของวัตถุนั้น ได้ด้วย ตัวอย่างเช่น ฐานข้อมูลที่อธิบายทะเลสาบอาจมีข้อมูลความลึก คุณภาพน้ำ และระดับมลพิษของแต่ละทะเลสาบ ตั้งแต่ปี 1970 เป็นต้นมา รูปแบบไฟล์เวกเตอร์เกือบทั้งหมดได้นำ แบบจำลอง ฐานข้อมูลเชิงสัมพันธ์ มาใช้ ไม่ว่าจะในทางทฤษฎีหรือการรวมซอฟต์แวร์ RDBMSเข้าไปโดยตรงดังนั้น ชุดข้อมูลทั้งหมดจึงถูกจัดเก็บไว้ในตารางโดยแต่ละแถว แทน วัตถุเดียวที่มีคอลัมน์สำหรับแต่ละคุณลักษณะ[ 12 ] : 256
มีการใช้กลยุทธ์สองวิธีในการรวมเรขาคณิตและคุณลักษณะเข้าไว้ในโครงสร้างรูปแบบไฟล์เวกเตอร์เดียว: [ 13 ]
- รูปแบบเชิงภูมิศาสตร์สัมพันธ์จะจัดเก็บข้อมูลเหล่านั้นเป็นไฟล์แยกกันสองไฟล์ โดยเชื่อมโยงรูปทรงเรขาคณิตและคุณลักษณะของแต่ละวัตถุด้วยลำดับไฟล์หรือคีย์หลัก รูปแบบนี้เป็นที่นิยมใช้กันมากตั้งแต่ทศวรรษ 1970 ถึงต้นทศวรรษ 1990 เนื่องจากนักพัฒนาซอฟต์แวร์ GIS ต้องคิดค้นโครงสร้างข้อมูลรูปทรงเรขาคณิตของตนเอง แต่ได้รวมเอาโครงสร้างไฟล์ฐานข้อมูลเชิงสัมพันธ์ที่มีอยู่แล้วสำหรับคุณลักษณะต่างๆ ตัวอย่างเช่น รูปแบบ ไฟล์ Shapefile ของ Esri ประกอบด้วยไฟล์ .dbf จากซอฟต์แวร์dBase ของ DOS
- โมเดลเชิงวัตถุจะจัดเก็บข้อมูลเหล่านั้นไว้ในโครงสร้างเดียว โดยอิงตามวัตถุใน ภาษา การเขียนโปรแกรมเชิงวัตถุ อย่างหลวมๆ หรือโดยตรง นี่คือพื้นฐานของรูปแบบไฟล์สมัยใหม่ส่วนใหญ่ รวมถึงฐานข้อมูลเชิงพื้นที่ที่รวมคอลัมน์เรขาคณิตไว้กับคุณลักษณะอื่นๆ ในตารางเชิงสัมพันธ์เดียว รูปแบบอื่นๆ เช่นGeoJSONใช้โครงสร้างที่แตกต่างกันสำหรับเรขาคณิตและคุณลักษณะ แต่จะรวมเข้าด้วยกันสำหรับแต่ละวัตถุในไฟล์เดียวกัน
โทโพโลยีเชิงพื้นที่มักเป็นส่วนสำคัญของข้อมูลเวกเตอร์ ซึ่งแสดงถึงความสัมพันธ์เชิงพื้นที่โดยธรรมชาติ (โดยเฉพาะความติดกัน) ระหว่างวัตถุ โทโพโลยีได้รับการจัดการในรูปแบบไฟล์เวกเตอร์ในสี่วิธี ในโครงสร้างข้อมูลเชิงโทโพโลยีโดยเฉพาะอย่างยิ่ง POLYVRT ของ Harvard และ ความครอบคลุม ARC/INFO ที่สืบทอดต่อมา การเชื่อมต่อเชิงโทโพโลยีระหว่างจุด เส้น และรูปหลายเหลี่ยมเป็นส่วนสำคัญของการเข้ารหัสคุณลักษณะเหล่านั้น[ 8 ] : 46–49 ในทางกลับกัน ข้อมูลที่ไม่ใช่เชิงโทโพโลยีหรือ ข้อมูลสปาเก็ตตี้ (เช่น Esri Shapefileและฐานข้อมูลเชิงพื้นที่ ส่วนใหญ่ ) ไม่รวมข้อมูลเชิงโทโพโลยี โดยแต่ละรูปทรงเรขาคณิตจะเป็นอิสระจากกันโดยสมบูรณ์ชุดข้อมูลเชิงโทโพโลยี (มักใช้ในการวิเคราะห์เครือข่าย ) จะเพิ่มข้อมูลสปาเก็ตตี้ด้วยไฟล์แยกต่างหากที่เข้ารหัสการเชื่อมต่อเชิงโทโพโลยี[ 12 ] : 218 ฐานกฎโทโพโลยีคือรายการกฎโทโพโลยีที่ต้องการใช้เพื่อบังคับใช้ความสมบูรณ์เชิงพื้นที่ในข้อมูลสปาเก็ตตี้ เช่น "รูปหลายเหลี่ยมของเขตปกครองต้องไม่ทับซ้อนกัน" และ "รูปหลายเหลี่ยมของรัฐต้องมีขอบเขตร่วมกับรูปหลายเหลี่ยมของเขตปกครอง" [ 13 ]
ชุดข้อมูลเวกเตอร์มักแสดงถึงลักษณะทางภูมิศาสตร์ ที่ไม่ต่อเนื่อง เช่น อาคาร ต้นไม้ และเขตปกครอง อย่างไรก็ตาม อาจใช้เพื่อแสดงพื้นที่ทางภูมิศาสตร์โดยการจัดเก็บตำแหน่งที่ได้ทำการสุ่มตัวอย่างพื้นที่ต่อเนื่องนั้น จุดสุ่มตัวอย่าง (เช่นสถานีตรวจอากาศและเครือข่ายเซ็นเซอร์ ) เส้นชั้นความสูงและโครงข่ายสามเหลี่ยมไม่สม่ำเสมอ (TIN) ใช้เพื่อแสดงระดับความสูงหรือค่าอื่นๆ ที่เปลี่ยนแปลงอย่างต่อเนื่องในพื้นที่ TIN บันทึกค่า ณ ตำแหน่งจุด ซึ่งเชื่อมต่อกันด้วยเส้นเพื่อสร้างตาข่ายสามเหลี่ยมที่ไม่สม่ำเสมอ ด้านของสามเหลี่ยมแสดงถึงพื้นผิวของภูมิประเทศ
ตัวอย่างรูปแบบไฟล์เวกเตอร์
รูปแบบที่ใช้กันทั่วไปในปัจจุบัน:
- Shapefile – รูปแบบข้อมูลเวกเตอร์ GIS ยอดนิยม พัฒนาโดยEsri
- ภาษามาร์กอัปทางภูมิศาสตร์ (GML) – มาตรฐานเปิดแบบ XML (โดยOpenGIS ) สำหรับการแลกเปลี่ยนข้อมูล GIS
- GeoJSON – รูปแบบไฟล์ขนาดเล็กที่พัฒนามาจากJSONซึ่งใช้โดยโปรแกรม GIS แบบโอเพนซอร์สหลายโปรแกรม
- GeoMedia – รูปแบบการจัดเก็บข้อมูลเวกเตอร์เชิงพื้นที่ของIntergraph ที่ใช้ Microsoft Access เป็นพื้นฐาน
- ภาษา Keyhole Markup Language (KML) – มาตรฐานเปิดแบบ XML (พัฒนาโดยOpenGIS ) สำหรับการแลกเปลี่ยนข้อมูล GIS
- รูปแบบไฟล์ TAB ของ MapInfo – รูปแบบข้อมูลเวกเตอร์ของMapInfo ที่ใช้ไฟล์ TAB, DAT, ID และ MAP
- รูปแบบ Measure Map Pro – รูปแบบข้อมูล XMLสำหรับจัดเก็บข้อมูล GIS
- รูปแบบการโอนถ่ายข้อมูลระดับชาติ (NTF) – รูปแบบการโอนถ่ายข้อมูลระดับชาติ (ส่วนใหญ่ใช้โดยหน่วยสำรวจภูมิประเทศของสหราชอาณาจักร)
- Spatialite – ส่วนขยายเชิงพื้นที่สำหรับSQLiteที่ให้ฟังก์ชันการทำงานของฐานข้อมูลเชิงภูมิศาสตร์แบบเวกเตอร์ คล้ายกับPostGIS , Oracle Spatialและ SQL Server ที่มีส่วนขยายเชิงพื้นที่
- คุณสมบัติพื้นฐาน – ข้อกำหนดของ Open Geospatial Consortiumสำหรับข้อมูลเวกเตอร์
- Well-known text (WKT) – ภาษามาร์กอัปข้อความสำหรับแสดงรูปทรงเรขาคณิตของฟีเจอร์ พัฒนาโดยOpen Geospatial Consortium
- ไบนารีที่รู้จักกันดี (WKB) – เวอร์ชันไบนารีของข้อความที่รู้จักกันดี ซึ่งใช้ในฐานข้อมูลเชิงพื้นที่ หลายแห่ง
- SOSI – รูปแบบข้อมูลเชิงพื้นที่ที่ใช้สำหรับการแลกเปลี่ยนข้อมูลเชิงพื้นที่สาธารณะทั้งหมดในประเทศนอร์เวย์
- AutoCAD DXF – รูปแบบการถ่ายโอนข้อมูลสำหรับ ข้อมูล AutoCAD (โดยAutodesk )
- ไฟล์ข้อมูลทางภูมิศาสตร์ (GDF) — รูปแบบไฟล์แลกเปลี่ยนข้อมูลทางภูมิศาสตร์
รูปแบบเอกสารเก่าแก่ที่ปัจจุบันไม่ค่อยได้ใช้แล้ว:
- ArcInfo Coverage - โครงสร้างข้อมูลเชิงโทโพโลยีที่ใช้ใน Arc/INFO ตั้งแต่ปี 1981 ถึง 2000
- Esri TIN – รูปแบบ ไบนารี เฉพาะ ของEsriสำหรับ ข้อมูล เครือข่ายที่ไม่สม่ำเสมอแบบสามเหลี่ยม
- กราฟเส้นดิจิทัล (DLG) – รูปแบบข้อมูลเวกเตอร์ของ USGS
- TIGER – การเข้ารหัสและการอ้างอิงทางภูมิศาสตร์แบบบูรณาการเชิงโทโพโลยี
- รูปแบบผลิตภัณฑ์เวกเตอร์ (Vector Product Formatหรือ VPF) – รูปแบบข้อมูลเวกเตอร์ของสำนักงานข่าวกรองทางภูมิศาสตร์แห่งชาติ (National Geospatial-Intelligence Agency หรือ NGA) สำหรับฐานข้อมูลทางภูมิศาสตร์ขนาดใหญ่
- ไฟล์ข้อมูลเชิงพื้นที่ – รูปแบบฐานข้อมูลเชิงภูมิศาสตร์ประสิทธิภาพสูงของAutodesk ซึ่งเป็นรูปแบบเฉพาะของ MapGuide
- ISFC – โซลูชัน CAD บนพื้นฐานMicroStationของIntergraph ที่เชื่อมต่อองค์ประกอบเวกเตอร์เข้ากับ ฐานข้อมูล เชิงสัมพันธ์ ของ Microsoft Access
- Dual Independent Map Encoding (DIME) – รูปแบบไฟล์ GIS เก่าแก่ที่พัฒนาขึ้นในทศวรรษ 1960
ข้อดีและข้อเสีย
การใช้แบบจำลองข้อมูลแรสเตอร์หรือเวกเตอร์เพื่อแสดงความเป็นจริงนั้น มีทั้งข้อดีและข้อเสียที่สำคัญบางประการ:
- ชุดข้อมูลแรสเตอร์จะบันทึกค่าสำหรับทุกจุดในพื้นที่ที่ครอบคลุม ซึ่งอาจต้องใช้พื้นที่จัดเก็บมากกว่าการแสดงข้อมูลในรูปแบบเวกเตอร์ที่สามารถจัดเก็บข้อมูลเฉพาะในส่วนที่จำเป็นเท่านั้น
- การประมวลผลข้อมูลแบบแรสเตอร์นั้นใช้ทรัพยากรน้อยกว่ากราฟิกแบบเวกเตอร์
- การรวมค่าและการเขียนสูตรเฉพาะสำหรับการรวมค่าจากเลเยอร์ต่างๆ นั้นง่ายกว่ามากเมื่อใช้ข้อมูลแรสเตอร์
- จะเกิดปัญหาเรื่องความโปร่งใสและการเกิดภาพซ้อนเมื่อซ้อนภาพแรสเตอร์หลายภาพเข้าด้วยกัน
- ข้อมูลเวกเตอร์ช่วยให้การแสดงผลแบบซ้อนทับทำได้อย่างราบรื่นและง่ายดาย โดยเฉพาะอย่างยิ่งในแง่ของกราฟิกและข้อมูลที่ขับเคลื่อนด้วยรูปร่าง เช่น แผนที่ เส้นทาง และแบบอักษรที่กำหนดเอง ซึ่งทำได้ยากกว่าหากใช้ข้อมูลแรสเตอร์
- ข้อมูลเวกเตอร์สามารถแสดงผลเป็นกราฟิกเวกเตอร์ที่ใช้ในแผนที่แบบดั้งเดิม ในขณะที่ข้อมูลแรสเตอร์จะปรากฏเป็นภาพที่มีลักษณะเป็นเหลี่ยมๆ บริเวณขอบเขตของวัตถุ (ขึ้นอยู่กับความละเอียดของไฟล์แรสเตอร์)
- ข้อมูลเวกเตอร์นั้นง่ายต่อการลงทะเบียน ปรับขนาด และฉายภาพใหม่ ซึ่งจะช่วยลดความซับซ้อนในการรวมเลเยอร์เวกเตอร์จากแหล่งต่างๆ
- ข้อมูลเวกเตอร์เข้ากันได้ดีกว่ากับสภาพแวดล้อมฐานข้อมูลเชิงสัมพันธ์ เนื่องจากสามารถเป็นส่วนหนึ่งของตารางเชิงสัมพันธ์ได้เหมือนกับคอลัมน์ทั่วไป และสามารถประมวลผลได้โดยใช้ตัวดำเนินการหลากหลายประเภท
- โดยทั่วไปไฟล์เวกเตอร์จะมีขนาดเล็กกว่าไฟล์ข้อมูลแรสเตอร์ ซึ่งอาจมีขนาดใหญ่กว่าไฟล์เวกเตอร์หลายสิบ หลายร้อย หรือมากกว่านั้น (ขึ้นอยู่กับความละเอียด)
- ข้อมูลเวกเตอร์นั้นง่ายต่อการอัปเดตและบำรุงรักษา ในขณะที่ภาพแรสเตอร์จะต้องสร้างขึ้นใหม่ทั้งหมด (ตัวอย่างเช่น การเพิ่มถนนใหม่)
- ข้อมูลเวกเตอร์ช่วยให้สามารถวิเคราะห์ได้มากขึ้น โดยเฉพาะอย่างยิ่งสำหรับ "เครือข่าย" เช่น ถนน ไฟฟ้า ทางรถไฟ โทรคมนาคม เป็นต้น (ตัวอย่างเช่น เส้นทางที่ดีที่สุด ท่าเรือที่ใหญ่ที่สุด สนามบินที่เชื่อมต่อกับทางหลวงสองเลน) ข้อมูลแรสเตอร์จะไม่มีลักษณะทั้งหมดของฟีเจอร์ที่แสดงอยู่
รูปแบบไฟล์แบบบูรณาการ
ฐานข้อมูลเชิงวัตถุสัมพันธ์สมัยใหม่สามารถจัดเก็บข้อมูลที่ซับซ้อนหลากหลายประเภทโดยใช้ ชนิดข้อมูล วัตถุขนาดใหญ่แบบไบนารีซึ่งรวมถึงทั้งตารางแรสเตอร์และรูปทรงเรขาคณิตแบบเวกเตอร์ ทำให้ ระบบ ฐานข้อมูลเชิงพื้นที่ บางระบบสามารถ จัดเก็บข้อมูลทั้งสองรูปแบบไว้ในฐานข้อมูลเดียวกันได้
- Esri File Geodatabase - รูปแบบเฉพาะสำหรับการจัดเก็บ "ฟีเจอร์" (เวกเตอร์) และข้อมูลแรสเตอร์ในพื้นที่[ 14 ]
- Esri Enterprise Geodatabase - โมเดลที่เป็นกรรมสิทธิ์สำหรับการจัดเก็บโครงสร้าง geodatabase ใน ระบบจัดการฐานข้อมูลเชิงสัมพันธ์เชิงพาณิชย์และโอเพนซอร์สที่หลากหลาย[ 14 ]
- GeoPackage (GPKG) – รูปแบบเปิดตามมาตรฐานที่อิงตามรูปแบบฐานข้อมูล SQLite สำหรับทั้งข้อมูลเวกเตอร์และแรสเตอร์ ซึ่งได้รับการยอมรับโดยOpen Geospatial Consortium [ 15 ]
ดูเพิ่มเติม
- ระบบพิกัดทางภูมิศาสตร์
- GDAL/OGRคือห้องสมุดสำหรับอ่านและเขียนข้อมูลในหลายรูปแบบ
- Feature Manipulation Engine (FME) เป็นโปรแกรมเชิงพาณิชย์สำหรับแปลงข้อมูลระหว่างรูปแบบต่างๆ จำนวนมาก
สรุปเนื้อหา
ข้อมูลสำคัญจากบทความ
ข้อมูลสำคัญเกี่ยวกับ รูปแบบไฟล์ GIS
รูป แบบไฟล์ GIS หรือ รูปแบบไฟล์เชิงพื้นที่ทางภูมิศาสตร์ คือมาตรฐานสำหรับการเข้ารหัส ข้อมูลทางภูมิศาสตร์ ลงใน ไฟล์คอมพิวเตอร์ เป็นรูปแบบ ไฟล์ เฉพาะ สำหรับใช้ใน...
ประวัติศาสตร์
ระบบสารสนเทศภูมิศาสตร์ (GIS) ชุดแรกในช่วงทศวรรษ 1960 เช่น ระบบสารสนเทศภูมิศาสตร์ของแคนาดา (Canada Geographic Information System) นั้นใช้ซอฟต์แวร์เฉพาะและจัดเก็บข้อมูลในโครงสร้างไฟล์เฉพาะที่ออกแบบมาเพื่อตอบสนองความต้องการของโครงการนั้นๆ เมื่อมีการใช้งานมากขึ้น...
ลักษณะรูปแบบ
มีการสร้างรูปแบบที่แตกต่างกันมากกว่าร้อยรูปแบบสำหรับการจัดเก็บข้อมูลเชิงพื้นที่ โดยปัจจุบันมีการใช้งานทั่วไปประมาณ 20-30 รูปแบบสำหรับวัตถุประสงค์ต่างๆ ซึ่งสามารถจำแนกได้หลายวิธี:
รูปแบบแรสเตอร์
เช่นเดียวกับภาพดิจิทัลทั่วไป ข้อมูล GIS แบบแรสเตอร์นั้นสร้างขึ้นจากการแบ่งพื้นที่ออกเป็นตารางสี่เหลี่ยมผืนผ้าที่มีแถวและคอลัมน์ของ เซลล์ (หรือที่เรียกว่า พิกเซล ) โดยแต่ละเซลล์จะมีค่าที่วัดได้เก็บไว้ ความแตกต่างที่สำคัญจากภาพถ่ายคือ ตารางนั้นถูก กำหนดตำแหน่ง...