作者:Roman
GIS数据常见文件格式
数据类型 | 常见文件格式 |
---|---|
DEM地形数据 | tif,dem |
DOM影像数据 | tif,img |
矢量数据 | shp,kml,geojson,def/dwg |
三维模型 | 倾斜摄影osgd,人工建模obj,BIM数据dvt/dgn,点云las/ply |
TIF
TIF文件为栅格图像文件,后缀为tif或tiff, 是ogc规范的一种,全称GeoTiff. 通常不能在资源管理器中查看tif栅格影像数据的坐标系信息,需要用GIS软件查看,因为它的坐标系信息写在数据文件内部。
tif可以有8位,24位等深度,一般真彩色是24位,而地形数据只有一个高度值,采用8位。目前很多卫星影像数据、地形数据的存储式都是tif.
SHP
Shapefile文件是ESRI公司ArcGIS平台的常用格式文件,是工业标准的矢量数据文件。 Shapefile将空间特征表中的非拓扑几何对象和属性信息存储在数据集中,特征表中的几何对象存为以坐标点集表示的图形文件–SHP文件,Shapefile文件并不含拓扑(Topological) 数据结构。
shp的特点:
-
1个Shape文件包括三个文件:主文件(.shp) ,索引文件(.shx), dBASE表(.dbf)
-
一个shp文件只能存储点、线、面中的一种类型,不存 在混合存在的状态
-
shp可以设置很多字段属性
KML/KMZ
KML(Keyhole Markup Language,Keyhole标记语言)最初是由Google旗下的Keyhole公司开发和维护的一种基于XML的标记语言,利用XML语法格式描述地理空间数据(如点、线、面、多边形和模型等),适合网络环境下的地理信息协作与共享。 2008 年4月,KML的最新版本2.2被OGC宣布为开放地理信息编码标准并改由OGC维护和发展。
KMZ文件是压缩过的KML文件。由于KMZ是压缩包,因此,它不仅 能包含KML文本,也能包含与之关联的如图片、模型等其他文件。
DWG/DXF
dwg文件:是Autodesk公司AutoCAD平台的图形文件格式,是二维或三维图形档案。其与dxf文件是可以互相转化的。
dxf文件:是AutoCAD推出与其它软件平台之间进行数据交换的一种开放的矢量数据格式
由于AutoCAD是最流行的CAD系统,DXF也被广泛使用。绝大多数CAD系统都能读入或输出DXF文件。
GeoJSON
GeoJSON是适合于Web下对各种地理数据结构进行编码的格式,基于Javascript对象表示法的地理空间信息数据交换格式。与普通json文件格式区别在于 对其属性及组成由一定规范。
GeoJSON将所有的地理要素分为Point、MultiPoint. LineString、MultiLineString、Polygon、MultiPolygon、GeometryCollection 首先是将这些要素封装到单个的geometry里,然后作为一个个的Feature 要素放到一个要素集合里构成。
GIS软件的数据组织结构(SuperMap)
以SuperMap为例。数据组织结构主要包括工作空间、数据源、数据集、地图、场景、布局等。
-
数据源集合:组织和管理着工作空间中的所有数据源,数据源是由各种类型的数据集(如点、线、面、栅格/影像等类型数据)组成的数据集集合。一个数据源可包含一个或多个不同类型的数据集;也可以同时存储矢量数据集和栅格数据集。
-
地图集合:用来管理存储在工作空间中的地图数据,用户在工作空间中显示和制作的地图都可以保存在工作空间中,便于下次打开工作空间时浏览地图。
-
布局集合:用来管理工作空间的布局数据,布局主要用于对地图进行排版打印。
-
场景集合:用来管理存储在工作空间中的场景数据,用户在工作空间中显示和制作的场景都可以保存在工作空间中。
-
资源集合:即符号库集合,用来管理工作空间中的地图和场景中所使用的符号库资源,包括点符号库、线符号库和填充符号库。
工作空间
即用户的工作环境,用户在进行数据操作时,都需要先创建一个工作空间,才能进一步操作 GIS数据。工作空间会保存用户在该工作环境中的操作结果,包括用户在该工作空间中打开的数据源、保存的地图、布局和三维场景等,当用户打开工作空间时可以继续上一次的工作成果来工作。
工作空间中的地图、布局、三维场景和资源都是依附于工作空间存在的,即这些内容都保存在工作空间中,删除工作空间时,其中的地图、布局、三维场景和符号库资源也相应的随之删除;而数据源是独立存储的,与工作空间只是关联关系,并没有保存在工作空间中,当删除工作空间时,只是删除了工作空间与数据源的关联关系,并不能删除数据源。
数据源集合
工作空间中的数据源集合主要管理工作空间中打开的所有数据源,通过工作空间中的数据源集合可以实现数据源的创建、打开、关闭等操作功能。
数据源
数据源用于存储空间数据,独立于工作空间,因此存储在数据源中的所有空间数据也独立于工作空间存储。
数据源可以分为三大类:
-
文件型数据源 即 UDB 类型数据源,存储于扩展名为
.udb/.udd
的文件。新建 UDB 数据源时,会同时产生两个文件。 GIS 空间数据除了包含空间几何对象外,还包含对象的属性信息,在文件型数据源中,.udb
文件主要存储空间数据的空间几何信息,.udd
文件存储属性信息。一个数据源文件只对应一个数据源。 -
数据库型数据源 存储于数据库中的数据源,其空间数据的空间几何信息和属性信息都存储在数据库中。
-
Web 数据源,存储于网络上的某个服务器上,在使用该类型的数据源时,通过 URL 地址来获取相应的数据源。
一个工作空间中可以包含多个不同类型的数据源,通常一个数据源中组织一类用途的空间数据,从而便于数据的归类和使用。
数据集
数据源中的空间数据是对现实世界的抽象,即将现实世界中的地理事物抽象为计算机世界中可以处理的各种图形对象,现实世界中的点状事物就抽象为点几何对象,线状事物就抽象为线几何对象,面状事物就抽象为面几何对象,为了便于数据的统一管理,引入数据集的概念,即将同类事物存储在一类数据集中。
例如,点数据集就只能存储点几何对象、线数据集就只能存储线几何对象、面数据集就只能存储面几何对象。因此,一个数据源中的空间数据被组织为各种类型数据集,即数据源实际是一个数据集集合,包含了各种类型的多个数据集。
SuperMap GIS的数据集类型包括: 点数据集(Point)、线数据集(Line)、面数据集(Region)、纯属性数据集(Tabular)、网络数据集(Network)、复合数据集(CAD)、文本数据集(Text)、路由数据集(LineM)、影像数据集(Image)、栅格数据集(Grid)、模型数据集(Model)。
数据集是 SuperMap GIS空间数据的基本组织单位之一,是数据组织的最小单位,数据集可以作为图层在地图窗口中实现可视化显示,即可以将数据集中存储的几何对象以图形的方式呈现在地图窗口中,对于栅格和影像数据集,则根据其存储的像元值以图像的方式显示在地图窗口中。并且数据集的可视化编辑也是通过地图窗口来实现的,如编辑数据集中几何对象的空间位置和形状或者通过矢量化获取新的数据集等。
一个数据源中可以包含多个各种类型的数据集,可以通过工作空间中的数据源来管理数据源中的数据集,包括创建数据集或者导入其他来源的数据作为数据集以及其他操作等。
地图集合
地图集合用来管理存储在工作空间中的地图数据,用户在工作空间中显示和制作的地图都可以保存在工作空间中,便于下次打开工作空间时浏览地图。
应用程序可以同时打开多个地图窗口,每一个地图窗口中当前显示的内容为一幅地图,工作空间中的地图都包含在地图集合中,由于地图是保存在工作空间中的,因此,只有保存了工作空间,其中的地图才能被保存下来。
地图
将数据集添加到地图窗口中,被赋予了显示属性,如:显示风格、专题地图等,就成为图层。 当一个或者多个图层按照某种顺序叠放在一块,显示在一个地图窗口中,就可以成为一个地图。 一般而言,一个图层对应着一个数据集;同一个数据集可以被多次添加到不同的地图窗口中,而且可以赋予不同的显示风格。 地图窗口中图层的风格可以随时根据需要进行修改,通过修改图层风格或制作专题地图两种方法即可实现。 在地图窗口中还可以对图层中的空间几何对象进行可视化编辑,如改变对象的位置、大小和形状等,这些操作都会直接反映到图层对应的数据集中,也就是说,对图层的编辑实质是对图层关联的数据集中数据的编辑。
布局集合
工作空间中的布局集合管理工作空间中保存的所有布局,通过布局集合可以实现布局的创建、保存、输出、打印以及删除等操作。
布局
布局主要用于对地图进行排版打印,是地图、图例、地图比例尺、指北针、文本等各种不同元素的混合排版与布置。
场景集合
工作空间中的场景集合管理工作空间中保存的所有场景。
场景
场景是以抽象的球模式来模拟现实的地球,并将现实世界抽象出来的地理事物在球体上进行展示,从而更直观形象地反映现实地理事物的实际空间位置和相互关系。 用户可以将二维或者三维数据直接加载到球上进行浏览,制作专题图等。
资源集合
工作空间中的资源集合主要管理工作空间中的地图所使用的符号库资源,包括符号库、线型库和填充库。
符号库
使用点符号库设置图层中点的风格,包括符号类型、大小、颜色等;使用线符号库设置图层中线的风格,包括线型、线宽、线的颜色等;使用填充符号库,设置图层中面对象的填充风格。
ArcGIS
ArcGIS 的数据组织结构,主要包括gdb、mdb
ArcGIS能够支持的数据格式:
地图文件(MXD)
即用户的工作环境,用户在进行数据操作时,都需要先创建一个地图文件,才能进一步操作 GIS数据。地图文件会保存用户操作结果,包括用户在打开的数据源、符号化方案等。当用户打开地图文件时可以继续上一次的工作成果来工作。
Geodatabase地理数据库
Geodatabase是在新的一体化数据存储技术的基础上发展起来的新数据模型。实现Geodatabase数据模型之前所有空间数据模型(包括shape和Coverage)都无法完成的数据统一管理。即在一个公共模型框架下,对GIS通常所处理和表达的地理空间特征如矢量、栅格、TIN、网络和地址进行统一描述。 同时,Geodatabase是面向对象的地理数据模型,其地理空间特征的表达较之以往的模型更接近我们对现实事物对象的认识和表达。
表
表格信息是地理要素的基础,可用于显示、查询和分析数据。简言之,表是由行和列组成,且所有行都具有相同的列。在 ArcGIS 中,行和列分别称为记录和字段。每个字段可存储一个特定的数据类型,如数字、日期或文本段。
要素数据集
要素数据集是共用一个通用坐标系的相关要素类的集合。要素数据集用于按空间或主题整合相关要素类。它们的主要用途是,将相关要素类编排成一个公用数据集,用以构建拓扑、网络数据集、地形数据集或几何网络。
要素类
数据源中的空间数据是对现实世界的抽象,即将现实世界中的地理事物抽象为计算机世界中可以处理的各种图形对象,现实世界中的点状事物就抽象为点几何对象,线状事物就抽象为线几何对象,面状事物就抽象为面几何对象,为了便于数据的统一管理,将同类事物存储在一类要素类中。 例如,点要素类就只能存储点几何对象、线要素类就只能存储线几何对象、面要素类就只能存储面几何对象。
Terrain Terrain 数据集是一种多分辨率的基于 TIN 的表面数据结构,它是基于作为要素存储在地理数据库中的测量值构建而成的。通常,terrain 数据集利用激光雷达、声纳和摄影测量源进行构建。Terrain 存储在地理数据库的要素数据集中,其中包含用于构建 terrain 的要素。
网络数据集
网络数据集非常适合于构建交通网络。它们由包含了简单要素 (线和点) 和转弯要素的源要素创建而成,而且存储了源要素的连通性。使用 ArcGIS Network Analyst 扩展模块执行分析时,该分析始终作用于网络数据集。
拓扑
拓扑关系可以为指定的单个或多个要素类执行拓扑规则。例如地块是不能出现交叠的、一个地块不能跨越两个行政区划,建筑物必须在地块之内等,都是一些拓扑规则,这些规则建立后可以作用到这些要素类上,当对这些要素类进行数据编辑的时候,ArcGIS对自动进行拓扑检查。
关系类
是一种表(要素类)和另一个表(要素类)之间的联系机制。关系类是有一个表(要素类)指向另一个要素类。当第一个要素类中的数据发生变化后,另一个要素类的数据要会发生变化。例如我们可以把地块和建筑物关联起来,当地块移动的时候,地块内的建筑物可以随着地块自动移动。
栅格目录
栅格数据集
栅格数据集通过将世界分割成在格网上布局的离散方形或矩形像元来表示地理要素。每个像元都具有一个值,用于表示该位置的某个特征,例如温度、高程或光谱值。
镶嵌数据集 是一组以目录形式存储并以单个镶嵌影像或单个影像(栅格)的方式显示或访问的栅格数据集(影像)。这些集合的总文件大小和数据集数量都会非常大。镶嵌数据集中的栅格数据集可以采用本机格式保留在磁盘上,也可以存在于地理数据库中。可通过栅格记录以及属性表中的属性来管理元数据。通过将元数据存储为属性,可以更方便地管理诸如传感器方向数据等参数,同时也可以提高对选择内容的查询速度。
今天的文章GIS之数据管理与存储分享到此就结束了,感谢您的阅读。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/23409.html