자료 표현방식

WKT, WKB

WKT(Well-Known Text) Geometry

WKT는 지도, 공간 객체의 공간 참조 시스템(Spatial Reference System) 그리고 공간 참조 시스템 간의 변환을 표현하기 위한 텍스트 마크업 언어입니다. 이와 유사한 WKB(Well-Known Binary)라고 알려진 바이너리 형식이 PostGIS와 같은 데이터 베이스에 동일한 정보를 저장하고 변환되는데 사용됩니다. 포멧은 OGC(Open Geospatial Consortium)에 의해 제정됩니다.

기하학적 오브젝트(geometric objects)

WKT로 표현할 수 있는 기하학적 오브젝트는 포인트(Point), 선(Line), 폴리곤(Polygon), TIN 그리고 다각형(Polyhedrons)입니다. 멀티 지오메트리는 하나의 오브젝트에서 동일한 차원의 한개 이상의 지오메트리를 표현하는데 이용되며 다른 차원의 지오메트리들은 지오메트리 컬렉션(geometry collection)에 저장될 수 있습니다.

지오메트리의 좌표는 2D(x, y) 그리고 3D(x, y, z) 그리고 4D(x, y, z, m)일 수 있습니다. 어떠한 좌표도 가지고 있지 않은 빈 지오메트리는 타입 이름과 함께 EMPTY 심벌을 사용해 명시됩니다. 다음은 WKT에 대한 몇가지 지오메트리 예입니다.

POINT(6 10)
LINESTRING(3 4,10 50,20 25)
POLYGON((1 1,5 1,5 5,1 5,1 1),(2 2, 3 2, 3 3, 2 3,2 2))
MULTIPOINT((3.5 5.6),(4.8 10.5))
MULTILINESTRING((3 4,10 50,20 25),(-5 -8,-10 -8,-15 -4))
MULTIPOLYGON(((1 1,5 1,5 5,1 5,1 1),(2 2, 3 2, 3 3, 2 3,2 2)),((3 3,6 2,3 3)))
GEOMETRYCOLLECTION(POINT(4 6),LINESTRING(4 6,7 10))
POINT ZM (1 1 5 60)
POINT M (1 1 80)
POINT EMPTY
MULTIPOLYGON EMPTY

1번은 포인트 지오메트리이며, 2번은 폴리라인 지오메트리, 3번은 폴리곤 지오메트리입니다. 그리고 4번, 5번, 6번은 멀티 포인트, 멀티 폴리라인, 멀티 폴리곤 지오메트리입니다. 7번은 다양한 형태의 지오메트리 타입의 복합 타입입니다. 8번은 Z값과 M값을 가진 포이트 지오메트리이며 9번은 M 값을 가지는 포인트 지오메트입니다. 마지막 10번과 12번은 좌표가 없는 빈(Empty) 지오메트리입니다.

공간 참조 시스템(spatial reference systems)

공간 참조 시스템에 대한 WKT 문자열은 측지학 데이텀(geodetic datum), 좌표 체계 그리고 공간 오브젝트에 대한 지도 투영 정보를 설명합니다. 이러한 공간 참조 시스템에 대한 WKT는 많은 GIS 프로그램에서 널리 사용됩니다. 예를 들어 ESRI는 shapefile의 *.prj 파일에서 WKT를 사용합니다. 다음은 공간 참조 시스템에 대한 WKT의 한가지 예입니다.

COMPD_CS["OSGB36 / British National Grid + ODN",
    PROJCS["OSGB 1936 / British National Grid",
        GEOGCS["OSGB 1936",
            DATUM["OSGB_1936",
                SPHEROID["Airy 1830",6377563.396,299.3249646,
                      AUTHORITY["EPSG","7001"]],
                TOWGS84[375,-111,431,0,0,0,0],
                AUTHORITY[["EPSG","6277"]],
            PRIMEM["Greenwich",0,AUTHORITY["EPSG","8901"]],
            UNIT["DMSH",0.0174532925199433,AUTHORITY["EPSG","9108"]],
            AXIS["Lat",NORTH],
            AXIS["Long",EAST],
            AUTHORITY[["EPSG","4277"]],
        PROJECTION["Transverse_Mercator"],
        PARAMETER["latitude_of_origin",49],
        PARAMETER["central_meridian",-2],
        PARAMETER["scale_factor",0.999601272],
        PARAMETER["false_easting",400000],
        PARAMETER["false_northing",-100000],
        UNIT["metre",1,AUTHORITY["EPSG","9001"]],
        AXIS["E",EAST],
        AXIS["N",NORTH],
        AUTHORITY[["EPSG","27700"]],
    VERT_CS["Newlyn",
        VERT_DATUM["Ordnance Datum Newlyn",2005,AUTHORITY["EPSG","5101"]],
        UNIT["metre",1,AUTHORITY["EPSG","9001"]],
        AXIS["Up",UP],
        AUTHORITY[["EPSG","5701"]],
    AUTHORITY[["EPSG","7405"]]

변환(transformations)

WKT 포맷은 변환 방법과 두개의 서로 다른 공간 참조 시스템 간의 좌표 변환에 사용되는 파라메터를 기술하기 위해 사용됩니다. 아래는 이러한 변환에 대한 WKT의 한가지 예입니다.

PARAM_MT["Mercator_2SP", 
    PARAMETER["semi_major",6370997.0], 
    PARAMETER["semi_minor",6370997.0], 
    PARAMETER["central_meridian",180.0], 
    PARAMETER["false_easting",-500000.0], 
    PARAMETER["false_northing",-1000000.0], 
    PARAMETER[["standard parallel 1",60.0]]
PARAM_MT["Affine",
    PARAMETER["num_row",3],
    PARAMETER["num_col",3],
    PARAMETER["elt_0_1",1],
    PARAMETER["elt_0_2",2],
    PARAMETER[["elt 1 2",3]]

WKT를 지원하는 RDBMS로는 PostGIS 모듈 1.3을 가진 Postgresql, Oracle 9i, 10g, 11g 그리고 mySQL 4.1,공간 데이터블레이드 모듈을 가진 Informix 9, 10, 11 그리고 MS SQL Server 2008과 SpatialLite 등이 있습니다

WKB(Well-Known Binary) Format

공간 데이터를 처리하는 DBMS는 포인트, 폴리라인, 폴리곤과 같은 공간 좌표 데이터를 효율적으로 저장하기 위해 BLOB 타입으로써 WKB라는 형태로 저장합니다.

WKB, 즉 Well-known Binary는 OpenGIS 스펙에 의해 정의된 지오메트리 값을 표현하기 위해 사용됩니다. KWB는 지오메트리 WKB 정보를 담고 있는 BLOB 타입의 값으로 표현되는 바이너리 스트림으로써 지오메트리 데이터를 상호간에 교환하기 위해 사용됩니다. WKB는 1바이트의 부호없는 정수와 4바이트의 부호없는 정수 그리고 8바이트의 배정밀 소수(IEEE 754)를 사용합니다. 여기서 1바이트는 8비트입니다.

예를 들면 WKT인 POINT(1 1)을 동일한 WKB로 변환해 본다면 다음과 같은 총 21개로 구성된 연속된 바이트입니다.

0101000000000000000000F03F000000000000F03F

앞의 연속된 바이트를 해석 해보면 다음과 같습니다

즉, 첫번째 1바이트의 값이 1이면 바이트 정렬이 Little-Endian이며 0이면 Big-Endian이라는 의미입니다. 그리고 다음 2바이트는 지오메트리 타입으로써 현재까지 제안된 타입은 총 7개로써 Point, LineString, Polygon, MultiPoint, MultiLineString, MultiPolygon 그리고 GemetryCollection입니다. 끝으로 포인트의 좌표인 X와 Y 값이 각각 8바이트씩 오게됩니다.

앞의 예는 Point 타입에 대한 예이며 다른 지오메트리 타입에 대해서, 보다 직관적이고 효율적으로 파악하기 위해 C언어의 구조체 형식으로 보면 다음과 같습니다.

// Basic Type definitions
// byte : 1 byte
// uint32 : 32 bit unsigned integer  (4 bytes)
// double : double precision number (8 bytes)
// Building Blocks : Point, LinearRing
 
Point {
    double x;
    double y;
};

LinearRing   {
    uint32 numPoints;
    Point points[numPoints];
};

enum wkbGeometryType {
    wkbPoint = 1,
    wkbLineString = 2,
    wkbPolygon = 3,
    wkbMultiPoint = 4,
    wkbMultiLineString = 5,
    wkbMultiPolygon = 6
};

enum wkbByteOrder {
    wkbXDR = 0, // Big Endian
    wkbNDR = 1 // Little Endian
};

WKBPoint {
    byte byteOrder;
    uint32 wkbType; // 1=wkbPoint
    Point point;
};

WKBLineString {
  byte byteOrder;
  uint32 wkbType; // 2=wkbLineString
  uint32 numPoints;
  Point points[numPoints];
};
 
WKBPolygon {
  byte byteOrder;
  uint32 wkbType; // 3=wkbPolygon
  uint32 numRings;
  LinearRing rings[numRings];
};

WKBMultiPoint {
  byte byteOrder;
  uint32 wkbType; // 4=wkbMultipoint
  uint32 num_wkbPoints;
  WKBPoint WKBPoints[num_wkbPoints];
};

WKBMultiLineString {
  byte byteOrder;
  uint32 wkbType; // 5=wkbMultiLineString
  uint32 num_wkbLineStrings;
  WKBLineString WKBLineStrings[num_wkbLineStrings];
};
 
wkbMultiPolygon {
  byte byteOrder;
  uint32 wkbType; // 6=wkbMultiPolygon
  uint32 num_wkbPolygons;
  WKBPolygon wkbPolygons[num_wkbPolygons];
};
 
WKBGeometry  {
  union {
    WKBPoint point;
    WKBLineString linestring;
    WKBPolygon polygon;
    WKBMultiPoint mpoint;
    WKBMultiLineString mlinestring;
    WKBMultiPolygon mpolygon;
  }
};

바이너리는 크기면에서 데이터를 매우 최적화된 형태로 저장할 수 있는 포맷입니다. GIS 엔진을 설계하고 개발할때 자체 엔진에 특화된 데이터 구조를 설계하는 것 대신에 이러한 표준을 수용할 경우 얻을 수 있는 이점은 매우 크다고 할 수 있겠습니다.

Last updated