1 부 문제 설명
1.1 특정 작업
이 작업은 궤적 압축입니다. GPS 데이터 레코드 파일이 주어지면 각 레코드에는 두 개의 좌표 필드, 경도 및 치수가 포함됩니다. 모든 레코드에는 위도 및 경도 좌표가있어 궤적을 형성합니다. 압축 궤적의 거리 오차가 30m 미만이되도록 적절한 압축 알고리즘을 사용해야합니다.
1.2 프로그램 입력
이 프로그램의 입력은 GPS 데이터 레코드 파일입니다.
1.3 데이터 출력
출력 양식은 압축 지점의 ID 시퀀스 및 좌표, 포인트 수, 평균 거리 오류 및 압축 속도를 포함한 세 부분, ID 시퀀스 및 좌표를 포함한 파일입니다.
두 번째 부분에 대한 답변
문제 설명에 따르면, 우리는 문제를 해결하고 문제 해결은 다음 단계로 나뉩니다.
2.1 데이터 전처리
이 프로그램 입력은 총 3150 개의 레코드 라인이있는 GPS 데이터 레코드 파일이며 각 레코드 라인은 여러 필드로 나뉩니다. 이 질문에 따르면, 우리는 경도 및 위도 좌표 필드에만주의를 기울여야합니다. 원래 데이터 파일의 일부 레코드는 그림 2.1에 나와 있습니다.
그림 2.1 원래 데이터 파일의 부분 레코드의 개략도
그림 2.1에서 볼 수 있듯이 원래 데이터 파일의 각 레코드에서 위도 및 경도 좌표 필드 데이터의 스토리지 형식은 전형적인 GPS 좌표 표현 방법, 즉 학위 분할 형식, 양식은 dddmm.mmmmmm이며, 여기서 DDD는 정도를 나타내고, mm.mmmmmm은 분수의 부분을 나타내고, 소 구술 부분은 분수의 부분을 나타냅니다. 이 데이터 전처리에서 다음 두 좌표 지점 사이의 거리 계산을 용이하게하기 위해서는 위도 및 경도 좌표 데이터를 학위 분할 형식으로 전환 형식으로 변환해야합니다. 변환 방법은 DDD+mm.mmmm/60입니다. 여기서 우리는 소수점 후 6 자리를 유지하고 변환 된 형태는 ddd.xxxxxx입니다.
우리는 첫 번째 레코드 (11628.2491, 3955.6535)에서 위도 및 경도 좌표를 취합니다. 전환 결과는 (116.470818, 39.927558)입니다. 모든 레코드의 위도 및 경도 좌표는 방법을 사용하여 수행되며, 각 변환 된 좌표 지점에 대해 ID를 생성하고 고유하게 식별 할 수 있습니다. 압축 후, 우리는 모든 예약 지점의 ID 만 출력하면됩니다.
2.2 Douglas-Peucker 궤적 압축 알고리즘
궤적 압축 알고리즘은 두 가지 범주, 즉 무손실 압축 및 손실 압축으로 나뉩니다. 무손실 압축 알고리즘에는 주로 허프만 코딩이 포함되며, 손실 압축 알고리즘은 배치 처리 방법과 온라인 데이터 압축 방법으로 나뉩니다. 배치 프로세싱 방법에는 DP (Douglas-Peucker) 알고리즘, TD-TR (하향식 시간 반격) 알고리즘 및 Bellman 알고리즘이 포함됩니다. 온라인 데이터 압축 방법에는 슬라이딩 창, 열린 창, 안전한 지역 기반 방법 등이 포함됩니다.
제한된 시간으로 인해이 궤적 압축의 경우 비교적 간단한 DP 알고리즘을 사용하기로 결정했습니다.
DP 알고리즘의 단계는 다음과 같습니다.
(1) 곡선의 시작과 끝에서 두 지점 A와 B 사이의 직선 AB를 연결하고 직선은 곡선의 코드입니다.
(2) 곡선의 다른 모든 지점을 가로 지르고 각 지점에서 직선 AB까지의 거리를 찾고 최대 거리의 지점 C를 찾은 다음 최대 거리를 DMAX로 기록합니다.
(3) 거리 DMAX를 사전 정의 된 임계 값 DMAX 크기와 비교하십시오. Dmax <dmax 인 경우, 직선 AB는 곡선 세그먼트의 근사치로 사용되고 곡선 세그먼트가 처리됩니다.
(4) dmax> = dmax 인 경우, 점 C는 곡선 AB를 두 섹션 AC 및 CB로 나누고 (1) ~ (3)이 두 섹션의 각각을 수행합니다.
(5) 모든 곡선이 처리 될 때, 각 분할 지점에 의해 형성된 폴리 라인은 차례로, 즉 원래 곡선의 경로입니다.
2.3 지점에서 줄까지의 거리
DP 알고리즘에서는 지점에서 직선까지의 거리를 찾아야합니다. 이 거리는 수직 유로와 같은 거리, 즉 직선 AB 외부의 지점 C에서 라인 AB까지의 거리를 나타냅니다. 여기서는 점 A, B 및 C가 모두 위도 및 경도 좌표입니다. 우리는 동등한 영역의 삼각형 방법을 사용하여 거리 d를 찾습니다. 구체적인 방법은 다음과 같습니다. 점 A, B 및 C는 삼각형을 형성합니다. 이 삼각형의 영역, 즉 일반 방법 (하단 x 높이/2)과 Helen 공식을 찾는 두 가지 방법이 있습니다. Helen 공식은 다음과 같습니다.
측면 길이 a, b 및 c가있는 삼각형이 각각 있다고 가정합니다. 삼각형의 영역은 다음 공식에서 얻을 수 있습니다.
여기서 P는 절반 둘레입니다.
우리는 헬렌 공식을 통해 삼각형의 면적을 찾을 수 있으며 높이의 크기를 찾을 수 있습니다. 여기서 높이는 거리 d입니다. Helen 공식을 사용하려면 3 점 A, B 및 C 사이의 거리를 찾아야합니다. 거리 공식은 교사가 제공하며 거리 기능을 직접 호출 할 수 있습니다.
참고 : 거리를 찾은 후에는 절대 값을 추가하여 거리가 음수가되는 것을 방지하십시오.
2.4 평균 오류를 해결하십시오
평균 오차는 압축 중에 무시한 점에서 거리의 합을 해당 라인 세그먼트로 나누어 총점 수를 나누어 얻은 값을 나타냅니다.
2.5 압축 속도에 대한 솔루션
압축 비율 계산 공식은 다음과 같습니다.
2.6 생성 데이터 결과 파일
위의 처리 및 계산 후 압축 후 나머지 지점의 ID 및 포인트 수, 평균 거리 오류, 압축 속도 및 기타 매개 변수를 최종 결과 파일에 작성하고 질문에 대한 답이 완료됩니다.
파트 3 코드 구현
이 프로그램은 Intellij Idea 14.0.2의 개발 환경과 함께 Java 언어로 작성되었습니다. 코드는 두 클래스로 나뉩니다. 하나는 위도 및 경도 지점 정보를 저장하는 데 사용되는 enpoint 클래스이고, 다른 하나는 궤적 컴퓨터 메인 클래스이며, 데이터 처리, DP 알고리즘, 포인트 투 라인 거리 및 평균 오류와 같은 기능을 작성하는 데 사용됩니다.
3.1 일반 절차 프로세스
전체 프로그램 흐름에는 주로 다음 단계가 포함됩니다.
(1) 관련 Arraylist 배열 및 파일 개체를 정의하는데, 그중 3 개의 Arraylist 배열 개체, 즉 원래 위도 및 경도 좌표 배열 Pgpsarryinit, 필터링 된 포인트 좌표 PgpsarrayFilter 및 필터링 및 정렬 된 포인트 좌표 배열 Pgpsarrayfilterort가 있습니다. 5 개의 파일 개체, 즉 원래 데이터 파일 객체 FGP, 압축 결과 데이터 파일 OGP, 변환 된 원본 위도 및 경도 좌표 지점, 시뮬레이션 테스트 파일 FtestinitPoint 및 FtestFilterPoint를 유지하는 데이터 파일 FINITGPSPOING입니다.
(2) 원래 지점의 좌표를 얻고 주로 파일을 포함하여 파일에 씁니다. 파일을 읽고 파일 쓰기;
(3) 궤적 압축을 수행한다.
(4) 압축 위도 및 경도 점 좌표를 분류하십시오.
(5) 시뮬레이션 테스트 파일을 생성하고 R 언어 도구를 사용하여 최종 결과를 얻기 위해 그래픽을 그리십시오.
(6) 평균 오차 및 압축 속도를 찾으면 평균 오차는 함수를 통해 얻어지고 압축 속도는 직접 계산됩니다.
(7) 필터링 포인트 ID, 포인트 수, 평균 오차 및 압축 속도를 포함하여 최종 결과를 결과 파일에 기록합니다.
3.2 특정 구현 코드
(1) enpoint.java
패키지 cc.xidian.main; import java.text.decimalformat;/*** 2015/12/20에 Hadoop에 의해 생성 된/***/***/public class enpoint 구현 <enpoint> {public int id; // point idpublic double pe; // longitude public double pn; // dimension public enpoint () {} // empormat dectuctor to tostring (to -dectuctring). new Decimalformat ( "0.000000"); return this.id+"#"+this.pn+","+this.pe;} public string getTestString () {decimalformat df = new Decimalformat ( "0.0000000"); return df.format (this.pn)+","+df.format (} public string (}); df = new Decimalformat ( "0.000000"); return this.id+"#"+df.format (this.pn)+","+df.format (this.pe);}@atedreidepublic int compareto (enpoint other) {if (this.id <eloy.id) return -1; else if (this.id> other.id) return1; elsereturn0;}}(2) 궤적 통신 메인 .java
패키지 cc.xidian.main; import java.io.*; import java.text.decimalformat; import java.util.*; import java.util.list;/*** 2015/12/19에 Hadoop에 의해 생성 된/***. Exception{//------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- pGPSArrayInit = new ArrayList <enpoint> (); // 원본 레코드 위도 및 경도 조정 배열 배열 배열 arraylist <enpoint> pgpsarrayfilter = new ArrayList <enpoint> (); // 필터링 된 위도 및 경도 좌표 배열 배열 arraylist <enpoint> pgpsarrayfiltersort = new arraylist> (); // lathitude file arraylist> (); file ( "2007-10-14-gps.log"); // 원본 데이터 파일 객체 파일 OGPS = 새 파일 ( "2015-12-25-gps-Result.log"); // 필터링 된 결과 데이터 파일 객체 // 원래 위도 및 경도 데이터 파일을 도피로 변환 한 후 원래 위도 및 경도 데이터 파일을 "ID#크고 길고 값"으로 유지합니다. 10 진수 포인트 파일 FINITGPSPOING = 새 파일 ( "2007-10-14-gps-enpoint.log"); // 변환 된 파일 FTESTINITPOINT = 새 파일 후 원래 위도 및 경도 좌표 지점의 변환 된 데이터 파일을 유지합니다 ( "2007-10-14-14-GPS-inittestPoint.log"); // 원래 Latitude 및 Longitude Point 파일 FTETFILTETINGINE POINE FTERFILTETINGINE 파일 ( "2015-12-25-gps-filtertestpoint.log"); // 필터링 된 위도 및 경도 좌표 지점 데이터 파일에 사용 simulation//------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- pgpsarrayinit); // 변환 된 원본 위도 및 경도 지점 데이터를 파일 시스템에 쓰기. coordinates//---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- 30.0; // 최대 거리 오류 임계 값 pgpsarrayfilter.add (pgpsarrayinit.get (0)); // 첫 번째 원래 위도 및 경도 지점의 좌표를 가져 와서 필터링 된 배열 pgpsarrayfilter.add (pgpsarrayinit.sgize (pgpsarrayinit.size); 위도 및 경도 지점 및 필터링 된 배열 enpoint [] enpinit = new enpoint [pgpsarrayinit.size ()]; // 후속 압축 반복기 <enpoint> iinit = pgpsarrayinit.terator ()에 대한 모든 포인트 좌표를 받기 위해 포인트 배열을 사용합니다. iinit.next (); jj ++;} // ArrayList의 지점의 좌표를 arraylist int int start = 0에 포인트로 복사합니다 int int start = 0; // int end = pgpsarrayinit.size () -1; // end script trajcompressc (enpinit, pgpsarrayfilter, start, end, dmax); // dp algord algoRed. System.out.println (pgpsarrayfilter.size ()); // 압축 points//---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- enpoint [pgpsarrayfilter.size ()]; // 다음 분류 반복자 <enpoint> if = pgpsarrayfilter.iterator (); int i = 0; while (hasnext ()) {enpfilter [i] = if.next (); i ++; i ++; Point Array Array.SORT (EnpFilter); // 정렬 (int j = 0; array}//------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- pgpsarrayfiltersort); // 필터링 된 위도 및 경도 데이터 포인트를 시뮬레이션 파일에 쓰면 형식은 "경도, 차원"입니다. //-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- getMeanDisteror (pgpsarrayinit, pgpsarrayfiltersort); // 평균 오류를 찾으십시오 System.out.println(mDError);//----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ (double) pgpsarrayfilter.size ()/pgpsarrayinit.size ()*100; // 압축 속도를 찾으십시오 System.out.println(cRate);//--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- 및 압축 비율 writeFilterPointToFile(oGPS,pGPSArrayFilterSort,mDError,cRate);//----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- @param fgps : 소스 데이터 파일* @return pgpsarrayinit : 모든 포인트 좌표를 저장하는 배열리스트 배열* @throws 예외*/public static arraylist <enpoint> getenpointfromfile (파일 fgps) 예외 {arraylist <enpoint> pgpsarray = new ArrayList <enpoint> (); if (fgps.exists () && fgps.isfile ()) {inputStreamReader read = new inputStreamReader (new fileInputStream (fgps)); bufferedReader = new BufferedReader (string; String; Strgps; int i = 0; breader.readline ()! = null) {strgps = str.split ( "); enpoint p = new enpoint (); p.id = i; i ++; p.pe = (strgps [3]); pGPSArray;}/*** Function function: Write the latitude and longitude coordinates, average distance error, and compression ratio of the filtered point to the result file* @param outGPSFile: result file* @param pGPSPointFilter: filtered point* @param mDerror: average distance error* @param cRate: compression ratio* @throws Exception*/public static void writeFilterPointToFile(File outgpsfile, arraylist <enpoint> pgpspointfilter, double mderror, double crate) 예외 {iterator <enpoint> ifilter = pgpspointfilter.iterator (); randomaccessfile rfilter = new RandomAccessFile (outgpsfile, "rw"); ifilter.next (); String sfilter = p.getResultstring ()+"/n"; byte [] bfilter = sfilter.getBytes (); rfilter.write (bfilter);} string strmc = "#"+integer.tostring (pgpspointfilter.size ())+","+double.tostring (mderror)+","+double.tostring (크레이트)+"%"+"#"+"/n"; bmc = strmc.getBytes (); rfilter.write (bmc); 기능 기능 : 변환 된 원래 위도 및 경도 데이터 포인트를 파일에 저장* @param outgpsfile* @param pgpspointfilter* @throws Exception*/public static void writeInitpointTofile (파일 outgpsFile, arraylist <enpoint> pgpspointFilter) 예외 {iterpoint <enourator = renduccessfiRe = pgpspointFilter. rfilter = new randomAccessFile (outgpsFile, "rw"); while (ifilter.hasnext ()) {enpoint p = ifilter.next (); String sfilter = p.toString ()+"/n"; byte [] bfilter = sfilter.getBytes (); rfilter.write (bfilter);} rfilter.close ();}/*** 함수 기능 : 시각적 테스트를 위해 테스트 파일에 배열에있는 위도 및 경도 포인트 좌표 데이터 @param outgpsfile : file object* @param pgpspointfilter*/public void todet todet todet toidetstoptstots*/public void todet todet todet todet todet todet todet todet todet todet todet todet todet todet todet todet todet todet todet todet todet todet toptor outgpsfile, arraylist <enpoint> pgpspointfilter)는 예외를 {iterator <enpoint> ifilter = pgpspointfilter (); randomaccessfile rfilter = new randomaccessfile (outgpsfile, "rw"); p.getTestString ()+"/n"; byte [] bfilter = sfilter.getBytes (); rfilter.write (bfilter);} rfilter.close ();}/*** 함수 기능 : 원시 위도 및 경도 좌표 데이터를 @param str : @param str : @param coordinates*/longitate coordinates*/retation을위한 Decdate*/Longitate Coordinates* @retory*/longitude coordinates : dftodu (string str) {int indexd = str.indexof ( '.'); String strm = str.substring (0, indexd-2); Strng strn = str.substring (indexd-2); double d = double.parsedouble (strm)+double.parsedouble (strn)/60; return d;}/*** 함수 : 6 개의 double the a worly hound plose of a double plose of a double plose. @Return은 변환 된 이중 번호*/public static double getpointsix (double d) {decimalformat df = new decimalformat ( "0.000000"); @Param PA : 시작점* @Param PB : 엔드 포인트* @Param PX : Third Point* @return 거리 : PO와 PB가 위치한 지점과 직선 사이의 거리는*/public static double disttosgment (enpoint pa, enpoint pb, enpoint px) {double a = math.abs (pa, pb)); Double B = Math.abs (pa, px); math.abs (geodist (pb, px)); double p = (a+b+c) /2.0; double s = math.sqrt (math.abs (p*(pa)*(pb)*(pc)); double d = s*2.0/a; return d;}/*** 함수 기능 : 두 지점 사이의 거리와 긴 지점을 찾는 방법을 사용합니다. 시작점* @param pb : 엔드 포인트* @return 거리 : 거리*/public static double eodist (enpoint pa, enpoint pb) {double radlat1 = rad (pa.pn); double radlat2 = rad (pb.pn); double delta_lon = rad (pb.pe -pa.pe); double top_1 = math.cos (radlat2)* delt. top_2 = math.cos (radlat1) * math.sin (radlat2) - math.sin (radlat1) * math.cos (radlat2) * math.cos (delta_lon); double top = math.sqrt (top_1 * top_1 + top_2 * top_2); Double Bottom = Mathins (radlat1) * math.sin (radlat2) *. math.cos (radlat1)* math.cos (radlat2)* math.cos (delta_lon); double delta_sigma = math.atan2 (상단, 하단); double 거리 = delta_sigma* 6378137.0; 반환 거리;}/*** 기능 : 앵글 라디안* @param d : radian*/problic d d) {return d* math.pi / 180.0;} / *** 함수 함수 : 최대 거리 한계에 따르면, 원래의 궤적은 압축 된 궤적을 얻기 위해 DP 메소드를 사용하여 재귀 적으로 샘플링됩니다.* @param enpinit* @param coordinate points 배열* @param enparrayfilter : 필터링 포인트* @param strate : @param strate : @param strate* 첨자* @param dmax : 사전 지정 된 최대 거리 오류*/public static void trajcompressc (enpoint [] enpinit, arraylist <enpoint> enpoint> enpoint> enpoint> enpoint> enpoint> enpoint> enpoint> enpoint> enpoint> enpoprayfilter, int end, double dmax) {if (start <end) {// recursive condition double maxdist = 0; // maximum dist subts = 0; i = start+1; i <end; i ++) {double curdist = disttosegment (enpinit [start], enpinit [end], enpinit [i]); // 현재 지점에서 해당 라인 세그먼트까지의 거리 (curdist> maxdist) {maxdist = curdist; cur_pt = i;} // 최대 거리와 최대 지점을 찾습니다. 거리} // 현재 최대 거리가 최대 거리 오차보다 큰 경우 (maxdist> = dmax) {enparrayfilter.add (enpinit [cur_pt]); // 현재 지점을 필터링 된 배열에 추가하고 원래의 선 부분을 현재 지점을 중심으로 한 두 세그먼트로 분해하고 재귀 처리를 수행합니다. trajcompressc (enpinit, enparrayfilter, start, cur_pt, dmax); @return : 평균 거리는*/public static double getmeandisteror (arraylist <enpoint> pgpsarrayinit, arraylist <enpoint> pgpsarrayfiltersort) {double sumdist = 0.0; for (int i = 1; i <pgpsarrayfiltersort.size (); int int int int int int (int int int int). = pgpsarrayfiltersort.get (i) .id; for (int j = start+1; MeanDist;}}파트 IV 절차 결과
4.1 프로그램 출력 결과
압축 결과 :
(1) 총점 수 : 140 점; (2) 평균 거리 오차 : 7.943786; (3) 압축률 : 4.4444%
4.2 시뮬레이션 결과
궤적 압축 후, 우리는 원래 위도 및 경도 좌표 지점을 압축 및 필터링 위도 및 경도 좌표 지점으로 변환합니다. 우리는이 두 지점을 두 파일로 조정 한 다음이 두 파일에 따라 압축 전후에 궤적을 그린 다음 비교합니다. 비교 결과를 바탕으로 궤적 압축 알고리즘이 효과적인지 확인할 수 있습니다. 최종 비교 결과는 그림 4.1에 나와 있습니다.
파트 5 요약
이 프로그램의 글쓰기 과정에서 나는 다양한 문제를 겪고 많은 프로그래밍 경험을 배웠습니다. 다음은 발생하는 문제와 솔루션에 대한 요약이며, 마지막으로 프로그램의 단점에 대한 개선을위한 제안을 제시합니다.
5.1 문제와 솔루션이 발생했습니다
질문 1 : 위도 및 경도 좌표 주문 문제
솔루션 : 거리 공식의 매개 변수는 위도가 앞쪽에 있고 경도가 뒤쪽에 있으며 위도 및 경도 좌표 지점의 순서를 조정해야한다는 것입니다.
질문 2 : 거리는 음수가 될 수 없습니다
솔루션 : 발견 된 거리가 음수 일 수 없는지 확인하고 절대 값 함수를 추가하십시오.
질문 3 : DP 알고리즘 구현 세부 사항
솔루션 : ArrayList 배열을 사용하여 첨자 문제를 해결하기 시작했습니다. 재귀 적으로 해결할 때 큰 오류가있었습니다. 나중에 재귀를 위해 일반 배열 위트 스크립트 사용으로 전환했으며 결과가 훨씬 나아졌습니다.
5.2 기존의 단점 및 전망
(1) 궤적 압축을 수행 할 때 DP 알고리즘은 가장 간단한 알고리즘이며 최고는 아닙니다. 결과가 좋은 일부 알고리즘을 사용하여 궤적 압축을 다시 수행 할 수 있습니다.
(2)이 실험의 데이터 레코드는 3,150이며 데이터의 양은 크지 않습니다. 10 억 개의 데이터가 있으면 어떻게해야합니까? 성능이 우수한 하드웨어, 분산, 데이터 전처리, 데이터 세분화 및 데이터웨어 하우스를 고려할 수 있습니다.
위는 궤적 압축을 구현하기위한 Java 프로그래밍을위한 Douglas-Peucker 알고리즘의 상세 코드에 대한이 기사의 전체 내용입니다. 모든 사람에게 도움이되기를 바랍니다. 단점이 있으면 메시지를 남겨 두십시오. 이 사이트를 지원해 주신 친구들에게 감사드립니다!