TREND2D

名前
書式
説明
オプション
注意
アスキー形式の精度

関連項目
文献

名前

trend2d − [重み付きの][頑健な]多項式モデル z = f(x,y) を xyz[w] データ に当てはめる

書式

trend2d −Fxyzmrw −Nn_model[r] [ xyz[w]file ] [ −Ccondition_number ] [ −H[i][nrec] ][ −I[confidence_level] ] [ −V ] [ −W ] [ −:[i|o] ] [ −b[i|o][s|S|d|D][ncol] ] [ −f[i|o]colinfo ]

説明

trend2d は x,y,z [及び w ]の値を標準入力[又は xyz[w]file ]の最 初 の 3 [4] 列から読み込み、 [重み付き]最小自乗法により回帰モデル z = f(x,y) + e に当てはめる。当てはめはデータの重み付けを繰り返すことによる頑健な 方 法で行うこともできる。ユーザは z の分散を減らすのに重要な f(x,y) の項の 数を調べることもできる。 n_model は次の形式のモデルに当てはめる際の [1, 10] の範囲の数である( grdtrend と同じ)。

m1 + m2*x + m3*y + m4*x*y + m5*x*x + m6*y*y + m7*x*x*x + m8*x*x*y + m9*x*y*y + m10*y*y*y

ユーザは用いるモデルパラメータの数を −Nn_model で指定しなければならない 。 すなわち、−N4 は 1 次元トレンド、−N6 は 2 次曲面、などと当てはめる。 随意で、頑健な当てはめを実行するには r を付けること。この場合、このプロ グ ラムは外れ値に影響されにくい解に収束させるために頑健スケール推定に基 づいてデータへの重み付けを繰り返す。これは広い曲面上の局所的な山のよ う な 、平均がゼロにならない「残差」から「広域的な」場を分離するときに便利 かもしれない。

−F

任意の順序で文字をセット {x y z m r w} から最大 6 つまで 指 定 し、アスキー[又はバイナリ]出力の列を作る。 x = x, y = y, z = z, m = モデル f(x,y), r = 残差 y - m, w = 当てはめに用いる重 み 。

−N

モデルの項の数 n_model を指定する。頑健な当てはめを行うには r を付けること。例、頑健な 1 次元モデルは −N4r である。

オプション

xyz[w]file

x,y,z [w] の値を最初の 3 [4] 列に含むアスキー[又はバイナリ、 −b 参 照]ファイル。ファイルを指定しないときは、 trend2d は標準入力 から読み込む。

−C

行列の解に対する最大許容状態数を設定する。 trend2d はダンプ 付 き最小自乗モデルへの当てはめを行い、最大固有値の最小固有値に 対する比が condition_# である固有スペクトルの部分のみ保持する [ デフォルト: condition_# = 1.0e06 ]。

−H

入 力 フ ァ イルにヘッダ行がある時に使う。ヘッダ行の数は .gmtdefaults4 ファイルを編集することにより変更できる。このオ プ シ ョンが使われた場合、 GMT のデフォルトではヘッダ行は 1 行であ る。入力データだけにヘッダ行が必要な場合は −Hi を使うこと [デフ ォルトでは入力データにヘッダ行があればそれも出力される]。

−I

モデルパラメータの数を 1 から始めて、 n_model に達するか、 モデルの分散の減少が confidence_level のレベルにおいて重要で な く なるまで繰り返し増加させる。数字を付けずに −I だけ設定するこ ともできる。この場合は当てはめはデフォルトの信頼レベル 0.51 で 繰 り返される。あるいは独自のレベルを 0 と 1 の間で設定すること もできる。注意のセクションを参照。

−V

冗長モードを選択する。標準エラー出力に経過報告を送る[デフォ ルトでは「黙って」実行する]。

−W

重みを入力の 4 列目に与える。重み付き最小自乗当てはめを行う [又は繰り返し頑健な当てはめを行うときにこの重みから始める] [ デ フォルトでは最初の 3 列しか読み込まない]。

−:

入出力の(経度、緯度)と(緯度、経度)を入れ替える [デフォルト は(経度、緯度)]。 i を付けると入力のみが、 o を付けると出力のみ が入れ替わる [デフォルトでは両方入れ替わる]。

−bi

バイナリ入力を選択する。単精度に対しては s を付けること [ デフォルトは d (倍精度)]。大文字の S (又は D) にするとバイト ス ワ ップを行う。随意で、バイナリファイルの列数がこのプログラムで 必要な列数を越えるときは、バイナリファイルの列数 ncol を付け る こと [デフォルトは 3 (又は −W が設定されているときは 4 )入力列] 。

−bo

バイナリ出力を選択する。単精度に対しては s を付けること [ デ フォルトは d (倍精度)]。大文字の S (又は D) にするとバイトス ワップを行う。随意で、バイナリ出力ファイルの必要な列数 ncol を 付けること [デフォルトは −F で設定された 1-6 列]。

−f

入 出 力列の特殊フォーマットを使う(時間又は地理データ)。 i(nput) 又は o(utput) を指定すること [デフォルトでは入力と出 力 の 両方]。コンマ区切りで 1 列以上(又は列の範囲)を与えること。各 列又は列の範囲の項目に対して T (絶対暦時刻)、 t (選 択 さ れ た TIME_EPOCH に対する相対時間)、 x (経度)、 y (緯度)、 f (小数) のいずれかを付けること。 −f[i|o]g−f[i|o]0x,1y (地理座標) の 省略形である。

注意

x と y の領域は [-1, 1] にシフト及びスケールされ、基底関数はチェビシェ フ多項式から作られる。これらには逆問題を解かなければならないから行列 の 形 であるという点において数値的な利点があり、また正確な解答を可能にして いる。 trend2d の多くの応用において、ユーザは(道路や航跡に沿って集め ら れたデータのような)おおよそ x,y 平面上の x 軸とある角度をなす直線に沿っ て位置するデータを使う。この場合 x,y 軸を回転することで精度が改善される ことがある。 trend2d はこのような回転は調べない。その代わり、行列問題で 不足するランクを見つけることがある。しかし、解は一般逆行列を用いて計 算 されており、それでもうまくいくはずである。ユーザは trend2d がランク不足 を示したら結果を図で確認しするべきである。注: −V で表示されるモデルパラ メータはチェビシェフ多項式の係数である。これらは上に書かれた式の m#s と は数値的に等しくない。上の説明はユーザに −N を多項式の曲面の次元に合 わ せ ることを可能にするためのものである。チェビシェフ多項式の値を求めるに は grdmath を参照すること。

−Nn_modelr (頑健)及び −I (繰り返し)オプションでは F 検定によりモデル 誤 差 のカイ自乗の改善の重要度を評価する。デフォルトの信頼限界は 0.51 に設 定されている。これは −I オプションで変更することができる。ユーザは大 部 分 の場合にモデルの項の数の増加による分散の減少が非常に高い信頼度におい ては重要でないことに驚くかもしれない。例えば、自由度 120 で 95 % 信頼レ ベ ルにおいて重要であるためにはカイ自乗は 26 % 以上減少しなければならな い。カイ自乗が減少する限り繰り返しを継続したいとき は confidence_level をゼロに設定すること。

頑 健な方法がうまくいくためには(デフォルト値 0.51 のように)信頼限界を低 くすることが必要である。この方法では外れ値の影響を減らすためにデータ に 繰 り返し重みをかけていく。この重みは中央値絶対偏差と Huber [1964] の公 式に基づいており、モデルの残差が外れ値の影響を受けない標準的分布を持 つ と きには 95 % 有効である。これは外れ値の影響が各繰り返しにおいてわずか しか減少しないことを意味する。その結果、カイ自乗の減少はあまり重要で な い 。うまくこの影響を減少させるためにこの手順に少しの繰り返ししか必要で ないなら、 F 検定の重要度レベルは低くしておかなければならない。

アスキー形式の精度

数値データのアスキー出力形式は .gmtdefaults4 ファイルのパラメータによっ て 決まる。緯度経度は OUTPUT_DEGREE_FORMAT に従ってフォーマットされ、一 方、他の値は D_FORMAT に従ってフォーマットされる。フォーマットの結果 と し て出力の精度が落ちて、その先の処理に影響する可能性があることに注意す ること。十分な精度で出力されていないと思ったら、バイナリ出力に変更する( も し使えるなら −bo とする)か、 D_FORMAT の設定を用いてより多くの桁数を 指定すること。

data.xyz から通常の最小自乗法で平面トレンドを除去する。

trend2d data.xyz −Fxyr −N2 > detrended_data.xyz

上の平面トレンドを外れ値に関して頑健にする。

trend2d data.xzy −Fxyr −N2r > detrended_data.xyz

頑健な内挿において( 10 までで)いくつの項が data.xyz への当てはめに重 要 か調べる。

trend2d data.xyz −N10r −I −V

関連項目

GMT(l), grdmath(l), grdtrend(l), trend1d(l)

文献

Huber, P. J., 1964, Robust estimation of a location parameter, Ann. Math. Stat., 35, 73-101.

Menke, W., 1989, Geophysical Data Analysis: Discrete Inverse Theory, Revised Edition, Academic Press, San Diego.