TERADATA: テーブルの結合や、文字の連結処理では文字コードが揃ってないと遅くなる

以前、TERADATAではカラム単位に文字コードが指定できるということを書きました。

カラムをLATINで定義できれば、UNICODEの半分のサイズとなるので、

・データのサイズも小さくできる

・そのカラムで結合する際に、結合のスピードも向上する

などいいことが多いのですが、注意点もあります。

テーブル１とテーブル２を結合する際に、テーブル１の結合するカラムをLATIN、テーブル２の結合する項目をUNICODEで定義しないようにしよう。

LATINのカラムとUNICODEのカラムを結合すると、LATIN側のカラムに対してUNICODE変換する処理が走るので注意。

create tableが肝なので、DBAの腕の見せ所かもしれないですね。

カラム１とカラム２を連結する際に、カラム１はLATIN、カラム２はUNICODEなどにならないようにしよう。

select col1 || col2 from sample

これもLATIN側のカラムに対してUNICODE変換する処理が走る。

このようなSQLでは、col1とcol2の文字コードは同じになることをチェックしよう。

コード(LATIN)と名称（UNICODE）を連結するなどはよくやるので注意。UNICODEと文字列連結するのが見えてるなら、あえてカラムをLATINではなく、UNICODEで定義するのも手です。

select col1 || ':' || col2 from sample

このようなSQLでcol1とcol2がLATINで「:」も半角だとしてもcol1とcol2にUNICODEの変換が走ります。（V12のバージョンで経験しました）

select col1 || TRANSLATE(':' USING UNICODE_TO_LATIN) || col2 from sample

と固定値をLATINにしておくことで解消します。

数十億件のテーブルなどを扱う際には文字コードに気をつける必要があります。

プログラマ３８の日記