プログラマ38の日記

主にプログラムメモです。

DWH: BI/DWHのプロジェクトの作業で思うこと

私の経験として、BI/DWHのプロジェクトは他の業務パッケージのプロジェクトに比べて難しくて失敗しやすいなーと考えています。

 

明確に、なぜ失敗しやすいのかといった分析結果があるのかもしれませんが、個人的に思うことをつらつらと書いていこうと思います。

 

1.データの種類と、データ量の多さ、そして複雑さ

まずこれですよね、何するにしてもデータ量が多くて、軽く環境つくって試してみることができない。

あと、同じようなマスタが乱立していたり、同じ項目名なのに意味が違ったり、本当に混乱してきます。

 

2.BIツールの良さに反する定型帳票

BIツールは、使う人によって見る切り口が違ったり、その時々で見たい粒度が違ったりする場合に、さくっと自分のみたい項目を選んでデータを見る機能があります。

仮説の裏づけをしてみてもいいし、数値だけから客観的に物事をとらえてもいい、そんな便利なツールだと思っています。(使う人の操作は項目選んで表示するだけですが、データを見ることはとても重要です)

 

でも、既存にある複雑な定型帳票を作るには向いていなかったりします。今ある定型帳票を廃止するのはとても難しく、無理やりBIツールで定型を出力できるように、専用のデータマートを用意する必要がでてきて、スケジュールは逼迫、設計書も陳腐化していきます。

 

3.作り終わった後の性能問題

開発フェーズが終わり、本番相当のデータで動かすと発覚する性能の問題。

数万件のデータがの単体テスト環境では問題なく動作してるけど、数億件のデータが入った環境では動かなくてプロジェクトは混乱を極めます。

 

[所感]

みんな一生懸命作業してるのに、やっぱり大変な状況になるんですよねー。

ほんとつらい、とりあえず統計情報をとったり、SQLの見直しをしたりなど対応してみますが、先の見えない作業はいやなものです。

油断していると、日次のバッチ処理時間が24時間を越え始めたり

 

うまく行ったときは大変なだけにとても充実感があります。それだけが支えです。。