サイト内の現在位置

PostgreSQL

周辺OSSツール紹介

pg_bulkload 機能概要

pg_bulkload は、大量のデータを高速にロードするための拡張ツールです。
pg_bulkloadでは、PostgreSQL 組み込みのデータロード用コマンドである COPY文と比較して、 インデックスを張ったままの状態のテーブルに対して大量データを高速にロードします。

OS上に pg_bulkoad をインストールすることで、csvファイルやバイナリファイル等の入力データを PostgreSQL 上のテーブル等へロードする pg_bulkoadコマンドが使用できます。
pg_bulkload では、データのロード方法を制御ファイルに指定します。 制御ファイルには入力データソースの情報や、ロード方式等を指定できます。

入力データのタイプ
CSV (デフォルト)    CSV フォーマットのテキストデータを読み込む。
BINARY | FIXED 固定長のバイナリデータを読み込む。
FUNCTION   関数が返した行セットを読み込む。関数呼び出し式も別途指定する必要あり。
データロード方式
DIRECT(デフォルト) バッファを使用せず、テーブルに直接データをロードする。バッファを使用する場合と比較して高速。ただし、ロードが失敗した際、pg_bulkload固有のリカバリ手順("pg_bulkload -r"コマンドの実行)が必要となる。
BUFFERED 共有バッファを使用し、テーブルにデータをロードする。
PARALLEL 複数のプロセスを使用し、テーブルに直接データをロードする。
BINARY   バイナリファイルにデータを出力する。