trdsql PostgreSQLエンジンの使用

Posted on:

trdsqlは組込みのSQLite3を利用してSQLを実行していますが、データベースの処理を別のデータベースに変更出来ます。

ここではPostgreSQLを使用する方法を説明します。

PostgreSQLに接続

SQLite3と違いPostgreSQLは動作しているPostgreSQLサーバーが必要です。接続できテーブルが作成できる権限があるデータベースを作成しておきます。

オプションの -driver に postgres を指定し、-dsn にサーバーへの接続情報を指定します。

dsnの項目には以下が指定できます。デフォルトの場合は省略可能です。

項目名説明
dbnameデータベース名(デフォルト:ログインユーザー名)
userユーザー名(デフォルト:ログインユーザー名)
passwordパスワード(デフォルト:なし)
hostホスト名又はIPアドレス(デフォルト:localhost)
portポート番号(デフォルト: 5432)
sslmodeSSLモード(デフォルト: require)
fallback_application_name(提供されない場合の)アプリケーション名(デフォルト:なし)
connect_timeout接続の最大待機時間
sslcert証明書ファイルの場所
sslkey秘密鍵ファイルの場所
sslrootcertルート証明書ファイルの場所

項目=値をスペース区切りで指定します。

DSN指定

例えば、ローカルホストのportが5433でデータベース名がtrdsql_testに接続するには以下のようにします。

trdsql -driver postgres -dsn "host=localhost port=5433 dbname=trdsql_test" "SELECT 1"

UNIXドメインソケット

UNIXドメインソケットへ接続もできます。

パッケージ等でPostgreSQLをインストールすると以下のような場所にUNIXドメインソケットファイルが作成されています。

/var/run/postgresql/.s.PGSQL.5432

上記の場合、hostに/var/run/postgresql/を指定します。「/」から始まるとUnixドメインソケットとみなされます。portは.s.PGSQL.の後にある「5432」を指定します。

trdsql -driver postgres -dsn "host=/var/run/postgresql/ port=5432 dbname=trdsql_test" "SELECT VERSION()"
"PostgreSQL 10.10 (Ubuntu 10.10-0ubuntu0.18.04.1) on x86_64-pc-linux-gnu, compiled by gcc (Ubuntu 7.4.0-1ubuntu1~18.04.1) 7.4.0, 64-bit"

ソースからインストールした場合のデフォルトは、/tmp/にUnixドメインソケットが作成されています。

/tmp/.s.PGSQL.5120

というファイルがあれば、以下のようにして接続します。

trdsql -driver postgres -dsn "host=/tmp/ port=5120 dbname=postgres" "SELECT VERSION()"
"PostgreSQL 12.0 on x86_64-pc-linux-gnu, compiled by gcc (Ubuntu 7.4.0-1ubuntu1~18.04.1) 7.4.0, 64-bit"

他のドライバとの違い

接続できれば、これまでと同じようにSQLが実行できますが、実際に実行されるのはPostgreSQL上なので、PostgreSQLが実行できるSQLを書く必要があります。

まず注意が必要なのが、列名のエスケープに使用していた「`」文字が「"」になります。

PostgreSQLドライバを指定して、-aオプションによる解析をおこなうとSQLの例も変更されています。

trdsql -driver postgres -dsn "host=localhost dbname=trdsql_test" -ih  -a sample.csv
The table name is sample.csv.
The file type is CSV.

Data types:
+-------------+------+
| column name | type |
+-------------+------+
| \"name\"    | text |
| price       | text |
+-------------+------+

Data samples:
+----------+-------+
| \"name\" | price |
+----------+-------+
| apple    |   100 |
+----------+-------+

Examples:
trdsql -driver postgres -dsn "host=localhost dbname=trdsql_test" -ih "SELECT \"name\", price FROM sample.csv"
trdsql -driver postgres -dsn "host=localhost dbname=trdsql_test" -ih "SELECT \"name\", price FROM sample.csv WHERE \"name\" = 'apple'"
trdsql -driver postgres -dsn "host=localhost dbname=trdsql_test" -ih "SELECT \"name\", count(\"name\") FROM sample.csv GROUP BY \"name\""
trdsql -driver postgres -dsn "host=localhost dbname=trdsql_test" -ih "SELECT \"name\", price FROM sample.csv ORDER BY \"name\" LIMIT 10"

また、PostgreSQLでは暗黙のCASTの範囲が狭いので、明示的にCASTをする必要があります。 (その代わり、PostgreSQLでは ::型名というCASTの文法が使えます)。

日頃PostgreSQLを使っている方は、慣れた文法で書くことができますが、PostgreSQLに接続して使用するメリットはこれだけではありません。

実テーブルの出力

trdsqlは対象のファイルが無くてもSQLの実行するようになっているため、実際のテーブルに対してSQLの実行が出来ます。そして、出力フォーマットの指定はそのまま有効なため、豊富なフォーマットに出力できるデータベースクライアントとして使用できます。

例えば実際のテーブルをMarkDownで出力することも簡単にできます。

trdsql -driver postgres -dsn "host=localhost dbname=noborus" -omd -ih "SELECT * FROM city LIMIT 10"
| city_id |        city        | country_id |     last_update      |
|---------|--------------------|------------|----------------------|
|       1 | A Corua (La Corua) |         87 | 2006-02-15T09:45:25Z |
|       2 | Abha               |         82 | 2006-02-15T09:45:25Z |
|       3 | Abu Dhabi          |        101 | 2006-02-15T09:45:25Z |
|       4 | Acua               |         60 | 2006-02-15T09:45:25Z |
|       5 | Adana              |         97 | 2006-02-15T09:45:25Z |
|       6 | Addis Abeba        |         31 | 2006-02-15T09:45:25Z |
|       7 | Aden               |        107 | 2006-02-15T09:45:25Z |
|       8 | Adoni              |         44 | 2006-02-15T09:45:25Z |
|       9 | Ahmadnagar         |         44 | 2006-02-15T09:45:25Z |
|      10 | Akishima           |         50 | 2006-02-15T09:45:25Z |

動作的には、同名のファイルがあれば、そのファイルをインポートして(元のテーブルは削除されたりはしません)実行し、無ければそのまま実行することで元のテーブルに対してSQLが実行されます。