カスタムスキーマ定義
自動スキーマ検出 で作成されたテーブルスキーマを、スキーマファイルに保存することで拡張できます。スキーマファイルはシンプルな形式で、変更は簡単です。
スキーマファイルの生成
GenerateSchemaFiles を"OnStart" に設定すると、接続時にすべてのテーブルのスキーマを保持します。テーブルスキーマを必要に応じて生成することもできます。GenerateSchemaFiles を"OnUse" に設定して、テーブルにSELECT クエリを実行します。
例えば、レストランのデータセットのスキーマを考えてみましょう。これはMongoDB が提供するサンプルデータです。データセットをダウンロードするには、MongoDB ガイドのはじめにの説明に従います。
コレクションからのサンプルドキュメントは以下のとおりです。
{ "address":{ "building":"461", "coord":[ -74.138492, 40.631136 ], "street":"Port Richmond Ave", "zipcode":"10302" }, "borough":"Staten Island", "cuisine":"Other", "name":"Indian Oven", "restaurant_id":"50018994" }
MongoDB のレストランデータセットのインポート
Mongoimport ユーティリティを使ってデータセットをインポートできます。
mongoimport --db test --collection restaurants --drop --file dataset.json
スキーマのカスタマイズ
GenerateSchemaFiles が設定されている場合、connector はLocation プロパティで指定されたフォルダ内にスキーマを格納します。生成されたスキーマでカラムの動作を変更できます。
次のスキーマは、other:bsonpath プロパティを使用して、特定のカラムのデータをコレクションのどこに取得するかを定義します。このモデルを使って、階層構造のアービトラリーレベルをフラット化することができます。
collection 属性は、パースするコレクションを指定します。collection 属性は、同じコレクションに対して複数のスキーマを使う柔軟性を与えます。collection が指定されていない場合は、filename がパースされるコレクションを決定します。
以下は、カラム定義とカラム値を抽出するためのコレクションです。カスタムスキーマ例 では、完全なスキーマを確認できます。
<rsb:script xmlns:rsb="http://www.rssbus.com/ns/rsbscript/2">
<rsb:info title="StaticRestaurants" description="Custom Schema for the MongoDB restaurants data set.">
<!-- Column definitions -->
<attr name="borough" xs:type="string" other:bsonpath="$.borough" />
<attr name="cuisine" xs:type="string" other:bsonpath="$.cuisine" />
<attr name="building" xs:type="string" other:bsonpath="$.address.building" />
<attr name="street" xs:type="string" other:bsonpath="$.address.street" />
<attr name="latitude" xs:type="double" other:bsonpath="$.address.coord.0" />
<attr name="longitude" xs:type="double" other:bsonpath="$.address.coord.1" />
</rsb:info>
<rsb:set attr="collection" value="restaurants"/>
</rsb:script>