INSERT INTO SELECT ステートメント
Apache HBase への1回の要求で複数の挿入処理を実行するには、INSERT INTO SELECT 構文を使用して、データの一時テーブルをApache HBase に挿入します。このとき、Apache HBase に送信されるデータは、まず一時テーブルに入力されます。挿入するデータがすべて一時テーブルに入力されたら、そのテーブルがApache HBase のテーブルに渡されます。
一時テーブルへの入力
入力先の一時テーブルは動的なテーブルで、実行時に最初のデータをテーブルに入力するときに作成されます。一時テーブルは、その名前に「#」を付加して示されます。一時テーブルを使用してデータを挿入する場合、その一時テーブルには「[TableName]#TEMP」という形式で名前を付ける必要があります。「TableName」は、データを挿入するテーブルの名前です。
次に例を示します。
INSERT INTO Account#TEMP (Name, MyCustomField__c) VALUES ('New Account', '9000'); INSERT INTO Account#TEMP (Name, MyCustomField__c) VALUES ('New Account 2', '9001'); INSERT INTO Account#TEMP (Name, MyCustomField__c) VALUES ('New Account 3', '9002');
このコードでは、2つのデータカラムと3つのデータ行を含む「Account#TEMP」という名前の一時テーブルが作成されます。一時テーブルでは型を指定できないため、すべての値が文字列としてメモリに保存されます。これらの値の型は、Account テーブルに送信された後で正しい型に変換されます。
実際のテーブルへの挿入
一時テーブルにデータが入力されたら、Apache HBase の実際のテーブルに対して挿入を実行します。そのためには、実際のテーブルへの挿入(INSERT)を実行し、一時テーブルから入力データを選択します。次に例を示します。
INSERT INTO Account (Name, MyCustomField__c) SELECT Name, MyCustomField__c FROM Account#TEMPこの例では、Account#TEMP テーブルのすべての内容がAccount テーブルに渡されます。この結果、各要求で複数のINSERT を送信できるため、Apache HBase に送信される要求の数が少なくて済み、多くのレコードを挿入する場合のパフォーマンスが向上します。
結果
クエリの結果は、一時テーブルLastResultInfo#TEMP に保存されます。次に一時テーブルが渡されてデータが変更されると、このテーブルはクリアされて、データが再挿入されます。LastResultInfo#TEMP テーブルはスキーマが事前定義されていないことに注意してください。データを読み取る前に、実行時にそのメタデータを確認する必要があります。
一時テーブルの存続時間
一時テーブルは、接続が開いている間だけ存続します。Apache HBase への接続が閉じられると、LastResultInfo#TEMP テーブルを含むすべての一時テーブルがクリアされます。