Data Quality 機能はOSDQ Projectから提供されます。関数の前にはosdq.が付きますが、接頭辞なしで呼び出すこともできます。

osdq.random

この関数はランダム化された文字列を返します。例えば、sourceValueeusolercaVu

random(sourceValue)

sourceValueはランダム化が必要な文字列です。

osdq.digit

この関数は、文字列の桁数を返します。例えば、a1 b2 c3 d41234になります。

digit(sourceValue)

sourceValueは数字を抽出する文字列です。

osdq.whitespaceIndex

例えば、source Value6を返します。

whitespaceIndex(sourceValue)

sourceValueは、空白インデックスを見つける必要がある文字列です。

osdq.validCreditCard

この関数は、文字列がクレジットカード番号ロジックとチェックサムに一致し、有効なクレジットカード番号である場合にTRUEを返します。

validCreditCard(cc)

ccはチェックが必要なクレジットカード番号の文字列です。

osdq.validSSN

この関数は、文字列がSSN 番号ロジックに一致し、有効なSSN 番号である場合、TRUEを返します。

validSSN(ssn)

ssnはチェックが必要なSTRING 番号の文字列です。

osdq.validPhone

この関数は、文字列が電話ロジックに一致する場合、true を返します:8文字以上、12文字未満、000で始まることはできません。

validPhone(phone)

phoneはチェックが必要な電話番号の文字列です。

osdq.validEmail

この関数は、文字列が有効なメールアドレスであればtrueを返します。

validEmail(email)

emailはチェックが必要なEメールアドレスの文字列です。

osdq.cosineDistance

この関数は、余弦類似度アルゴリズムに基づく 2 つの文字列間の浮動小数点距離を返します。

cosineDistance(a, b)

ab は、距離を計算すべき文字列です。

osdq.jaccardDistance

この関数は、Jaccard 類似度アルゴリズムに基づき2つの文字列間の距離をfloat で返します。

jaccardDistance(a, b)

ab は、距離を計算すべき文字列です。

osdq.jaroWinklerDistance

この関数は、Jaro-Winkler アルゴリズムに基づき2 つの文字列間の浮動小数点距離を返します。

jaroWinklerDistance(a, b)

ab は、距離を計算すべき文字列です。

osdq.levenshteinDistance

この関数は、Levenshtein アルゴリズムに基づき2 つの文字列間の浮動小数点距離を返します。

levenshteinDistance(a, b)

ab は、距離を計算すべき文字列です。

Data Quality functions available since v4.4