Data Quality 機能はOSDQ Projectから提供されます。関数の前にはosdq.
が付きますが、接頭辞なしで呼び出すこともできます。
osdq.random
この関数はランダム化された文字列を返します。例えば、sourceValue
、eusolercaVu
。
random(sourceValue)
sourceValue
はランダム化が必要な文字列です。
osdq.digit
この関数は、文字列の桁数を返します。例えば、a1 b2 c3 d4
は1234
になります。
digit(sourceValue)
sourceValue
は数字を抽出する文字列です。
osdq.whitespaceIndex
例えば、source Value
は6
を返します。
whitespaceIndex(sourceValue)
sourceValue
は、空白インデックスを見つける必要がある文字列です。
osdq.validCreditCard
この関数は、文字列がクレジットカード番号ロジックとチェックサムに一致し、有効なクレジットカード番号である場合にTRUE
を返します。
validCreditCard(cc)
cc
はチェックが必要なクレジットカード番号の文字列です。
osdq.validSSN
この関数は、文字列がSSN 番号ロジックに一致し、有効なSSN 番号である場合、TRUE
を返します。
validSSN(ssn)
ssn
はチェックが必要なSTRING 番号の文字列です。
osdq.validPhone
この関数は、文字列が電話ロジックに一致する場合、true
を返します:8文字以上、12文字未満、000で始まることはできません。
validPhone(phone)
phone
はチェックが必要な電話番号の文字列です。
osdq.validEmail
この関数は、文字列が有効なメールアドレスであればtrue
を返します。
validEmail(email)
email
はチェックが必要なEメールアドレスの文字列です。
osdq.cosineDistance
この関数は、余弦類似度アルゴリズムに基づく 2 つの文字列間の浮動小数点距離を返します。
cosineDistance(a, b)
a
とb
は、距離を計算すべき文字列です。
osdq.jaccardDistance
この関数は、Jaccard 類似度アルゴリズムに基づき2つの文字列間の距離をfloat で返します。
jaccardDistance(a, b)
a
とb
は、距離を計算すべき文字列です。
osdq.jaroWinklerDistance
この関数は、Jaro-Winkler アルゴリズムに基づき2 つの文字列間の浮動小数点距離を返します。
jaroWinklerDistance(a, b)
a
とb
は、距離を計算すべき文字列です。
osdq.levenshteinDistance
この関数は、Levenshtein アルゴリズムに基づき2 つの文字列間の浮動小数点距離を返します。
levenshteinDistance(a, b)
a
とb
は、距離を計算すべき文字列です。
Data Quality functions available since v4.4