1
data lake
からフォルダ名を抽出して、それをcsv
ファイルに列として出力しようとしています。 USQL
からフォルダ名全体またはフォルダ名の一部を抽出する方法はありますか?たとえば、/input/Testing
- Testing
が必要です。USQL、出力にフォルダ名を抽出する
私はあなたがファイル名を抽出し、このような仮想列にそれを置くことができます知っている:
// Filesets, file set with virtual column
@q =
EXTRACT rowId int,
filename string,
extension string
FROM "/input/filesets example/{filename}.{extension}"
USING Extractors.Tsv();
@output =
SELECT filename,
extension,
COUNT(*) AS records
FROM @q
GROUP BY filename,
extension;
OUTPUT @output TO "/output/output.csv"
USING Outputters.Csv();
を持っていますあなたが望むフォルダだけを確実に取得するために、仮想カラムの述語。例えば、 'WHERE folder ==" yourFolder ";' – wBob
上記のコードを実行しようとすると、Virtual Column 'folder'はEXTRACT文で定義されていません。 – FutureTony
上記のコードを実行しようとすると、抽出文にフォルダ文字列が追加され、結果が空の入力に戻ってきました。 – FutureTony