HDFSディレクトリ内のファイル数
Javaコードで、HDFSのあるディレクトリに接続し、そのディレクトリにあるファイルの数を知り、ファイル名を取得して読み込みたいと思います。すでにファイルを読むことはできるのですが、普通のディレクトリのようにディレクトリ内のファイルを数えてファイル名を取得する方法が分かりませんでした。
そこで、DFSClientを使って、ファイルをInputStreamにオープンしています。
21
3
カウント
指定されたファイルパターンにマッチするパス下のディレクトリ、ファイル、バイトの数を数える。出力されるカラムは以下の通り。 dir_count, file_count, content_size file_name。
** -q の出力カラムは次のとおりです。 quota, remaining_quata, space_quota, remaining_space_quota, dir_count, file_count, content_size, file_name。
例:
**終了コード
成功時0、エラー時-1を返す。
FileSystemを使用して、パス内のファイルを反復処理することができます。以下はサンプルコードです。
コマンドラインでは、以下のように実行します。