【影響調査】プログラムの改修や仕様変更に伴う影響調査などで、威力を発揮するコマンド

2009 年 2 月 25 日ykarinoegrep,find,xargs,コマンド,影響調査

はじめまして、インフラチームのykarinoと申します。
1月に入社してから間もないので、フリーエンジニアとして客先常駐していたころに
使用していた小技を紹介しようと思います。

プログラムの改修や仕様変更に伴う影響調査などで、調査対象ファイルが1万個など
極端に多い時に威力を発揮するコマンドです。

実用的な例として、設定ファイルの内容やプログラムの固定値などを書き換える際に、
該当ファイルを探すときなどに使えます。

#1)「パターンに一致した行のファイル内での行番号」とその「ファイル名」をテキストファイルに出力する。
$ find 【検索開始ディレクトリ】 -name '*' -type f -print | env LC_ALL=C xargs egrep -in '【検索条件】' > ./list.txt

#2)「パターンに一致した行を含むファイル名だけ」をテキストファイルに出力する。
$ find 【検索開始ディレクトリ】 -name '*' -type f -print | env LC_ALL=C xargs egrep -il '【検索条件】' > ./list.txt

※xargsにファイル名に日本語が含まれるものを入力するとエラーが発生するため、
「env LC_ALL=C」を指定してファイル名に日本語を含まれるデータを無視しています。

※#1)のegrepを実行した際に、Solarisなどの一部の環境上だと、egrepの表示される内容の末尾に
改行(LF)がないと前後の内容が一つの行になってしまいます。

↓クリックすると拡大して表示されます。

Solarisなどの一部の環境上で行う場合は少し面倒ですが、
以下のダミーファイルを仕込む方法で回避することができます。

#ファイル名のリストを作成する。
$ find 【検索開始ディレクトリ】 -name '*' -type f -print > ./list.dummy.1.txt

#ダミーファイル作成
$ echo '' > ./test.txt $ echo './test.txt' >> ./test.txt $ echo '' >> ./test.txt

#リストファイルにダミーファイルの保存場所を仕込む。
$ cat ./list.dummy.1.txt | perl -e 'while(<>){print $_;print"./test.txt\n";}' > ./list.dummy.2.txt
#「パターンに一致した行のファイル内での行番号」とその「ファイル名」をテキストファイルに出力する。
$ cat list.dummy.2.txt | env LC_ALL=C xargs egrep -in '【検索条件】|test\.txt' > ./list.dummy.3.txt
#ダミー部分を削除する。
$ cat ./list.dummy.3.txt | perl -pe 's/^\.\/test\.txt\:2\:\.\/test\.txt$//g;s/^\n$//g;' > ./list.txt
#ダミーファイルを削除する。
$ rm -i ./test.txt
#不要なファイルを削除する。
$ rm -i ./list.dummy.1.txt $ rm -i ./list.dummy.2.txt $ rm -i ./list.dummy.3.txt

最近、個人的にプログラム/サーバ/ネットワーク/DBなどの技術以外にも、
経営やビジネス、経理、心理学など、興味があるものが年々増えてきています。
ある意味、自分は本当の意味でのジェネラリスト志向かもしれません。

余談ですが、正規表現を見れば見るほど顔文字に見えてしまうのは、気のせいでしょうか。

2009 年 2 月 25 日ykarinoegrep,find,xargs,コマンド,影響調査

Posted by ykarino

Python 2.6 multiprocessing package を触ってみた。 [GIL回避]

新企画はじめました。

ディスカッション

コメント一覧

まだ、コメントがありません

コメントをどうぞ

この記事のトラックバックURL

記事一覧

2024 年 5 月 7 日 : yonezawa

社内版ChatGPT クローン「GiFT」を開発しました

はじめまして。プロダクトエンジニアリング部の yonezawa です。今回は私 ...

2023 年 12 月 27 日 : uzuki

トライコーンのエンジニア部門で実施している勉強会「思考力向上会」について

こんにちは、uzuki です。早速ですが、当社にはエンジニアを抱えている部署と ...

2023 年 6 月 26 日 : aishima

7日間かけてStable Diffusion WebUIによる人物画像生成の学習に取り組んでみた

データマーケティングGに所属しているaishimaです。普段は Tableau、 ...

2023 年 3 月 28 日 : y.kimura

Swaggerを使ってAPIドキュメントとモックを自動更新する

はじめにプロダクトエンジニアリング部の木村です。今回はOpenAPI 3.0 ...

2022 年 12 月 23 日 : katsura

ChatGPTを業務活用できるか検証してみた

お久しぶりです、katsuraです。 2022年はStableDiffusion ...

2022 年 9 月 6 日 : morikawa

BIMI 対応したメール配信を実際にやってみたのでやったこと全部詳しく書いてみる

プロダクトエンジニアリング部の morikawa です。今回はトライコーンで行 ...

2022 年 5 月 25 日 : uzuki

Go言語で変更に強くテスタブルな設計を行う際の具体例について

こんにちは、uzuki です。クリーンアーキテクチャをベースにドメイン駆動設計 ...

2022 年 3 月 1 日 : aishima

S3のデータをRedshiftに自動連携（Glue＋クエリスケジュール）

事業開発Gに所属しているaishimaです。普段は、Tableau・Treasu ...

2021 年 12 月 23 日 : katsura

Zoom飲みの振り分けツールを作成した話

こんにちは、プロダクトエンジニアリング部の katsura です。みなさん、Zo ...

2021 年 9 月 30 日 : morikawa

Snort の検知ログを GCP BigQuery へ送ってみた

プロダクトエンジニアリング部の morikawa です。Zabbix や Ans ...

2021 年 7 月 13 日 : uzuki

Amazon WorkSpaces に移行してみた

こんにちは、uzuki です。トライコーンで在宅勤務制度が導入され、早1年以上が ...

2021 年 4 月 26 日 : aishima

副業を始めて半年ほどたったので体験したことをまとめた

目次副業をやる目的案件探し副業申請半年ぐらい働いてみてまとめはじめまして、事業 ...

2021 年 2 月 26 日 : katsura

Pythonの構文解析ライブラリLarkを使って遊んでみました

概要こんにちは、トライコーンでシステムの開発・運用を行っている katsura ...

2020 年 12 月 24 日 : t.tanaka

VR体験のススメ

お初にお目にかかります。事業開発部事業開発グループ所属のt.tanakaです。 ...

2020 年 10 月 30 日 : morikawa

RHEL サブスクリプション登録・解除をコマンドラインで行う

プロダクトエンジニアリング部システム第一グループの morikawa です。以 ...

2020 年 8 月 24 日 : ozaki

開発グループの新入社員研修を終えて

開発グループのozakiです。開発グループでは2020年4～5月に新卒2名、中 ...

2020 年 6 月 29 日 : katsura

CentOS8に移行した際に苦労した点

お久しぶりです、開発Grのkatsuraです。CentOS6のサポート期限が今年 ...

2020 年 3 月 13 日 : uzuki

トライコーンでの在宅勤務の取り組みについて

当社従業員による在宅勤務状況にサポートグループカスタマーサポートメンバー ...

2019 年 12 月 26 日 : morikawa

Jupyter+Ansible で実行可能な Notebook 形式のメンテナンス手順書をテンプレートから生成して実行してみた

インフラグループの morikawa です。タイトルが長くてすいません。今回 ...

2019 年 10 月 15 日 : ozaki

キーボード＆マウスの支給制度ができました

こんにちは。先々月以来ですが開発グループのozakiです。今回は新設された社内制 ...