全角英数字を半角に置換
perl oneliner
$ echo "2014年10月11日14時57分 I am feeling honored that" | perl -C -Mutf8 -pe 'tr/0-9a-zA-Z/0-9a-zA-Z/' 2014年10月11日14時57分 I am feeling honored that
perl oneliner
$ echo "2014年10月11日14時57分 I am feeling honored that" | perl -C -Mutf8 -pe 'tr/0-9a-zA-Z/0-9a-zA-Z/' 2014年10月11日14時57分 I am feeling honored that
改行のみの空行と、空白文字列と改行のみで構成される空白行をまとめて削除する方法です。
$ curl http://lynx.browser.org/ | perl -C -Mutf8 -pe 's/<.+?>//g'
$ curl http://lynx.browser.org/ | sed -e 's/<[^>]*>//g'
Read more about コマンドラインでHTMLタグを削除
建物名などに「都道府県区市町村」の文字が含まれる可能性もあるので、minimal match .*? を使用 Read more about perl one liner で住所文字列から都道府県、市区町村抽出