全角英数字を半角に置換
perl oneliner
$ echo "2014年10月11日14時57分 I am feeling honored that" | perl -C -Mutf8 -pe 'tr/0-9a-zA-Z/0-9a-zA-Z/' 2014年10月11日14時57分 I am feeling honored that
perl oneliner
$ echo "2014年10月11日14時57分 I am feeling honored that" | perl -C -Mutf8 -pe 'tr/0-9a-zA-Z/0-9a-zA-Z/' 2014年10月11日14時57分 I am feeling honored that
$ curl http://lynx.browser.org/ | perl -C -Mutf8 -pe 's/<.+?>//g'
$ curl http://lynx.browser.org/ | sed -e 's/<[^>]*>//g'
Read more about コマンドラインでHTMLタグを削除
建物名などに「都道府県区市町村」の文字が含まれる可能性もあるので、minimal match .*? を使用 Read more about perl one liner で住所文字列から都道府県、市区町村抽出