コマンドラインでHTMLをCSV変換する方法

dtとddタグで作成された表形式のデータを、コマンドラインツールでCSV変換します。
$ curl -s http://doramahjong.com/tournament/ | hxnormalize -x | hxselect -s '\n' -c "table.catagoryTable" "dl" | lynx -stdin --dump  | sed -e 's/^\s\+//' | awk 'BEGIN { FS="\n"; RS="" } { print $1 "," $2 "," $3 }'
風花雪月杯,2016年11月22日 18:00:00,107

MediaWiki APIを使用して、キーワードからWikipedia概要をテキスト形式で取得する方法

$ curl -s "https://ja.wikipedia.org/w/api.php?format=json&action=query&prop=extracts&exintro=&explaintext=&titles=ルクセンブルク" | jq -r '.query.pages[].extract'
ルクセンブルク大公国
Grand-Duché de Luxembourg(フランス語)Großherzogtum Luxemburg(ドイツ語)Groussherzogtum Lëtzebuerg(ルクセンブルク語)

crontab 設定例

毎年3月7日 05:55

55 05 7 3 *

毎週日曜日 18:00

00 18 * * 7

毎15分

*/15 * * * *

毎2時間

00 */2 * * *

毎日6:20と18:20

20 06,18 * * *

毎日土日16:30

30 16 * * 6,7

毎月8日の1:05 3:05 4:05 5:05

Tags: 

ページ