perlでWikipediaの内閣総理大臣の一覧をスクレイピングする方法

Web::Scraper に付属の scraperコマンドでスクレイピング。

ページ情報取得

$ scraper 'https://ja.wikipedia.org/wiki/%E5%86%85%E9%96%A3%E7%B7%8F%E7%90%86%E5%A4%A7%E8%87%A3%E3%81%AE%E4%B8%80%E8%A6%A7'

スクレイピング Read more about perlでWikipediaの内閣総理大臣の一覧をスクレイピングする方法

コマンドラインでCSVの列順を変更する方法

$ cat population.csv
国,首都,人口(2006),id
"日本国","東京","127767944",1
アメリカ合衆国,ワシントン,300007997,2
$ awk -F, '{ print $4 "," $1 "," $2 "," $3 }' population.csv
id,国,首都,人口(2006)
1,"日本国","東京","127767944"
2,アメリカ合衆国,ワシントン,300007997
 Read more about コマンドラインでCSVの列順を変更する方法

CSVを名寄せして一行にまとめるperlスクリプト / perl script to aggregate csv records

名前をキーに、複数行のCSVデータを一行にまとめます。

入力ファイル

$ cat input.csv
上根来水源の森,水源の森百選
上山公園,全国森林浴の森百選
上山公園,日本の都市公園100選
上山公園,日本の歴史公園100選
城崎温泉,日本百名湯
城山公園,全国森林浴の森百選
城山公園,日本のさくら名所100選
城山公園,日本の都市公園100選
城山公園,日本の夕陽百選
城山公園,日本の歴史公園100選
城山公園,夜景100選
城山展望台,夜景100選

1フィールド目をキーにCSVを名寄せするperlスクリプト Read more about CSVを名寄せして一行にまとめるperlスクリプト / perl script to aggregate csv records

mod_statusを使用してApacheの接続状況をリアルタイムに確認する。

Apacheの接続負荷が高い時などに、リアルタイムに接続状況を確認できます。

環境

$ lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description:    Ubuntu 14.04.4 LTS
Release:        14.04
Codename:       trusty

インストール状況確認

$ sudo a2enmod status

設定ファイル編集 Read more about mod_statusを使用してApacheの接続状況をリアルタイムに確認する。

Pages