Web::Scraper 使用例

Nid: 26

Posted on: 4 June 2014
By: nayeli

Web::Scraper

scraperコマンド、矢印キーで履歴検索可に。

$ sudo apt-get install libterm-readline-gnu-perl

タイトルとリンクを取得する例

my $scraper = scraper {
  process '//td/small/a',
    'result[]' => { 'title' => 'TEXT', 'link' => '@href' };
};

入れ子にして使用。正規表現による抽出、後処理。

process '//td', 'pictex[]'=> scraper {
  process '//img[@src=~/ocean/][@alt=~/^[jJ]apan/]', 'images[]'=>'@src';
  process '//a', 'links[]' => ['@href', sub {s/#.*?$//g}];
};

テキストを正規表現で検索

my $scraper = scraper {
  process '//*[@id="mw-content-text"]/table[2]/tr/td/table/tr','list[]' => scraper {
    process q{//td[5]/div[text() =~ /[都道府県]/]}, 'prefecture[]' => 'TEXT';
  };
};

Link:

http://search.cpan.org/~miyagawa/Web-Scraper-0.37/lib/Web/Scraper.pm

scraperを使用して、タイトルとURLを抽出してCSV出力する汎用perlスクリプト
perlでWikipediaの内閣総理大臣の一覧をスクレイピングする方法
空白行削除
全角英数字を半角に置換
HTMLテーブルをスクレイプしてCSVに出力する汎用rubyスクリプト
コマンドラインからスクレイピングする方法
PerlでCSV形式データ作成・出力
PerlでJSON形式データ作成・出力
perl one liner で住所文字列から都道府県、市区町村抽出
コマンドラインでHTMLタグを削除
CSVを名寄せして一行にまとめるperlスクリプト / perl script to aggregate csv records

IT notes

Web::Scraper 使用例

関連記事

You are here

Web::Scraper 使用例

関連記事