Rubyの勉強をかねて、前々からやりたかったウェブスクレイピングにチャレンジ。
そこで、TOTO BIGのくじ結果 をこんな感じで取得するスクリプトを作成した。
$ ruby TOTOBIG_KUZIKEKKA.rb 0666
11222220211121
$
以下ソース
$ cat TOTOBIG_KUZIKEKKA.rb
#TOTOBIGの結果を出力させる。
require ‘nokogiri’
require ‘open-uri’
#TOTO BIGの開催回数を4桁で入力する。 例 666回であれば 0666
URL = "http://www.toto-dream.com/dci/I/IPB/IPB02.do?op=lnkHoldCntLotResultLstBIG&holdCntId=" + ARGV[0]
html = Nokogiri::HTML(open(URL))
logo = html.css(‘table[@class = "adjustment"]’).first# logo.name # タグ名
# logo.attributes # 属性情報のハッシュ
# logo.children # 子要素の配列
# logo.content # タグの中身
# logo.keys
# logo.values
doc = logo.content
doc1 = doc.gsub(‘ ‘,”)
doc2 = doc1.gsub("\r\n",”)
puts doc2
$
これが元手、あとは開催回数毎に実行するシェルでも作成すれば、くじ結果一覧のデータができあがる。
Ruby楽しいかも。
コメント