コードを舐める日々

わからないことがわからないことをしる日々

Ruby で nokogiri を使ってみた

気分転換に Ruby のモジュールの nokogiri ってどういう風に書くのか試してみた。
nokogiri は PerlWeb::Scraper で、HTML や XML 等のファイルを読み込ませて好きな場所(タグ)からデータを抽出するもの。
このダイアリーのはてなキーワードになっている

<a class="keyword" hear="vim">vim</a>

の部分で、aタグ内のデータを抽出するコード書いてみた。

ソース

require 'open-uri'
require 'nokogiri'
require 'kconv'

doc = Nokogiri::HTML(open('http://d.hatena.ne.jp/makotoworld'))

doc.css('a.keyword').each do |link|
  puts link.content.tosjis
end

結果

vi
エディタ
プログラム
シンタックス
emacs
vim
vim
IRC
Twitter
Mono
Mac OS X
解凍
インストール
Windows
解凍
解凍
mono
TwitterIrcGateway
mono
TwitterIrcGateway
文字化け
mono
TwitterIrcGateway
UTF-8
Irc
Lime
localhost
Twitter
パスワード
Twitter
Login
Twitter
Twitter

簡潔に書けるね。Ruby も面白そう。