2006/11/11

RubyOSA Safari を試す

いま開いている Safari のロケーションから
body 要素を取り出しソースとテキストを表示してみました。

require 'rbosa'
require 'nkf'
app = OSA.app('Safari')

if app.documents.size > 0
  # Get HTML Source
  source = app.documents[0].source
  # Get Body
  body = source.split('<body>')[1].split('</body>')[0]
  puts '------ html source \n'
  puts NKF.nkf('-w -Lu', body)
  puts '------ text \n'
  # HTML タグの除去 - >かなりな大雑把版。それに Source が UTF8だと決めつけてます。
  print NKF.nkf('-w -Lu', body.gsub(/\<.*?\>|<\/|>|<script.*?\>/m, ''))
else
 # 空白ページが開かれていたら終わる.これ以外のエラーには未対処。
  puts 'no doc'
end


--imported_from
http://www.midore.net/daybook/2006/11/1163227004.html

+++ 追記 +++
2010-02-06

関連する記事
"RubyOSA"ラベルがついた全ての記事

0 件のコメント: