いま開いている Safari のロケーションから
body 要素を取り出しソースとテキストを表示してみました。
require 'rbosa'
require 'nkf'
app = OSA.app('Safari')
if app.documents.size > 0
# Get HTML Source
source = app.documents[0].source
# Get Body
body = source.split('<body>')[1].split('</body>')[0]
puts '------ html source \n'
puts NKF.nkf('-w -Lu', body)
puts '------ text \n'
# HTML タグの除去 - >かなりな大雑把版。それに Source が UTF8だと決めつけてます。
print NKF.nkf('-w -Lu', body.gsub(/\<.*?\>|<\/|>|<script.*?\>/m, ''))
else
# 空白ページが開かれていたら終わる.これ以外のエラーには未対処。
puts 'no doc'
end
--imported_from
http://www.midore.net/daybook/2006/11/1163227004.html
+++ 追記 +++
2010-02-06
関連する記事
"RubyOSA"ラベルがついた全ての記事
0 件のコメント:
コメントを投稿