« NewsExplorer:はてなニュース等をキー操作でサクサク読むスクリプト(SeaHorse/Greasemonkey) | トップページ | リンクの文字列をリンク先タイトルと入れ替えるスクリプト(SeaHorse/Greasemonkey) »

2008/12/12

NewsExplorer:wedataでデータベース作成・設定追加が可能になりました

NewsExplorer:はてなニュース等をキー操作でサクサク読むスクリプト(SeaHorse/Greasemonkey)
の設定(SITEINFO)をwedata上のデータベースより読み込むようにしてみました。
これで、
アイテム - データベース: NewsExplorer - wedata
にアイテムを追加することで、対応サイトを増やすことが可能となりました。
ただ問題は、データを登録してくれるような物好きな方がおられるかどうかということですが(w。
■アイテムデータ(SITEINFO)の説明
要素名説明必要性備考
url対象となるニュースサイトのURL必須正規表現
catblockカテゴリのブロック(カテゴリの基準となる要素)必須XPath
cattitleカテゴリのタイトル部分必須XPath(catblockが基準)
headline各カテゴリ内の記事見出し必須XPath(catblockが基準)
entryリンク先記事内容(プレビュー表示部)必須XPath
headlink記事見出しのリンク任意XPath(headlineが基準)
省略時はheadline子孫要素最初のリンクを自動選択
catmoreカテゴリをもっと読むリンク任意XPath(catblockが基準)
mheadlineカテゴリのリンク先ページ内の記事見出し任意XPath
mheadlink↑の記事見出しのリンク任意XPath(mheadlineが基準)
省略時はmheadline子孫要素最初のリンクを自動選択
sampleurl対象ニュースサイト例任意URL
……われながら、わかり辛いな(苦笑)。
■アイテムデータ例(ココログニュース:@nifty
要素名データ
url^http:\/\/news\.cocolog-nifty\.com\/$
catblockid("mainContents")/div[@class="module"]
cattitlediv[@class="moduleInner"]/div[@class="detailTxt"]/h2[@class="ttl"]|div[@class="commonTtl"]/div[@class="inner"]/div[@class="pkg"]/h2[text()!=""]
headlinediv[@class="moduleInner"]/div[@class="detailTxt"]/h2[@class="ttl"]|div[contains(@class,"moduleInner")]/div[contains(@class,"list")]/ul/li[@class="contents"]
entryid("detailModule")/div[@class="moduleInner"]/div[@class="detailTxt"]
headlinka[1]
catmorediv[@class="moduleInner"]/div[@class="detailTxt"]/h2[@class="ttl"]/a|div[@class="commonTtl"]/div[@class="inner"]/div[@class="pkg"]/ul/li[@class="more"]/a
mheadlineid("categoryList")/div[@class="moduleInner"]/div[@class="list"]/ul/li[contains(@class,"contents")]
mheadlinka[1]
sampleurlhttp://news.cocolog-nifty.com/
……ん~やっぱり、わかり辛いな(苦笑)。
実際のブラウザ画像で『この部分』と示した方がよいか、やっぱり。今日はもう眠いのでやらないけれど……。 →2008/12/12追加。
各アイテムデータをブラウザ画像で示すと、↓のような感じに。
  1. ニュースのトップページ

    Nx_siteinfo_elements1

  2. 個別記事ページ("headline(headlink)/mheadline(mheadlink)"のリンク先)

    Nx_siteinfo_elements3

  3. カテゴリページ("catmore"のリンク先)

    Nx_siteinfo_elements2

■キャッシュ更新用のブックマークレット(Cookie使用)
負荷軽減の意味もあってSITEINFOデータはローカルにキャッシュしていますが(24時間)、上記ブックマークレットによりキャッシュをクリアしてから再読込みできるので、作成したデータのテストに使えると思います。
ちなみにGreasemonkeyだとユーザスクリプトコマンドとしても登録されます。

« NewsExplorer:はてなニュース等をキー操作でサクサク読むスクリプト(SeaHorse/Greasemonkey) | トップページ | リンクの文字列をリンク先タイトルと入れ替えるスクリプト(SeaHorse/Greasemonkey) »

パソコン・インターネット」カテゴリの記事

おもいつき」カテゴリの記事

覚書」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

トラックバック

« NewsExplorer:はてなニュース等をキー操作でサクサク読むスクリプト(SeaHorse/Greasemonkey) | トップページ | リンクの文字列をリンク先タイトルと入れ替えるスクリプト(SeaHorse/Greasemonkey) »

戻るリンク追加

カレンダー

2025年1月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  

ココログカレンダーPlus(旧2)

検索


    • Web全体 サイト内
    • 蔵書のISBNを入力して下さい
    • はじめる前
      初級者向け
      上級者向け
      ブログ紹介
      結果を表示

コメントリストツリー化

無料ブログはココログ