2009-02-01から1日間の記事一覧

はてなの日記データを全文検索

Solr のテストを兼ねて、はてなの日記データからインデックスを作成してみる。http://d.hatena.ne.jp/knaka20blue/20080813/1218615351 を参考にしてみる。Solr で使うフィールドは、 URL 日付 本文 あたりかな?schema.xml を用意。 <schema name="okinaka" varsion="1.1"> <types> </types></schema>

はてなダイアリーのURL

http://d.hatena.ne.jp/ユーザID/YYYYMMDD#unixtime

はてなの日記データ形式

<diary> <day date="YYYY-MM-DD" title=""> <body>本文</body> </day> </diary> http://itpro.nikkeibp.co.jp/article/COLUMN/20061213/256808/