このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

はてなブックマークのエクスポート

http://b.hatena.ne.jp/help/entry/port#export に従う。

  1. ユーザー画面から設定画面に
  2. 「データ管理」タブに移動します
  3. エクスポートより、Atomフォーマットを選んで、右クリックでダウンロード。

何も変更しないと、ダウンロードのファイル名はdump.htmとなる。実際には、dump.htmにAtomフィードXML形式で入っている。

<?xml version="1.0" encoding="UTF-8"?>
<feed
 xmlns="http://purl.org/atom/ns#" xml:lang="ja"
 xmlns:opensearch="http://a9.com/-/spec/opensearchrss/1.0/"
 xmlns:dc="http://purl.org/dc/elements/1.1/"
 xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/"
>

1エントリーは、

  <entry>
    <id>tag:hatena.ne.jp,2005:bookmark-m-hiyama-351108256</id>
    <title>125.html</title>
    <link type="text/html" rel="related" href="https://yamasakimasaki.com/blog/125.html"/>
    <link type="text/html" rel="alternate" href="http://b.hatena.ne.jp/m-hiyama/20171206#bookmark-351108256"/>
    <link type="application/x.atom+xml" rel="service.edit" title="125.html" href="http://b.hatena.ne.jp/atom/edit/351108256"/>
    <summary> マストドンAPIの解説</summary>
    <issued>2017-12-06T15:52:16+09:00</issued>
    <author>
      <name>m-hiyama</name>
    </author>
    <dc:subject>mastodon</dc:subject>
    <dc:subject>webapi</dc:subject>
  </entry>
  1. id: tag URIが使われている。一意性が保証できるばなんでもいい。
  2. title: おそらく、ターゲットページのtitleタグから取得している。
  3. link related: ターゲットURIがここに入っている。
  4. link alternte: ブックマークエントリー自体のURLが入っている。
  5. link sevice.edit: このエントリーを編集するときのURLだと思うが、詳細は不明。
  6. summary: ブックマークユーザーが入れたコメント文言。
  7. issued: ブックマークエントリーが生成された日時、どっちかいうとcreatedだと思う。
  8. author: ブックマークユーザー、エントリーの生成者。
  9. dc:subject: タグが並ぶ

faviconの画像URLなどは入ってないので、表示のときに取ってきてるのだろう。また、ターゲットベージのサマリー(ブックマークのコメントではない)もその場で取ってきているようだ。

WebAnnotation(https://www.w3.org/TR/annotation-model/)と比較してみる。

WebAnnotation はてな
id id
type なし
target link related
body 適当にラップすればいい
body/value summary
body/created issued
body/creator author
body/id link alternative
? title
? dc:subject

一番大事なタイトルとタグが対応付けできない。WebAnnotationは拡張できるから別にいいけど。

その場で取得や生成している項目

  1. favicon画像
  2. title 最初とタイトルが変わっていたらどうするか?
  3. ユーザー数 これは動的な値だから保存はできない。
  4. 同じサイトの新着ブックマーク これもサーバー側でその場で作るのだろう
  5. カテゴリー 大分類だがイイカゲンで役に立たない
  6. 本文の最初のほう
  7. 本文内の画像
  8. ブックマークしたユーザーのアバター画像
  9. はてなスターの操作インターフェイス