debiancdn

AWS, Content Delivery Network and Debian

deliciousからhatebuにimportするときのゴミ対応

以前,delicious-html2hatebuなんてものをつくってみた.
これは,はてな謹製のdel.icio.usからはてなブックマークへのインポートで移行すると,なぜか(不規則に)日本語が文字化けするので,その対策をしたもの.

しばらくは満足してたのだが,ちょっとこまったことがあり,その対応するpythonコードをかいてみた.

  • つけたタグが「2ch」「やる夫」の2つをつけたつもりが「2ch やる夫」になっていたので,空白があったときは2つのタグにわける
  • Firefoxからdeliciousにインポートしたときに”imported”というタグがついてしまうのでこれを除去

つかいかたは簡単.

  1. はてなブックマークにいって,一旦手元に自分のブックマークをバックアップする.このfileはデフォではdump.xmlになる.
  2. はてぶを一度全部消す.
  3. python hatebu-tag-cleaner.py dump.xml > cleaned.xml
  4. cleaned.xmlをインポートする

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト /  変更 )

Google フォト

Google アカウントを使ってコメントしています。 ログアウト /  変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )

%s と連携中