Hatena::ブログ(Diary)

はけの徒然日記 このページをアンテナに追加 RSSフィード

2005 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2009 | 01 | 02 | 04 | 05 | 08 | 09 | 10 | 12 |
2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 10 | 11 |
2011 | 01 | 02 | 03 | 04 | 11 | 12 |
2012 | 02 | 03 | 05 |

2007-07-22(Sun)

「通信用語の基礎知識2007年後期版」のEPWING化

とりあえずバグはなさそうなので別館のファイル更新しました。

変更箇所は二点

  • 2007年後期版で本文の無い単語が出力されないバグ修正
  • 単位や下付き文字等に使用されている"\foo{bar};"表記をbarに変更するようにした

一点目は「安全ブレーカー」がまともなhtml形式に出力されずEBStudio変換時にエラーになったのの修正。二点目は実際に辞書を使用していて、この表記があちこちに出てきて気になったので語句のみ抽出するようにしました。追加スクリプトは2行……一点目が本当にバグが無いか心配です(^^ゞ


あと、19日の日記コメントをいただいたのですが元のDV6ファイル文字コードutf8(unicode?)独自のコード?使用の項目4点はSJIS変換できないのでスクリプト動作時にskipと表示されて、変換後のデータからは除外されますのでご了承を(これは以前と同じです)

これって外字ファイルを作る以外の方法で対応ってないのでしょうかねー

きよきよ 2011/09/04 17:12 便利なスクリプトありがとうございます。
ルビが崩れていたので修正してみました。
よかったら差替えて下さい。

●元:\foo{bar};,<>
line.gsub!(/\\.+?\{(.+?)\};/, '\1') # \foo{bar}; を barに (07/07/21追加)

# line.gsub!(/&/, '&')
line.gsub!(/</, '<')
line.gsub!(/>/, '>')
# line.gsub!(/"/, '"')
# line.gsub!(/ /, ' ')

# if line =~ /\\date\{/ # \date{…}除去
# line.gsub!(/\\date\{/, '')
# line.gsub!(/\}\;/, '')
# end

●修正:<>,\ruby{漢字}{かな};,\foo{bar};
# line.gsub!(/&/, '&')
line.gsub!(/</, '<')
line.gsub!(/>/, '>')
# line.gsub!(/"/, '"')
# line.gsub!(/ /, ' ')

# if line =~ /\\date\{/ # \date{…}除去
# line.gsub!(/\\date\{/, '')
# line.gsub!(/\}\;/, '')
# end

line.gsub!(/\\ruby\{(.+?)\}\{(.+?)\};/, '<ruby><rb>\1</rb><rt>\2</rt></ruby>') # \ruby{漢字}{かな}; を <ruby><rb>漢字</rb><rt>かな</rt></ruby> に (11/09/04追加)

line.gsub!(/\\.+?\{(.+?)\};/, '\1') # \foo{bar}; を barに (07/07/21追加)

投稿したコメントは管理者が承認するまで公開されません。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/hake/20070722/p1