空想Whisper このページをアンテナに追加 RSSフィード

2009-08-15

正規表現青空文庫のルビを削除


青空文庫を携帯で読もうとしてXHTMLファイルを開き文章をコピペすると、

ある日の暮方の事である。一人の下人(げにん)が、羅生門(らしょうもん)の下で雨やみを待っていた。

という具合にルビが丸括弧に括られて表示される。

また、当然ながら、ルビありのテキストファイルをダウンロードしても、

ある日の暮方の事である。一人の下人《げにん》が、羅生門《らしょうもん》の下で雨やみを待っていた。

と、二重山括弧で括られたルビが表示される。


……邪魔だ。


ルビなしテキストファイルがあれば良いけど、ルビありしかない場合が殆どなので、そんな時には自分で取り除く必要がある。

ソフトを使ってもいいけど、使いたくない場合、正規表現使用可能なエディタ*1があれば、空文字列と置換することで手軽に削除できる。

丸括弧で括られた範囲を選択したい場合は、

[^]+

二重山括弧なら、

[^]+

となる。赤文字が任意。

偉そうに言っておいて実はここのをそのまま使ってるだけなのだが、まぁ、

[^] ⇒「」以外の文字を、

+ ⇒一文字以上含む、

」から「」まで。ということだ。


で、こんな感じでルビだけ選択される。めでたしめでたし。

f:id:Narukami:20090815022012j:image


ところで、あたかも誰かの為に書いているかのように見えるこの記事は、実は自分用メモだ。

だって正規表現なんて日々使ってでもない限り忘れちゃうんだもん!

そも、青空文庫を携帯で読む際にわざわざルビを削除しようという人などそうはおるまいて。

*1:フリーならサクラエディタとか

この手があったか…この手があったか… 2014/01/28 20:44 ルビが邪魔だったので取り除くツールをつくろうとしていた矢先に,
このページを見つけました。
手間が省けましたありがとうございます。

NarukamiNarukami 2014/01/28 22:46 お役に立てて何よりです。

とおりすがりとおりすがり 2014/02/13 23:07 RubyMateというフリーのルビ削除ソフトが、使いやすいですよ。
自分は、目次の記載をもとにして
本文中に「# 中見出し」〜[# 中身だし終わり] を自動作成してくれるソフトを探しているのですがやはり無いのかな。。

NarukamiNarukami 2014/02/15 02:33 見てみました。ルビ除去だけでなく色々できるみたいですね。
頻繁に利用する人なら便利そうです。こういったツールが自分でちゃっちゃと作れたら良いなー。
ほしい機能が無い場合、ツールの作者様にお願いしてみると良いかもしれませんね。
色んな人の要望に応えられるソフトを作りたいと思っていても、他の人がどういう機能を求めてるか気付けないこともあるでしょうから。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/Narukami/20090815/p1