Hatena::ブログ(Diary)

すたら日記

2010年08月27日

URLを抽出する正規表現はどう書くべきか

最終更新:2012/02/05

文字列の中からURLを抽出すうえで、なるべく簡単な正規表現に

したいとき、僕は下記のように書くことにしました。

/(?:^|[\s ]+)((?:https?|ftp):\/\/[^\s ]+)/

空白文字と全角スペース以外の文字すべてを受け入れています。

ちょっとやり過ぎな気もしますが、『http://家庭教師.jp/』などの

日本語でのURLというものもあるようなので、こうなりました。


半角英数記号のみを受け入れるなら下記ですが。


【外部ページ】正規表現:正しいURLかどうか調べる - phpspot

http://bit.ly/wKrBmC

Connection: close