Stellaqua - TOMの技術日記 このページをアンテナに追加 RSSフィード

2010年06月13日

[][]Webサイトブログの文章を元に四字熟語を自動生成するサービスを作ってみた

今回は、今北シリーズ(?)の第2弾として四字熟語バージョンを作ってみました。

今北四字熟語

これは何?

「今来た私にサイトの内容を四字熟語で教えて下さい」的なサービスです。

URLを入力して"作成する"ボタンを押すと、該当サイトの内容を元に四字熟語を自動生成してくれます。

試しにこのブログで試してみたところ、こんな四字熟語になりました。

作事思表

これは、「作る事は思想を表す事だ」という意味です。(勝手に解釈) 自分の中で、Webエンジニアとして何かを作って公開する事は、そのまま自身の実力だったり考え方だったりを表現する事だと思っているので、この四字熟語は適当にできたにしては案外良くできている感じがして気に入っています。

ちなみに、今北川柳では色紙に書いたっぽい画像を生成するようにしていたんですが、今回は家訓的なモノをイメージして、巻物に書いた感じの画像にしてみました。

「○○のブログ訓」みたいな感じでブログパーツとして画像を貼ってもらったりすると結構面白いかもしれないですね。

どんな仕組みなの?

コア部分の仕組みとしては、該当URLのサイト内容を読み込んで、漢字だけを抜き出して数をカウントして、多く使われている順に4つ並べているだけです。

一番最初にテストで書いたコードは以下の通り。

<?php
$body = file_get_contents('http://d.hatena.ne.jp/stellaqua/');
$body = mb_convert_encoding($body, 'utf-8', 'euc-jp');
preg_match_all('/[一-龠]/u', $body, $matches);
$results = $matches[0];
$results = array_count_values($results);
natsort($results);
$results = array_reverse($results);
$results = array_slice($results, 0, 4);
var_dump($results);
?>

ロジック部分は、これがベースになっていて、後は今北川柳から色々流用して作っています。

array_count_valuesとかあんまり使った事なかったんですが、なかなか便利で色々使えそうですね。

こんな感じで、サイトの内容をごにょごにょして何かしらの形として自動生成するというのは、他にも応用が利きそうなので、また"今北シリーズ"として色々考えてみたいと思います。


そんな訳で、ぜひ遊んでみて下さいね〜。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/stellaqua/20100613/1276408494