Hatena::ブログ(Diary)

わさっき RSSフィード

2017年09月13日

[] 「不満ファースト」「辞任ファースト」の次は?

はてなブックマーク - 都民ファ、SNSなど発言制限…議員から不満も : 政治 : 読売新聞(YOMIURI ONLINE)*1では「不満ファースト」,はてなブックマーク - 都民ファ、野田代表が辞任 「特別秘書に専念」 - 共同通信 47NEWSでは「辞任ファースト」とコメントして,スターをいただきました.

さて次にどんな「○○んファースト」を言えばいいんだろう,と思案すること数秒,あらかじめ「○○んファースト」を用意しておけばいいやと思い立ちました.

さっそくRubyプログラミングです.ソースコードと結果は,Gistに公開しました.

「○○ん」の候補については,SKK辞書から抽出しました.SKK辞書を見たところ,SKK-JISYO.Lが最も良さそうです.作成したRubyスクリプトでは,カレントディレクトリSKK-JISYO.L.gzがあればそれを使用し,なければダウンロードして保存することで,実行し直した際の通信を抑制しました.

ダウンロードや,gz形式の伸張は,Rubyの標準添付ライブラリを使用しました.伸張した中身は(Emacsで開いたところ)EUC-JPなので,UTF-8に変換してから処理しました.

「○○ん」のパターンマッチを行うのは,「/^(\p{Hiragana}[^ぁぃぅぇぉっゃゅょ]ん) /」の正規表現です.かみ砕くと,

  • 先頭文字はひらがな*2
  • 2文字目はひらがな小文字以外
  • 3文字目は「ん」
  • その次は空白(4文字以上の読みは対象外)

であるかどうかを判定します.「あうん /阿吽/」の行はこの正規表現にマッチし,ここから「阿吽」を取得して「阿吽ファースト」を作りました.「kaki = $'.split(/[\/;]/)[1]」と書いたのは,「あへん /阿片/鴉片;=阿片/」の行から「阿片」だけを獲得したかったからです.

SKK-JISYO.L,v 1.1367 2017/09/09 00:10:02」のバージョンから獲得できたのは,974個でした.「都民ファースト」「不満ファースト」「辞任ファースト」のいずれも,含まれています.「課金ファースト (かきんファースト)」「鞄ファースト (かばんファースト)」「欺瞞ファースト (ぎまんファースト)」「出禁ファースト (できんファースト)」などが,将来どこかで使えそうです.

トラックバック - http://d.hatena.ne.jp/takehikom/20170913/1505303754