Hatena::ブログ(Diary)

FeZn/Journal このページをアンテナに追加 RSSフィード

2009-07-18 第三回ワークショップ文字「新常用漢字を問う」レポート(遅めup)

[][]20090718WS文字3新常用漢字を問う

2009/07/18、花園大学にて開催。

※例によって、帰宅後は仕事の渦に飲み込まれ、実際にupしているのは8月末……。この先は少し暇になるハズなので、大丈夫。たぶん。

※例によって、メモが追いついていないところとか、Pomera搭載のATOKでは変換できなかったところは、そのまま。(スミマセン)

http://kura.hanazono.ac.jp/kanji/20090718.html

http://kura.hanazono.ac.jp/kanji/20090718.report.html

2009/07/18 13:05

(少し遅れて到着)

當山日出夫

開催挨拶

これまでのWSの流れと、今後の展望

------------------------------------

安岡孝一

「姿と恣と盗」
  • 新常用漢字(仮)の表の中に見える、字体・字形のブレを、「にすい」に絞って、「当用漢字表」「常用漢字表」「新常用漢字表(仮)」の違いを探る。
  • →「当用漢字表」を、「大蔵省印刷局書体」と「石井細明朝」がそれぞれ異なる『解釈』をしたのが分裂のはじまり、と思われる。
    • 写研フォトの代替として平成明朝系が、漢字表の印刷に使われるようになる。(JISX0208系企画票・表外漢字字体表・新常用漢字表(案)に使われるようになる。
    • 平成明朝は、文字の構造からすると、石井明朝の特徴を引き継いだ系譜に属する。

→そのあたりが、「常用漢字表」(大蔵省印刷局書体)と「JISや新常用漢字」(石井・平成明朝系)の差となって、出てきているのではないか。

  • ※そのほかにも、同じ表の中でも部分字形の差異の件がある。(別紙参照)
  • オマケ:

------------------------------------

小形克弘

漢字小委員会における審議の実際

(中略) 配布資料参照

(最後)

  • 甲斐氏:「このままでは国語教師が説明に困る」←背景としては、学校先生が、子供たちに迷いを与えないように、《ゆらぎのない、ひとつの字形》を教えている。という実体がある。
  • →だが実は、新常用漢字は(一つの文字・字種に複数の字体・字形、という教え方へのシフトを迫っているのではないだろうか。

------------------------------------

高田智和

白書コーパス」の字種

プリント参照)

  • まとめと課題
    • 「白書コーパス」から導かれる追加候補字種の傾向・性格
      • 常用漢字よりも、「その他漢字」の方に類似
    • しかし、一般化はできないので注意。
      • 「白書」の偏り→多くのジャンル媒体に広げてみる。
      • サンプルの問題→サンプル長・サンプル数

その条件下で「出現頻度が少ない文字」を追いかけたので、出てきた文字は「誤差の範囲内」かもしれない。(他のサンプルでは出現しないかもしれない)

  • まとめと課題2
    • 漢字使用頻度調査からはじめると、漢字表記の語しか扱えない。
    • →かくときには、「語の選択」→「表記の選択」の順番になる。(仮名・漢字熟語・言い換え語・外来語など)
    • →だから本当は、「漢字の出現頻度」ではなくて「語彙調査」をおこなうべき。

2009/07/18 15:21



------------------------------------

川幡太一

漢字とオープンソース辞書ソフトウェア
  • 人は、いろいろなところで文字に出会う。(常用漢字内外いずれにせよ)
  • 漢字を調べるのは大変
    • 「知らない漢字を辞書で調べる」というのは、「知らない言葉や英単語を辞書で調べるよりも遙かに大変」(同じ読みでも字数が多かったり、意外な部首のところに排列されていたり。)
    • 漢字が見つからない場合、「載っていないのか、見逃しているのか、確信がもてない」……国語辞典・英和辞典などの場合は、簡単。
  • 電子辞書の利点
  • 市販の電子辞書
    • 広辞苑に付随の漢字辞書
    • 字通(平凡社
    • 漢字源(v4)でJISX0213に全対応。
    • そのほか、中国に諸々ある。
  • 多数の辞書の串刺し検索
    • EMACSの「Lookup」は多数のフォーマットの辞書を串刺し検索可能。現在開発中のverではかなり高機能化
  • (参考)電子辞書のフォーマット
    • EB、EBXA 漢字による検索は不可能
    • EPWING JISX0218のみ、漢字が使用可能。
    • PDIC
    • BOTNIC
    • Abby Dingo
    • ■■■■
      • (うしろのほうの数種は、Unicode対応)

(ここでemacsによる実演)

  • 辞書フォーマット
    • 既存のフォーマッットの問題点
      • 辞書フォーマットによっては、検索可能な漢字の範囲が制限される。
      • 漢字の情報は複雑なので、網羅できるかどうか……
    • XML形式のススメ
      • 無理に既存の辞書フォーマットにあわせるよりは、自由記述のほうがbetterなのでは?

XSLTHTMLへ変換

接尾辞配列(別途説明)

デモ

  • 「この漢字の、右側(旁)の部分を知りたい」
  • 「部首+画数(曖昧でいい)」→検索可能
  • 検索の問題
    • なぜ特定の辞書フォーマットに従うか?
      • フォーマッットにしたがえば、既存の検索ツールが活用dけいる。
      • そのだいしょうとして、辞書の表現能力がフォーマットにより制限される。
    • 本当に特定のフォーマットに依存せねばんばらんか?
  • テキスト辞書タグの話

(略)

  • テキスト辞書検索の汎用化
  • (メモおいつかず)
  • 接尾辞配列を付加すると、「前方一致」「後方一致」「全文検索」などに応用できる
  • (メモおいつかず)
  • 検索しやすい辞書とは
    • 検索対象文字列を囲むXMLタグには、俗世位置をつけたり、別のXMLタグを入れない。
    • 円取りには可能な限りIDをつける。
    • 辞書項目がネスト構造をもつ場合、同一タグをねすとさせず、(以下略
  • フォント・外字
    • 符号化された漢字は7万5千字
    • 外字の問題
    • ユーザーの要望
    • どのように外字を作成するか。
    • Glyphwiki利用の提案
  • さいごに
    • 知らない漢字は電子辞書で、楽に、たのしく引きたい
    • いろいろな辞書をつくり、みなで共有し、串刺しで検索したい。
    • 必要な環境はそろいつつある。
      • 拡張漢字Cまでの75000字の漢字の符号化とIVSの普及
      • XML関連技術
      • 検索ツール
      • GlyphWiki
    • 巨大な辞書の開発を共同でおこなう
      • (中略)
    • 「みんなで辞書を作って、共有して、検索して幸せになりましょう!」

2009/07/18 16:15

------------------------------------

的場仁利

文字の現場の目

※配布プリント参照

  1. はじめに(概要)
  2. 組版の問題
    1. 紙の目の問題(直接でなく例示として参照)
    2. 引用符の混乱(誤用例など)
    3. フォントの混在問題
    4. エクスクルーシブ・フォントの問題
    5. 学参フォントの問題
    6. まとめ
  3. 印刷業界の問題点
    1. 業界の勢力
    2. 業界の雰囲気
    3. 作業と工程の問題点1ーー設備依存とスキルレス
    4. 作業と工程の問題点2ーー顧客や第三者との共同作業
    5. 作業と工程の問題点3ーー統合機能
    6. 営業マンを取り巻く状況、営業マンもスキルレス
    7. まとめ
  4. おわりに

2009/07/18 16:52

------------------------------------

師茂樹

文字を“わたる”ことについての予備的考察

プリントアウト参照)

  • 「文字そのものが持っている「存在のおもしろさ」に惹かれて、いままで来ている。」
  • 文字は揺らぎをもっている。
    • その揺らぎを「わたる」こと。
    • その微少な差異にこだわった議論の迷宮に迷い込むのはどうか、という意見もある。
    • 私たちの生活の中でも、字によっては、意識することすらなく、文字をわたっている。(新字旧字とか、だけでなく)
  • 文字のわたりかた
    • 固定されたものではなく、歴史的に変化する。
    • わたられないまま、(別の意味として)固定されてしまっている例もある。(著、着 など)
  • Chaonモデル
    • CHISEプロジェクト
    • 素性の集合による文字表現・比較
    • 文字を「たくさんの要素(全体の形、部首、読み、意味、文字コードetc.)→複数の要素の重なり具合で、文字を表すことができる。
  • 文字オブジェクト間の編集距離
    • 「距離1」「距離2」など
    • ただし、この理屈では説明し切れないものもある。

2009/07/18 17:26

------------------------------------

(休憩)

2009/07/18 17:33

------------------------------------

全体討論

(討論)
  • その前に、軽くまとめ
    • JIS制定の件とか……活版とか写植の時代を過ぎて、個人の作成する文章・文字列が、そのまま製品に連なっていく時代になる、という前提で用意してきているが、人々(一般人)の間で共有されているか……というと、どうも怪しい。
  • フランス正書法の話
    • 政府が「正しい」綴りを普及させようとするが、なかなかうまくいかなかった話。
  • 最近の新聞記事からの話題……常用漢字の再検討の件
    • 学校現場に不適切」ということで「再検討」とする話がでてきている。という報道。(「淫」「呪」「艶」「賭」など)
    • この記事自体は、正しくない。(by林副主査〔審議会topとして発言〕)
    • (後略)

------------------------------------

その他

  • 安岡先生の発表に関して
    • 狩野さん)ヒラギノの特徴は「平成明朝経由」でなく「写研・石井書体直系」
  • 学参フォントの件
    • 「喩」の字
    • 「2点しんにょう」……基本的には存在しない。
      • 「どちらでも良い」となるのではなく「各個別の文字に関して言えば、ガチガチ」と狩野さんは解釈。
  • 師先生の話に関して:
    • unicodeにおける「キャラクタ」とは、=「字体」か?
      • →unicodeコンソーシアム
      • →「字体」といえるものもたくさんはいっているが、そうでないものも多数ある。(融通無碍)
    • 「編集距離」……固有名詞の問題を省いたら、この概念で解決するのか?
      • (中略)
      • microsoftの発表では、vista文字でも「祇園」「葛飾」などの問題は、あまり無かった。との由。
  • コメント「同形異字」
    • (ほぼ)同じ形でも、前後の文脈によって、違う文字として読める、というものとか、がある。
  • 當山先生の締めコメント
  • 文字をわたる、ことについて
    • e.g.かつて変体がなで書かれていた本(源氏物語とか)の時代から、つねにわたり続けてきた。
    • 日本語以外のこと、とかも含めて、「文字研究会スタート。発表者募集

2009/07/18 17:59

------------------------------------

懇親会

どこにでも出没する狩野弘樹さんとか、kzhrさんとか、works014さんとか。

まったくどうでも良いハナシですが、師センセって中学時代からの友人、S君と、なんとなく似てることにようやく気づきました。……顔立ち? ついでに言えば狩野さんはI君に似てます。ちょびっとだけ。

この会では初めて同席する的場さんとか亮月さんとかも含め、楽しく呑みました。

で、僕を含めたこの3人は帰る方向が同じなので、同時に早め退席。若干迷いそうになりつつも京都駅にたどりつき、そこからは新幹線でぴゅーっと東へ走りましたとさ。

あ。それから2009年版の「編集尺」も配布しましたが、数枚しか持って行けなかったので、枚数に不足が出てしまいました。

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/FeZn/20090718/WS3