Musashi 関連のメモ(ぼちぼち見てくことにしました)

チュートリアル

  • データ整理に関する初級編
  • データ整理に関する上級編はない
  • データ・マイニングのシナリオ(重要と思う)はない

lib 以下のソース とりあえずざっと見る(つもり)

mssAgg.c
リスト構造(RedBlackTree)を操作する関数群 基本操作 集計用関数 統計用関数

mssBase.c
基本関数群 メモリ操作 ファイル操作 異常終了関連 String操作 Stringリストの操作 型変換 乱数 メッセージ出力

mssCal.c
cal構造体(数値 文字列 オペレータ) cal構造体の四則演算 mod equal equalNot 以上 以下 論理和 論理積 if not sum min max log 2のlog 10のlog 自然対数 擬似乱数 正規分布の疑似乱数 文字列のマッチング(含む正規表現) π 平方根 累乗 power 絶対値 切り上げ 切り下げ 日付の確認 暦の変換(ユリウス日 グレゴリオ暦) 日時の処理(含む閏年や閏杪の補正) 式の解析

mssHash.c
hashの探索用関数群

mssHeader.c
XMLtable のヘッダを扱う関数群 mssFldInfo構造体の領域確保と初期化 構造体の領域解放 構造体の出力(デバッグ用) numをキーにした探索(numは内部での項目番号 0から始まる) nameをキーにした探索(結果はポインタ) name(ワイルドカードを含む)をキーにした探索(結果はポインタ、複数の結果) nameをキーにした探索(結果は項目番号) 以下、各種探索

mssInput.c
XMLtableデータの入力関連関数群 トーナメント・ツリー(TT) キー比較 TTの初期化 TTの領域解放 TTのリーフにデータをセット TTに新しいデータ 全てのトーナメント実行(リーフ追加後に) TTnodeの表示(デバッグ用) TTの表示(デバッグ用) 番兵のチェック ttKeyに一行読み込み TTキューを用いたPWayマージ

mssOption.c
コマンド・ラインで入力されるオプションを処理する関数群?

mssOutput.c
処理結果を出力するための関数群

mssUniq.c
赤黒木用のアクセス関数(自前で用意してるよう。STLを使って良いのなら標準的なのがある)

mssValue.c
MssValue操作用の関数群(MssValue自体はまだわからん)

mssXml.c
XMLデータの入力関連の関数群 文字列のエンコーデイング変換(これも自前。大変そう) mssXmlTag構造体の初期化 セット リリース mssXmlTag構造体のname属性のチェック オプションで指定されてる要素-属性の指定書式をmssXmlTag構造体に格納 空タグの生成 開始タグの生成 終了タグの生成 XMLデ-タの出力関連の関数群 開始タグの出力 終了タグの出力 空タグの出力 文字列の出力 インデントを出力 開始タグと文字列と終了タグをセットで出力する




暦の処理がやたら凄そうで、まるで天文関係のソフトのよう。データ・マイニングでそこまでやるとは。暦の計算ってマジでめんどいんだよー。




ひょっとして観測用の衞星が拾ってくるデータとか何かしら理系のデータ処理も念頭にあるかな、と無責任な想像。それにしても核心部分はまだまだ先だ。

ソフトウエア特許研究会 続報

江渡さんのまとめが公表されてます。

例えば薬品の特許の有効期間は20年でも短いという話があり、25年にのばすことを検討している。つまり、特許は技術に与えられるものというのが建前であるが、しかしその特許を用いて作られるのが、薬品であるのかそれ以外であるのかという「対象」の区別によって、有効期間が異なるということはありうるということだ。つまり「対象」を明確に区別することが可能であれば、そこで有効期間を変更するという例外処理を導入する可能性がある。(おそらくこれは、医療方法特許についても同じ議論がでているに違いないと思われる。)

技術を実現する手段がソフトウェアであるかハードウェアであるかについての違いはないという意見もでていた。リレーを用いて制御されたエレベータの例が出されていた。しかしこの件については私はまだ立場を保留したいと考えている。(ここでも医療技術特許での議論が参考になるのではないかと思われる。)

対象による区別というのは確かにあるかもしれない。目から鱗が。

製薬業界の話は、新しい薬を開発するコストが高騰して、従来の20年では償却できない、ということなのでしょう。逆に「うちの業界はもっと早くコストが償却できるから有効期間は10年でいいよ」(もしくは、あの業界ではこれくらいで償却できるだろうから、と外部から強制的に)というのは理窟の上ではある話だと思います。
一つポイントとして付け加えたいのは、「誰が発明のコストを負担したのか?」ということで、このコストを負担した所が「有効期間を短くしてもいい」と言えば、確かに何の問題も無いはずです。
ただソフトウエアの場合は、「ソフトウエア業界がコストを負担してない発明でもソフトウエアとして実行可能になる」というのがあると思うんで、発明のコストを負担する側と発明を利用する側が一致しない場合に、どうなるかが気になります。


コストを負担した側には不公平感が出そうな気もしますが、どうでしょうか? 特にこのコストが高かった場合にはかなり不幸になる気がします。