2024-04-26

“TeX”で2次方程式の解の公式を出力する話

TeX

それはplain TeXじゃん、ちゃんとTeXで書いてよ。 #えええっ #TeX #TeX言語 https://t.co/9bdXM5IgNA
— 某ZR（ざんねん🙃） (@zr_tex8r) 2024年4月2日

「“TeX”とは何を指すのか」というのは常に悩ましい問題¹であるが、自分の感覚としては「“TeX”とはplain TeX（のみ）を指す」という習慣は少なくとも現代において²は「“TeX”とはLaTeX（のみ）を指す」という習慣と同類である（要はあまり妥当でない）と考えている。

となると、「LaTeXのコードは“TeXのコード”ではない」という前提において、何だったら“TeXのコード”といえるだろうか。この前提の下では「plain TeXのコード」もその他のフォーマットのコードも“TeXのコード”ではなさそうである。唯一可能性があるのは「本当にTeX処理系本来の機能のみを前提にしたコード」、つまり「iniTeX（TeXのINIモード³）で動くコード」ということになるだろう。

「単にTeXといったら“裸のTeX”(iniTeX)のことでしょ」
という人のために、iniTeX用のコードを貼っておきますね🤯#TeX #TeX言語
※パラメタは「plain TeXと同じ組み方になる」ように設定した。 pic.twitter.com/dUcsT638Wi
— 某ZR（ざんねん🙃） (@zr_tex8r) 2024年4月2日

というわけで、本記事では、この「iniTeXで2次方程式の解の公式を組版して出力するコード」についてグダグダと雑に解説していくことにする。

※雑談なので前提知識を厳密には決めないが、TeX言語🤮のキホン的な知識はあった方が楽しめると思う。

使い方を説明してみる

TeX: To typeset the quadratic formula with iniTeX · GitHub

[ini-formula.tex]

\catcode`\{=1 \catcode`\}=2 \catcode`\$=3 \catcode`\^=7
\mathcode`\+="202B \mathcode`\-="2200 \mathcode`\=="303D
\hsize=77mm \vsize=22mm \scriptspace=0.5pt
\parfillskip=0pt plus 1fil \nulldelimiterspace=1.2pt
\delimiterfactor=901 \delimitershortfall=5pt
\thinmuskip=3mu \medmuskip=4mu \thickmuskip=5mu
\font\tt=cmr10 \font\st=cmr7 \tt\fam0
\font\tm=cmmi10 \font\ts=cmsy10 \font\tx=cmex10
\textfont0=\tt \scriptfont0=\st \scriptscriptfont0=\st
\textfont1=\tm \scriptfont1=\tm \scriptscriptfont1=\tm
\textfont2=\ts \scriptfont2=\ts \scriptscriptfont2=\ts
\textfont3=\tx \scriptfont3=\tx \scriptscriptfont3=\tx
\output{\shipout\vbox to\vsize{\vfill\unvbox255}}
$$x={-b\mathchar"2206\radical"270370{b^2-4ac}\over2a}$$
\end

※ツイッタァー（現𝕏）の投稿に画像として示すために改行を少なめにしているが、それ以外には特別（なるべく短くする、チョット読みにくくする🎄、等）な書き方はしていない。

このソースは「DVI出力を利用して128mm×72mmの用紙サイズで出力すること」を前提としている。元祖TeX（のINIモード）とdvipdfmxを利用してPDFに変換するには以下のコマンドを実行すればよい。

tex -ini ini-formula.tex
dvipdfmx -p "128mm,72mm" ini-formula.dvi

中身を説明してみる

そういうわけで、春🌸なのでこの「iniTeX用のTeXコード」をテキトーに説明していくことにする。

基本的に「plain TeXと同じ組み方の数式」を得るのが目的であるため、「TeXの初期状態」（iniTeX起動時の状態）から始めて「plain TeXでやっている設定のうち今回必要になるものだけを選んで踏襲する」という方針をとる。

1行目

\catcode`\{=1 \catcode`\}=2 \catcode`\$=3 \catcode`\^=7

{ } $ ^の各文字⁴のカテゴリコードをplain（やLaTeX）と同様に設定している。逆に言うと「TeXの初期状態ではその設定はされていない」ということであり、実際、初期状態ではほとんどの文字のカテゴリコードは12である。

ちなみに、\のカテゴリコードについては最初から0に設定されている。そうでないとそもそも\catcode自体が使えなくてカテゴリコードの設定が何もできなくなるからである。同様の理由で英字のカテゴリコードも初期状態で11になっている。他にも空白（10）、改行（5）、%（14）等も初期状態で設定されている。

2行目

\mathcode`\+="202B \mathcode`\-="2200 \mathcode`\=="303D

ここでは+ - =の3文字⁵について数式コード(math code)をplainと同様に設定している。数式コードは「その文字を数式中でフツーに出力した（つまり当該の文字のカテゴリコード11または12の文字トークンを実行した）ときにどのように出力すべきか」を決定する。

+のコード値 "202B は「二項演算子(2)として、数式ファミリ0のフォントの文字コード "2B のグリフを出力する」ことを意味する。後で行うフォント設定に従うと、ファミリ0のフォントはcmr10であり、その文字コード "2B には（ASCIIと同じく）“+”の記号が入っている。
-のコード値 "2200 は「二項演算子(2)として、数式ファミリ2のフォントの文字コード "00 のグリフを出力する」ことを意味する。ファミリ2のフォントはcmsy10で文字コード "00 には“−”（マイナス）の記号⁶が入っている。
=のコード値 "303D は「関係演算子(3)として、数式ファミリ0のフォントの文字コード "3D のグリフを出力する」ことを意味する。ファミリ0（cmr10）の文字コード "3D は“=”である。

なお、TeXの初期状態の数式コードの値は以下のようになっている（xxは当該文字のASCIIコード）。

英字（A～Z、a～z）については"71xx、つまり「数式英字、ファミリ1の当該の文字」。
数字（0～9）については"70xx、つまり「数式英字、ファミリ0の当該の文字」。
それ以外は"00xx、つまり「通常文字、ファミリ0の当該の文字」。

従って、英字や数字（x a 2 4等）については数式コードの設定は不要である。

3～5行目

\hsize=77mm \vsize=22mm \scriptspace=0.5pt
\parfillskip=0pt plus 1fil \nulldelimiterspace=1.2pt
\delimiterfactor=901 \delimitershortfall=5pt

各種のレイアウトパラメタの設定である。このうち最初の2つ（\hsize／\vsize）はplainの設定値ではなく独自の値を設定している⁷。

\hsizeと\vsizeは版面のサイズを表す。左側と上側のマージンはTeXの初期値のままの1インチ⁸なので、ここでは右と下のマージンも1インチと想定した上で、用紙サイズ（128mm×72mm）からマージンを除いたサイズ（77mm×22mm）を設定した。

残りのパラメタはplainの設定値に合わせている。

\scriptspaceは添字の直後に挿入される空きの大きさ。
\parfillskipは段落の末尾に自動的に追加されるグルーの大きさ。段落最終行を左揃えにするため普通は0pt plus 1filに設定する。
\nulldelimiterspaceは「区切り記号（大型括弧）があるべき箇所に実際に何もない場合に代わりに置かれる空き」の大きさ。今回の出力では分数の前後にこの空きが入る⁹。
\delimiterfactorと\delimitershortfallは区切り記号の大きさを決定するのに使われるパラメタ。根号の大きさをplainに合わせるために設定した。

6行目

\thinmuskip=3mu \medmuskip=4mu \thickmuskip=5mu

これらは記号の周りに自動的に入る空きの大きさを決めるパラメタである。今回の数式の中では、“±”と“−”の周りの空きが\medmuskip、“=”の周りの空きが\thickmuskipである。（\thinmuskipは使われていないので設定は不要だった🙃）

これらのパラメタは“mu”（math unit）という「数式用フォントのサイズに基づく相対単位」で表す（現在の数式スタイルでのファミリ2のフォントの1emが18muに等しい）。

plainでは伸縮付きの値（例えば\medmuskip=4mu plus 2mu minus 4mu）が設定されているが、今回は伸縮は不要なので外した。

7～8行目

\font\tt=cmr10 \font\st=cmr7 \tt\fam0
\font\tm=cmmi10 \font\ts=cmsy10 \font\tx=cmex10

必要なフォント（fontdefトークン）の定義をしている。今回のコード中に現れるプリミティブでない制御綴はここで定義されるもの（\tt・\st・\tm・\ts・\tx）しかない¹⁰。

7行目末尾の\ttはテキストのフォントをcmr10に設定している（初期状態のフォントは\nullfont¹¹である）。実際にはテキスト（数式以外）の文字は一切出力していないが念のため設定した。\fam0は「“現在の数式ファミリ”（つまり“数式英字フォント”として使われる数式ファミリ）を0番に設定する」という意味だが、これも不要であった🙃¹²

9～12行目

\textfont0=\tt \scriptfont0=\st \scriptscriptfont0=\st
\textfont1=\tm \scriptfont1=\tm \scriptscriptfont1=\tm
\textfont2=\ts \scriptfont2=\ts \scriptscriptfont2=\ts
\textfont3=\tx \scriptfont3=\tx \scriptscriptfont3=\tx

数式ファミリ（math family）にフォント（fontdefトークン）を割り当てている。\textfontで通常サイズ、\scriptfontで添字用の小さいサイズ、\scriptscriptfontで二重添字サイズのフォントを指定する。

ここではplainと同様にファミリ0にcmr、ファミリ1にcmmi、ファミリ2にcmsy、ファミリ3にcmexを使っているが、添字用（小さいサイズ）のものは実際に必要なもの（式の中に上添字の“2”があるので\scriptfont0は必要）以外は別のサイズのもので代替している。

例えば、式の先頭の“x”（数式コード "7178）は通常サイズのファミリ1、すなわち\textfont1で出力されるが、その\textfont1は\tm、すなわちcmmi10である。

ちなみに、初期状態では全てのファミリのフォントが未定義（\nullfont）になっている。使用しないファミリは未定義でかまわないのだが、例外的にファミリ2と3については全てのサイズのフォントが定義済である必要がある¹³。

13行目

\output{\shipout\vbox to\vsize{\vfill\unvbox255}}

出力ルーチン（\outputトークン列レジスタ）を設定している。

\outputの初期値は空でこの場合は「既定の出力ルーチン」である

\shipout\box255

が使われることになっている。これは「TeXのページ分割の結果作られたページ（255番のボックスレジスタの中身）をそのままDVIに出力する」という処理を意味している。

今回のコードでは版面の垂直方向の中央に数式を出したいので、「\box255の中身の前に\vfillを追加した上で\shipoutする」という出力ルーチンを実装した¹⁴。

ここまでのコードで全ての設定が完了したことになる。

14行目

$$x={-b\mathchar"2206\radical"270370{b^2-4ac}\over2a}$$

「解の公式」の数式を出力するコードである。比較のために、plain TeXで同じ数式を普通に書いた場合のコードを以下に示す。

$$x={-b\pm\sqrt{b^2-4ac}\over2a}$$

このplainのコード中に現れる制御綴のうち、\overはプリミティブであるが\pmと\sqrtは“plainで定義されたもの”である。従って、iniTeXでは同等の機能をプリミティブだけで書く必要がある。

\pmは\mathchardef\pm="2206で定義されるmathchardefトークンである¹⁵。従って、\mathchar"2206で同じ動作になる。
\sqrtは\def\sqrt{\radical"270370 }で定義されるマクロである。従って、単純にマクロの本体で置き換えればよい。

このように書き換えると最初に挙げたiniTeXのコードができあがる。既に“plainと同じ”になる設定が行われているので、このコードで“plainと同じ”の「解の公式」が出力される。

参考として、ここで用いたコードの意味を説明しておく。

\mathchar"2206は「数式コードが "2206 の文字を実行する」のと同等である。すなわち「二項演算子(2)として、数式ファミリ2のフォント（ここではcmsy10）の文字コード "06 のグリフを出力する」という動作になる。
\radicalは根号を出力するためのプリミティブであり、根号は“伸長可能なグリフ”と上線の組み合わせで構成される。引数の "270370 のうち、前3桁の "270 は通常のグリフの位置（数式ファミリ2のフォントの文字コード "70）、後3桁の "370 は大型のグリフ¹⁶の位置（数式ファミリ3（ここではcmex10）のフォントの文字コード "70）を表している。

15行目

\end

TeXの実行を終了させるプリミティブは\endである¹⁷。これにより以下の処理が行われる。

まだメモリに残っている内容をDVIに出力する。
- ページビルダを実行して「解の公式」の数式を含むページの内容を\box255に格納する。
- 出力ルーチン（先ほどの\outputのトークン列）を実行する。その中の\shipoutによりボックスの内容（「解の公式」の数式）がDVIに出力される。
TeXの実行を終了する。

めでたしめでたし😊

まとめ

というわけで、「LaTeXなんて“本当のTeX”ではない」と主張する人は、“本当のTeX”であるiniTeXについてもっと学習しましょう！💁

もちろん「TeX処理系およびその言語」というのが本来の意味であるが、でももしそれに従うのであれば、「LaTeXのコード」も「plain TeXのコード」も間違いなく「TeXのコード」といえるはずである。↩
「plainフォーマットのTeX」のことを「plain TeX」と呼ぶのは後代の用語である、という話を聞いたことがある。↩
plainやLaTeX等の“フォーマット”の実装コードを何も読み込まずに、本当にTeXの「初期状態」で起動するモードのこと。初期のTeX配布物では本体のTeXとは別のソフトウェアになっていてそれを“iniTeX”と呼んでいたのだが、後にiniTeXの機能をTeXに組み込んで「TeXのINIモード」として扱うようになった。↩
例えば、「解の公式」の数式の中にはb^2があるので^は設定する必要がある。↩
実は、“+”の記号は「解の公式」の中で全く使っていないので、+の数式コードの設定は不要であった。↩
ちなみに、cmr10の文字コード"2D（ASCIIのhyphen-minusの位置）にあるグリフはマイナスではなくハイフンである。↩
TeXのパラメタの初期値（初期状態の値）は大抵はゼロ（0、0pt、0mu）である。↩
パラメタ\hoffset／\voffsetが初期値の0ptのままで、これに“例の1インチ”が加わる。↩
TeXの“汎化分数”のプリミティブ（\abovewithdelims）はそれ自身に大型括弧を付ける機能があったことを思い出そう。↩
なお、TeXの初期状態ではプリミティブ以外の制御綴は全て未定義の状態である。↩
プリミティブとして用意されている、“全くグリフが定義されていない”ようなfontdefトークン。↩
\famパラメタは数式の開始時に常に−1にリセットされるため数式の外で設定しても意味がない。そもそも\famの初期値は0である。↩
未定義のまま数式を入力するとMath formula deleted: Insufficient symbol fonts.というエラーが出る。これらのファミリの「フォントのパラメタ」が数式全体のパラメタとして参照されるからである。↩
\vfillを前にだけ入れている理由は、\box255の末尾に既に\vfillが入っているからである。この\vfillは\endの処理の中で挿入されるようである。↩
\mathchardef\X=‹整数n›で定義されるmathchardefトークン\Xを実行すると\mathchar‹整数n›と同等の動作になる。特定のコードの代わりになるという点ではmathchardefトークンはマクロと似ているが、マクロとは異なり展開不能である。なお、mathchardefトークンと\mathcharの関係は、chardefトークンと\charの関係と同じである。↩
もちろん、TeXの数式中の根号は2段階ではなくもっと多くの段階をもって伸長できる。この「伸長によるグリフの置換・再配置」はTFMの内部の情報を使って処理されている。括弧類についても同様である。↩
なお、plainの\byeは\par\vfill\supereject\endに展開されるマクロである。↩

2024-04-08

expl3でFibonacci数列を完全展開可能な形で求める話(1)

TeX

🙃「TeX言語🤮でFibonacci数列を完全展開可能な形で求める話」
😵‍💫「そんなのはexpl3でやるべき」
🙃「うえ～ん😭（ネタ獲得失敗）」#TeX #TeX言語 #春のTeX言語キャンペーン🌸
— 某ZR（ざんねん🙃） (@zr_tex8r) 2024年4月6日

某キャンペーン🌸のネタにはならないわけだが、せっかくなのでチョット話してみる。特にexpl3の新機能である“e 引数指定子”について詳しく扱うので「e引数指定子をまだ知らない」というexpl3者にとっては有用な記事になるかもしれない。

※対象読者は「フツーにexpl3できる人」とする🙂

お題

次の2つの完全展開可能な命令を実装したい。

\Fibonacci{<整数n>}：［完全展開可能］フィボナッチ数列の第n項の値（の十進表記）。
\FibonacciSeq{<整数n>}：［完全展開可能］フィボナッチ数列の第n項までをコンマ区切りで並べた文字列。

完全展開可能であるため、展開限定文脈（\typeoutの中など）でも正常に動作する必要がある。

\typeout{F[10] = \Fibonacci{10}}
%==> "F[10] = 55" (端末表示)
\typeout{\FibonacciSeq{10}}
%==> "1, 1, 2, 3, 5, 8, 13, 21, 34, 55" (端末表示)

とにかく実装し始める話

とりあえず「フィボナッチ数列の値を求める部分」以外の“ガワの部分”をさっさと済ませてしまおう。フツーのexpl3者にとっては初歩的なコード実装のはずだが、「完全展開可能にしたいので完全展開可能でない¹ライブラリ関数（\int_step_inline:～等）は使えない」ことに注意する必要がある。

%%<*> \Fibonacci{<整数n>} (完全展開可能)
% フィボナッチ数列の第n項の値.
% ※完全展開可能にしたいので, xparse系のマクロ定義命令を利用するならば
% "Expandable" 版のものを選ぶ必要がある. (\newcommand でもよい.)
\NewExpandableDocumentCommand \Fibonacci { m }
  { \int_to_arabic:n { \__myfib_value:n {#1} } }

%%<*> \FibonacciSeq{<整数n>} (完全展開可能)
% フィボナッチ数列の第n項までをコンマ区切りで並べた文字列.
\NewExpandableDocumentCommand \FibonacciSeq { m }
  % 完全展開可能にしたいので \int_step_inline:～ ではなく
  % \int_step_function:～ を利用する.
  { \int_step_function:nnN { 1 } {#1} \__myfib_seq_iter:n }
% ループの中の処理.
\cs_new:Nn \__myfib_seq_iter:n
  {
    \int_compare:nNnF {#1} =  { 1 } { ,~ } % 先頭以外ではコンマを入れる
    \int_to_arabic:n { \__myfib_value:n {#1} }
  }

%% \__myfib_value:n{<n>}
% フィボナッチ数列の第n項の値.
\cs_new:Nn \__myfib_value:n
  { % TODO:実装する
  }

後は「\__myfib_value:nをいかにして完全展開可能で実装するか」という話になる。

TeX以外で実装してみる話

完全展開可能にするため\int_set:Nn等の「代入操作」は一切使えないことになる。従って再帰を利用した²“関数型プログラミング的なロジック”を組む必要がある。

ここでは「どんな感じのコードを書けばいいか」を示すために関数型組版言語であるSATySFiのコードを掲載することにする。

@require: stdjareport

% 不変条件: a が第(n-k)項, b が第(n-k+1)項に等しい.
let-rec myfib-value-aux k a b =
  if k == 1 then b % 第n項の値
  else myfib-value-aux (k - 1) b (a + b) % 再帰する
let myfib-value n =
  if n < 1 then 0
  else myfib-value-aux n 0 1

% ↓これ以降はSATySFi特有の話なのでexpl3者は気にしなくてよい.
let-inline ctx \Fibonacci n =
  read-inline ctx (embed-string (arabic (myfib-value n)))
in
document (|
  author = {}; title = {}; show-title = false; show-toc = false
|) '<
  +p{${F_{10}} = \Fibonacci(10);}
>

もちろんSATySFiなのでこの記事のお題の\Fibonacciに相当する命令も作れる😃

expl3で一応実装してみた話

「どういう感じのコードを書けばいいか」がわかったので、\__myfib_value:nを実際にexpl3で書いてみよう。

%% \__myfib_value:n{<n>}
% フィボナッチ数列の第n項の値.
\cs_new:Nn \__myfib_value:n
  {
    \int_compare:nNnTF {#1} < { 1 } { 0 } % n<1なら0を返す
      { \__myfib_value_aux:nnn {#1} { 0 } { 1 } }
  }

%% \__myfib_value_aux:nnn{<k>}{<a>}{<b>}
% \__myfib_value:n の下請け.
% 不変条件: a が第(n-k)項, b が第(n-k+1)項に等しい.
\cs_new:Nn \__myfib_value_aux:nnn
  {
    \int_compare:nNnTF {#1} = { 1 } { #3 } % 第n項の値
      {% 単純に再帰呼出してみた
        \__myfib_value_aux:nnn
          { \int_eval:n { #1 - 1 } }
          { #3 }
          { \int_eval:n { #2 + #3 } }
      }
  }

実際に\Fibonacciを\typeoutの中に置いて試してみると、正しく動作しているようにみえる。

\typeout{F[10] = \Fibonacci{10}}
%==> "F[10] = 55" (端末出力)

しかしnの値を少し増やすと爆発してしまう😲

\typeout{F[30] = \Fibonacci{30}}
Runaway argument?
{\int_eval:n {\int_eval:n {\int_eval:n {\int_eval:n {\int_eval:n {\int_eval:n \
ETC.
! TeX capacity exceeded, sorry [main memory size=5000000].
<argument> ...l:n {\int_eval:n {\int_eval:n {\ETC.

l.3 \typeout{F[30]=\Fibonacci{30}}

※第30項の値は832040だからTeXの扱える整数の範囲にはまだ入っているはず。

\int_eval:nが延々と並んでいるのを見れば察しが付くと思うが、要するに「展開制御が足りていない」のが原因である。

\__myfib_value_aux:nnnの再帰呼出のところを検討してみよう。

\__myfib_value_aux:nnn{2}{0}{1}
↓(展開を続ける)
\__myfib_value_aux:nnn{\int_eval:n{2-1}}{1}{\int_eval:n{0+1}}

ここで期待する動作は「\__myfib_value_aux:nnn{1}{1}{1}」が実行されることであろう。しかしexpl3の“関数”は所詮はTeXのマクロに過ぎないので、何も展開制御をしなければ\int_eval:n{2-1}等のトークン列がそのままマクロに渡されてしまうことになる。これを何度も繰り返すと、引数の式が

{\int_eval:n {\int_eval:n {\int_eval:n {\int_eval:n {\int_eval:n {\int_eval:n ……

のようなオソロシイ形に肥大化するわけである。このトークン列の長さはnに対して指数関数的に増えるので、少し大きいnで“TeX capacity exceeded”になるのも当然である。

結局、行うべき展開制御の内容は「__myfib_value_aux:nnnの再帰呼出の際に第1と第3の引数を完全展開すること」ということになる。

\__myfib_value_aux:nnn{\int_eval:n{2-1}}{1}{\int_eval:n{0+1}}
↓上のコードを下のコードに変えたい
\__myfib_value_aux:nnn{1}{1}{1}

展開制御してみる話

expl3における展開制御は基本的に「展開用の引数指定子(argumente specifier)を指定する」形で行う。今やりたいのは完全展開であるが、expl3に昔からある引数指定子で完全展開の機能をもつものは次の2つである。

x：引数を完全展開³する。ただし、元々n指定の引数を展開制御(\exp_args:N～)によりx指定に転換した場合は完全展開可能性が失われてしまう。
f：引数を先頭完全展開する。（展開制御でf指定に転換した場合には完全展開可能性は失われない。）

\__myfib_value_aux:nnnの展開制御でどちらを使うべきかの答えは明らかである。そもそも完全展開可能な命令を実装しようとしているのだから「完全展開可能性が失われる」性質を持つx指定は選択肢になく、f指定を使うしかない。従って、f指定で目的を果たせるかを検討しよう。

今やりたいのは「\__myfib_value_aux:nnnの2つの引数を完全展開する」ことであるが、この2つの引数はいずれも「\int_eval:n {…}」という形である。\int_eval:nは先頭完全展開可能⁴である（マニュアル（interface3）において★印が付いている）なので、f指定（先頭完全展開を施す）により完全展開されることがわかる。従って引数全体のf指定による展開結果は「整数式の値（を表すトークン列⁵）」となり、結果的にこれは所望のものと一致している。

f指定で目的が果たせることがわかったので実際にコードを改修してみよう。expl3で展開制御を指定する方法には\cs_generate_variant:Nnを使うものと\exp_args:N～を使うものの2種類がある。

\cs_generate_variant:Nn で頑張る話

今欲しいものは「\__myfib_value_aux:nnnの第1と第3の引数にf指定の展開を施したもの」である。これをexpl3の関数の命名規則では\__myfib_value_aux:fnf（引数指定子の第1と第3の文字をfに変える）と呼ぶ。このように「ある関数の引数指定子を変えたもの」のことをその関数の「変種(variant)」と呼ぶ。

そして、所望の変種\__myfib_value_aux:fnfを既存の\__myfib_value_aux:nnnから自動的に生成してくれるのが\cs_generate_variant:Nnというライブラリ関数である。今の場合は「既存の\__myfib_value_aux:nnnからfnf版を生成したい」ので次のようなコードを実行すればよい。

\cs_generate_variant:Nn \__myfib_value_aux:nnn { fnf }

これで\__myfib_value_aux:fnfが定義されるので、\__myfib_value_aux:nnnの定義本体のコードの中の再帰呼出の部分をこのfnf版の呼出に置き換えよう。

\cs_new:Nn \__myfib_value_aux:nnn
  {
    \int_compare:nNnTF {#1} = { 1 } { #3 }
      {% 再帰呼出では引数を展開する
        \__myfib_value_aux:fnf %←※ここで"fnf"版を使っている
          { \int_eval:n { #1 - 1 } }
          { #3 }
          { \int_eval:n { #2 + #3 } }
      }
  }
\cs_generate_variant:Nn \__myfib_value_aux:nnn { fnf }

これでフツーに動く\Fibonacciが完成したことになる。実際に少し大きいnで動作を試してみよう。

\typeout{F[30] = \Fibonacci{30}}
%==> "F[30] = 832040" (端末出力)

うまくいったようだ😊

\exp_args:N～で頑張る話

「\__myfib_value_aux:nnnのfnf版が欲しい」場合に\cs_generate_variant:Nnは実際に\__myfib_value_aux:fnfという関数を定義するのであった。これとは別の方法として、\exp_args:N～という一連のライブラリ関数を利用することもできる。これは「\__myfib_value_aux:nnnにfnf版の動作をさせる」ためのものである。

\exp_args:N～の～の部分には所望の変種の引数指定子を書く。例えば、\__myfib_value_aux:nnnにfnf版の動作をさせたい場合は、\exp_args:Nfnfという関数を前に置けばよい。

\exp_args:Nfnf \__myfib_value_aux:nnn { \int_eval:n { 2 - 1 } } { 1 } { \int_eval:n { 0 + 1 } }

※\__myfib_value_aux:nnn以下のトークン列は「\exp_args:Nfnfの引数」という位置付けになっていて、だからこそNfnfという引数指定子になっている。

これで完成のはずだが、実際には上記のようなコードを実行すると「\exp_args:Nfnfが未定義である」というエラーになる。\exp_args:N～の～の部分のパターンは無数にあり、それら全てを予め定義しておくのは無駄であるから「expl3のカーネルでは一部だけを定義しておく」という方針になっているためである。どのパターンがカーネルで定義されているかはマニュアルに書かれていて、例えば\exp_args:Nfや\exp_args:Nnffは定義されているが\exp_args:Nfnfはされていない。

カーネルで定義されてない\exp_args:N～のパターンを使用するには、予め\exp_args_generate:nという命令を用いて定義する必要がある⁶。

\exp_args_generate:n { fnf }

\exp_args:Nfnfを使って\__myfib_value_aux:nnnを修正した場合のコードは以下のようになる。

% \exp_args:Nfnf を利用可能にする
\exp_args_generate:n { fnf }

\cs_new:Nn \__myfib_value_aux:nnn
  {
    \int_compare:nNnTF {#1} = { 1 } { #3 }
      {% 再帰呼出では引数を展開する
        \exp_args:Nfnf \__myfib_value_aux:nnn
          { \int_eval:n { #1 - 1 } }
          { #3 }
          { \int_eval:n { #2 + #3 } }
      }
  }

（つづけ）

マニュアル（interface3）において星印（★や☆）が付いていない関数は完全展開可能でない。↩
もちろん、「フィボナッチ数列の定義をそのまま書いたコード」は「求めるフィボナッチ数の値に比例した時間（nに対いて指数関数的）」がかかってしまうので、それはやってはいけない🙃↩
この記事での「完全展開」「先頭完全展開」はTeX言語の用法に従う。もしかしたらexpl3では「先頭完全展開」のことを「完全展開(full expansion)」と呼ぶのかもしれないが、今一つ実態をつかめていないので従来の用語を使うことにする。↩
expl3の用語では「先頭完全展開可能」のことを「完全展開可能(fully expandable)」、単なる「完全展開可能」のことを「制限付展開可能(restricted expandable)」と呼ぶ。ここではTeX言語の用法に従う。↩
ちなみに、expl3の仕様としては「整数値を返すライブラリ関数」の実際の展開結果である「整数値を表すトークン列」は必ずしも「十進の数字列」とは限らないようである。\Fibonacciの実装コードでわざわざ\int_to_arabic:nを入れているのはこのためである。↩
なお、既に定義済のパターンについて\exp_args_generate:nを実行しても何も起こらない。今カーネルで定義済のものが将来削除されることもないため、「今のexpl3の版で未定義ならば自分で定義する」という方針に従っても前方・後方互換性は保たれる。↩

2024-04-06

TeXでつくるLLM

LaTeX

というわけで、今年もあの季節🌸がやってきました！

ところで皆さん💁
そろそろ某組版用言語🤮の季節になってきましたね🌸#TeX #TeX言語 #春のTeX言語キャンペーン pic.twitter.com/wGlKFwyV83
— 某ZR（ざんねん🙃） (@zr_tex8r) 2024年3月30日

キャンペーンと関係あるのかどうかは不明ですが、どうやらTeX言語🤮のトッテモ有用な記事が公開されているようです😃

ブログ更新。完全展開可能な文字列一致判定について。https://t.co/PWU0bF8ywC
— Yusuke Terada (@doraTeX) 2024年4月5日

というわけで、自分も何か記事を書こうと思い立ちました🙂

せっかくの#春のTeX言語キャンペーン
なんだから自分も何かTeX言語🤮の記事を書きたいけど、何かいい題材はないかな🤔#TeX #TeX言語
— 某ZR（ざんねん🙃） (@zr_tex8r) 2024年4月5日

さっそく、「TeXでつくるLLM」というお題が降ってきました😊

bsky.app

さっそく取り組むことにしましょう。

TeXでLLMする方針について

“LLM”のような頭字語について考える際に重要になるのが「“元の語形”をどう設定するか」です。

TLSって何だっけ？
TeX Language Snowman の略、かな？ #違う #違う #違う
— 某ZR（ざんねん🙃） (@zr_tex8r) 2017年3月15日

“元の語形”を適切に設定できれば、あとはscsnowmanやtikzducksなどのパッケージを活用して素敵な文書（画像）を生成すればネタ⛄🦆が完成します。

TeXでLLMできない問題について

しかし、“LLM”については重大な問題があります。

“LLM”には“S”も“D”も含まれない😢

困りました😢 しかし、TeXのエコシステムにはscsnowmanやtikzducks以外にも有用なパッケージがイロイロ存在するはずです。tikzlingsの目次を見てみましょう。

“M”はいるけど“L”がいない😭

※marmot（マーモット）、mouse（ネズミ）、mole（モグラ）が“M”から始まる。

絶望的な状況になってしまいました😭

……あっ！😲

……これでいきましょう！🙃

LLM ＝ Leg-Lifting Mouse

TeXでLLMする実装について

方針が決まったので、やってみました。

[texllm.tex]

% 以下のコマンドで処理する
% tcspingif -e pdflatex -t 4 texllm.tex
\documentclass{standalone}
\usepackage{tikz,tikzlings-mice}
\usepackage{ifthen}
\pgfmathsetmacro{\vC}{\the\faStopTicks}
\newcommand*{\cDrawMice}[1]{%
  \node at (120,135) {\tikz[scale=80,xscale=-1]{\mouse[#1]}};
  \node at (360,135) {\tikz[scale=80]{\mouse[#1]}};
}
\begin{document}
\begin{tikzpicture}[x=1bp, y=1bp]
\fill[red!75!blue!20, use as bounding box]
  (0,0) rectangle (480,270);
\ifthenelse{\vC=1}{%
  \cDrawMice{leftstep}
}{\ifthenelse{\vC=3}{%
  \cDrawMice{rightstep}
}{%else (\vC=0, 2)
  \cDrawMice{}{}
}}
\end{tikzpicture}
\end{document}

このTeXソースをtcspingifを用いてGIFアニメ画像に変換します。

tcspingif -e pdflatex -t 4 texllm.tex

めでたしめでたし😊

まとめ

＊「このネタだとLaTeX😊をフツーに使っただけでTeX言語🤮要素がないじゃん」
ZR「しまった😲」

【ゆる募】お題#TeX #TeX言語 #春のTeX言語キャンペーン
※フツーの分量の記事1本で書けるやつ https://t.co/SQ7lkz7RwW
— 某ZR（ざんねん🙃） (@zr_tex8r) 2024年4月6日

というわけで、引き続きお題募集中です🙃

2024-03-23

実行中のTypstのバージョンを取得したい話

Typst

先週、Typstの新しいバージョンである0.11.0版[2024-03-15]がリリースされた。この版ではintrospection周りの機能に大きな仕様変更が行われている¹。

このレベルの仕様変更は久しぶり²であるが、ただしChangeLogの情報を見るとわかるように、Typstでは各回の改版において何らかの細かい非互換的変更（breaking change）が行われることが多い。Typstはまだ新しいベータ版のソフトウェアであるため、今のところは「ソフトウェアも仕様の知識も常に最新のものに更新していく」という雰囲気が強く感じられる。しかしTypstの普及がもっと進めば、パッケージ開発者の側で「今動作しているTypstのバージョンを取得してそれによってパッケージの動作を変更したい」という要望も生じてくることだろう。

そういうわけで、本記事では「実行中のTypstのバージョンを取得する方法」について解説する。

前提知識

Typstのプログラミングのキホン的な知識。

バージョン判定のフツーの方法

マニフェストで最小要求バージョンを指定する

プログラムコードをパッケージ³として扱う前提で、かつ「指定のバージョンに満たない場合はエラー終了する」という動作で十分である場合は、Typstのパッケージシステムの機能が使える。

パッケージのマニフェスト（typst.toml）にはcompilerという項目があり、これで「コンパイラ（Typst）の最小要求バージョン」を指定できる。例えば、以下のマニフェストは、当該のパッケージ（mypackage）がTypstの0.11.0版以降を要求することを宣言している。

[package]
name = "mypackage"
version = "1.0.0"
entrypoint = "lib.typ"
compiler = "0.11.0"

従って、mypackageを例えば0.10.0版のTypstで使おうとすると、パッケージ読込の時点でエラーが発生する。

error: package requires typst 0.11.0 or newer (current version is 0.10.0)
  ┌─ \\?\C:\tmp\main.typ:1:8
  │
1 │ #import "@local/mypackage:1.0.0"
  │         ^^^^^^^^^^^^^^^^^^^^^^^^

パッケージを前提とするなら、この方法が簡単であり、かつバージョン指定が“明示的”であるという点でも好ましいだろう。

sys.versionを利用する

パッケージシステムの機能が使える事例に該当しない場合はプログラム中でバージョンを取得するコードを自分で書く必要がある。例えば「バージョンが0.11.0以降か否かによって実行されるコードを変えたい」という場合を考える。つまり、以下のような使い方のできる関数v11-or-laterを実装したい。

if v11-or-later() {
  // 新しいやつ🙂(0.11.0版以降)
} else {
  // 古いやつ🙁(0.11.0版より前)
}

実は、Typstの0.9.0版[2023-10-31]以降にはまさに「実行中のコンパイラのバージョン」を表す定数sys.versionが用意されている。従って、0.9.0版以降を前提にしてよいなら話は簡単になる。sys.versionはversion型の値であり、version型の値は（フツーのsemver的な意味で）大小比較が可能なので、所望のv11-or-laterは以下のように実装できる。

// Typstのバージョンが0.11.0版以降であるか.
let v11-or-later() = {
  sys.version >= version(0, 11, 0)
}

※version(0, 11, 0)はversionのコンストラクタ呼出で「引数で指定した整数値をもつversion値」を生成する。

バージョン判定のアレな方法

sys.versionを使った方法は簡単であるが、当然ながら0.9.0版以降であることが前提になる。それより古いTypstではsys.versionが定義されていない（そもそもsysというモジュールが用意されていない）ので、上記のv11-or-laterを実行するとsysを参照しようとした時点でエラーになってしまう。

error: unknown variable: sys
  ┌─ \\?\C:\tmp\main.typ:4:2
  │
4 │   sys.version >= version(0, 11, 0)
  │   ^^^

もちろん、実際にバージョン取得の処理が必要になる頃には0.9.0版は既に“大昔のバージョン”で考慮⁴する必要がなくなっていそうから、実用上はほぼこれで問題がない可能性が高い。

それでも、ここでは敢えて「0.9.0版より前のバージョンでも安全に（エラーになることなく）実行できるバージョン取得」というアレな機能の実装を試みることにする。

※ただし先述の事情があるので、「0.9.0版より前の個別のバージョンの判別」は不要で「0.9.0版より前のものは単にそうであると判別できること」のみを要件とする。

アレしてみた

……というわけで、作ってみた。

let v11-or-later() = {
  if ("\u{2212}" in str(-1)
      or "B" not in str(numbering("\u{3042}A", 2, 1))) {
    // 上の2条件の何れかが成立なら0.9.0版以降なのでsys.versionが使用可能
    sys.version >= version(0, 11, 0)
  } else { // 0.9.0版より前なので偽を返す
    false
  }
}

もちろん上記のコードであればもっと簡単に以下のようにも書ける。

let v11-or-later-x() = {
  (("\u{2212}" in str(-1)
      or "B" not in str(numbering("\u{3042}A", 2, 1)))
      and sys.version >= version(0, 11, 0))
}

それはともかく重要なのは2・3行目に書かれている条件でこれは「コンパイラが0.9.0版以降であるか」を判定している。この2条件の何れかが成立していればほぼ間違いなく0.9.0版以降と判断してよいので、その条件下ではsys.versionを自由に使って「所望のバージョン判定」を実装できる⁵わけである。

以下では「この2つの条件がどこから出てきたのか」について解説する。基本的には「改版による仕様変更によって動作が変わる点を補足する」という方針に従っている。

第1条件

"\u{2212}" in str(-1)

この式は0.9.0版以降少なくとも現在最新の0.11.0版まではtrue、0.9.0版より前ではfalseになる。ChangeLogの0.9.0版の節に以下の項目がある。

The U+2212 MINUS SIGN is now used when displaying a numeric value, in the repr of any numeric value and to replace a normal hyphen in text mode when before a digit. This improves, in particular, how negative integer values are displayed in math mode.

str(-1)等の「負数を文字列に変換した結果」は0.9.0版より前では（他の多くのプログラミング言語と同様に）“-1”（U+002Dの後に“1”）であったが、0.9.0版以降では“−1”（U+2212の後に“1”）となる。恐らく数式で $-1$ と書いた結果と合わせるためであろう。このため「str(-1)の結果にU+2212が含まれるか」を調べることで0.9.0版以降か否かが判別できる。

このstrの仕様変更はちょうど0.9.0版で起こっているため、もしこの仕様が今後も維持されるのであればこれだけで目的の「0.9.0版以降か否かの判定」が完遂できるはずである。しかし自分の直感としてはこの仕様が将来変更される可能性⁶を捨てきれない。そこで“保険”をかけるために入れているのが第2条件である。

第2条件

"B" not in str(numbering("\u{3042}A", 2, 1))

この式は0.11.0版ではtrue（そして将来の版でもほぼ確実にtrue）、0.11.0版より前ではfalseになる。ChangeLogの0.11.0版の節に以下の項目がある。

Added support for contemporary Japanese numbering method

0.11.0版ではnumbering関数の書式文字列のカウンタ記号（counting symbol）として“あ”（ひらがなの五十音順）が追加された。つまり0.11.0版以降では以下のようになる。

numbering("あ）", 5) //==>"お）"

※参考記事：

Typstにおける番号付け指南：基本から高度なカスタマイズまで（zenn/mkpoli）
[打倒LaTeX !!] 生まれたての組版システム'Typst'の使い方と便利な機能を実装した話(2023.10)（zenn/taiiin02）

従って、numbering("\u{3042}A", 2, 1)という式の値は以下のようになる（なおU+3042は“あ”である）。

0.11.0版以降では"あA"は2つのカウンタ記号からなる書式と解釈されるので、2に“あ”、1に“A”が適用されて結果は"いA"となる。
0.11.0版より前では“あ”はカウンタ記号ではなく"あA"はカウンタ記号“A”に接頭辞が付いた書式と解釈されるので、2と1の両方に“A”が適用されて結果は"あBあA"となる⁷。

従って「結果に“B”が含まれない」こと⁸により0.11.0版以降であることを判定している。numbering関数は文書テンプレート作成者が常用する機能であるため、将来に「第2条件の式が再びfalseになる」ような仕様変更が入る可能性は極めて小さいと考えられる。従ってほぼ確実にこの式は「0.11.0版以降であるか否か」の判定に使えることになる。

合わせると

第1条件は0.9.0～0.11.0版でtrueになることが判っている。
第2条件は0.11.0版以降でtrueになることがほぼ確実である。
一方で、0.9.0版より前では第1条件も第2条件もfalseになることが判っている。

以上より、“第1条件 or 第2条件”とすることで「0.9.0版以降か否か」、すなわち「sys.versionを利用できるか否か」を判別できることになる。

バージョン判定のアレアレな方法

同様の手法、すなわち「改版による仕様変更により動作が変わる点を補足する」という方法を活用することで「Typstの（正式リリースの）全てのバージョンを判定する」ようなモジュールを作ってみた。

[Typst: To get the version of Typst in use]（Gist/zr-tex8r）

このtcversionモジュールは以下の値を提供する。

version：実行中のTypstのバージョンを表す整数の配列⁹。例えば、0.11.0版であれば(0, 11, 0)となる。

※もちろん0.9.0版以降である場合はsys.versionを見ているので将来のバージョンも正しく判定できる。

モジュールの使用例を示す。

#import "tcversion.typ"
This is Typst version
#tcversion.version.map(str).join(".");.

例えばこの文書を0.6.0版のTypstでコンパイルすると以下の出力が得られる。

まとめ

というわけで、皆さんは大昔のTypstのことはサッパリ忘れてフツーに新しいTypstを使っていきましょう！💁

ただし、互換性のために従来の仕様も残している（一部は非推奨の扱い）ので、これ自体は非互換的な変更ではない。↩
過去にあった同じレベルの変更というと、例えば0.8.0版[2023-09-13]の「type型の導入」が挙げられる。↩
公式レポジトリに登録するパッケージとローカルにインストールするパッケージの両方を含む。↩
もし考慮するにしても「そんな古いバージョンではエラー終了するのが妥当で、問題は単にエラーメッセージが的確でないくらいである」となる可能性が高いだろう。↩
Typstは“動的な言語”なので、たとえ非存在のsys.versionを参照するコードがあったとしても、それが実際に実行されない限りエラーにはならない。↩
少し仕様が変わっても対応できる可能性を増やすため==での完全一致判定でなくinでの部分一致判定を使っている。↩
numberingの書式文字列の仕様はかなりヤヤコシイがこの場合は接頭辞も反復される。↩
第1条件のときと同様に完全一致でなく部分一致で判定している。2に“A”が適用されて“B”が発生するか否かは「“あ”がカウンタ記号か否か」によって完全に決まると考えられるからである。↩
「version型」は0.9.0版で導入されたものでそれより前には存在しないので代わりに配列（array）を使っている。↩

2024-03-10

メモ：新しいLaTeXの文書プロパティ機能の現状

TeX

コレに関する話。

blog.wtsnjp.com

文書プロパティについて語りたい

この記事の説明（オリジナルのLaTeX Newsの内容もほぼ同じ）を読むと、文書プロパティ¹は従来の相互参照（\label／\ref）の機構を拡張するもので、しかも値を“展開可能”な方法で取得可能であると説明されている。これを見る限り、この新機能によって、長年TeX言語プログラマを悩ませてきた「ラベルに紐づく値を取得する確実な方法がない」という問題が解決されるように思える。

しかし実際にチョット調べてみたところ、少なくとも現状ではこの希望的観測は的外れで、実際には文書プロパティの機能は「ラベルに紐づく値の取得」には使えなかった（ざんねん🙃）、という話。

「ラベルに紐づく値の取得」が難しい

以下にLaTeXのフツーの相互参照を利用した文書を示す²。

\documentclass[a4paper]{article}
\begin{document}
\setcounter{section}{41}% 節番号を42から始める
\section{Duck}\label{sec:duck}% ラベルを付けた
Quack!
\section{Conclusion}
Section~\ref{sec:duck} (p.~\pageref{sec:duck}) is dull.
\end{document}

この文書ソース中で、\ref{sec:duck}は\label{sec:duck}を付与した節の番号、\pageref{sec:duck}は当該の節のあるページの番号を出力するために使われている。ここで注意すべきなのは、LaTeXの仕様としては\refと\pagerefはあくまで番号を「出力」する命令であり、番号を「取得」するための手段は用意されていない、ということである。

相互参照の使い方によっては単に番号を出力する以外の使い方をしたい場合もある。ここでは（極めて人工的な例であるが）次のような命令を実装することを考えてみよう。

\myRefSum{‹ラベル›}： ‹ラベル›に紐づくカウンタ³の番号（\ref{‹ラベル›}の値）とページ番号（\pageref{‹ラベル›}の値）の合計の値を出力する。

この命令を実装しようとすると、\refや\pagerefを単純に使って番号を出力するだけでは間に合わず、\refや\pagerefの値を（トークン列なり内部整数値なりの形で）取得する必要がある。しかしLaTeXの仕様ではそもそも値を取得するための手段が用意されていないので、結局、仕様に従う限りは実装は不可能になってしまう。

どうしても\myRefSumを実装したいのであれば「LaTeX カーネルの内部実装に依存するコードを書く」という強硬策に頼る⁴ことになるが、その場合でも現実問題として相互参照周りの内部実装は様々な要因⁵で変動しやすいため、「特定の仕様通りに確実に動作する」ようなコードを実装する（そして維持する）のは極めて困難なのである。

新機能で「ラベルに紐づく値の取得」ができたらよいのに

新しい文書プロパティ機能では\RefPropertyという展開可能な命令でプロパティの値を取得できる。

\RefProperty{‹ラベル›}{‹プロパティ›}：［展開可能］‹ラベル›に紐づくプロパティ‹プロパティ›の値。

プロパティを定義及び記録する命令⁶は従来の\label／\refとは別に存在するのであるが、一方で仕様書（ltproperties-doc.pdf）には次のようなことが書かれている。

カーネルで予めlabelとpageというプロパティが定義されている。
labelは従来の相互参照における\refの値（ラベルに紐づくカウンタ番号出力）に相当する。
pageは従来の相互参照における\pagerefの値（ラベルに紐づくページ番号出力）に相当する。
従来の\labelの「ラベル」はそのまま文書プロパティ機能における「ラベル」にもなる。

これを読む限りは、いかにも次のような仕組みになっていそうである。

\RefProperty{‹ラベル›}{label}により\ref{‹ラベル›}の値が取得できる。
\RefProperty{‹ラベル›}{page}により\pageref{‹ラベル›}の値が取得できる。

本当にそうなっているのか確かめてみよう。

\documentclass[a4paper]{article}
\begin{document}
\setcounter{section}{41}
\section{Duck}\label{sec:duck}
Quack!
\section{Conclusion}
label=\RefProperty{sec:duck}{label};
page=\RefProperty{sec:duck}{page}.
\end{document}

ありゃ、うまくいかない（ざんねん🙃）

値の部分にはプロパティの「既定値」が出力されている。どうやら、ラベルに紐づくプロパティの値が記録されていないようである。つまり、少なくとも現状の仕様においては、従来の\label命令では新機能のプロパティの値は記録されないようにみえる。

余談：値が取得できないなら警告すべきでは

先の文書のビルドの際には警告は出ないのであるが、取得するプロパティ値が記録されていないなら（従来の相互参照において指定した\labelが見つからない時と同様に）警告が出てほしい気がする。実は警告を出す命令は別にある。

\RefUndefinedWarn{‹ラベル›}{‹プロパティ›}：‹ラベル›に紐づくプロパティ‹プロパティ›の値が記録されていなければ警告を出す。

なぜ取得する命令\RefPropertyで警告を出さないのかというと、そうすると展開可能でなくなってしまうからである。\RefPropertyを使うプログラマが“適切なタイミング”で適宜\RefUndefinedWarnを実行する必要がある。

先の文書ソースの7行目に次のコードを追記する。

\RefUndefinedWarn{sec:duck}{label}
\RefUndefinedWarn{sec:duck}{page}

すると文書のビルド時に警告が出るようになる。

LaTeX Warning: Property `label' undefined for reference `sec:duck' on page 1 on
 input line 7.

LaTeX Warning: Property `page' undefined for reference `sec:duck' on page 1 on
input line 8.

やはりプロパティ値は記録されていないことが判明した。

どうにかして「ラベルに紐づく値の取得」してみる

当然であるが、「\labelを実行する際に新機能のプロパティの値を同時に記録するようにする」と\RefPropertyで値が取得できるようになる。例えば、以下のような命令\myLabelを定義してこれを\labelの代わりに使うという方法が考えられる。

※先述の通り相互参照と文書プロパティの「ラベル」は共通（名前空間を共有する）なので、同じ名前のラベルを両方に使うことはできない（ラベル重複になってしまう）。そのため、プロパティの方のラベルの名前には接頭辞（my/）を付けている。

%% \myLabel{<ラベル>}: 相互参照と文書プロパティの両方のラベルを置く.
% ※プロパティの方のラベルには"my/"の接頭辞を付ける.
\NewDocumentCommand\myLabel{m}{%
  \label{#1}% 相互参照のラベル配置
  \RecordProperties{my/#1}{label,page}% プロパティ記録
}

これにより\RefPropertyで値が実際に取得できるようになるので、今度は先述の\myRefSumの実装が可能になる。実際に\RefPropertyでの値の取得と\myRefSumの実行をする完全なコードを以下に示した。

※\intevalは整数式の計算をする命令。

\documentclass[a4paper]{article}
%% \myLabel{<ラベル>}: 相互参照と文書プロパティの両方のラベルを置く.
% ※プロパティの方のラベルには"my/"の接頭辞を付ける.
\NewDocumentCommand\myLabel{m}{%
  \label{#1}% 相互参照のラベル配置
  \RecordProperties{my/#1}{label,page}% プロパティ記録
}
%% \myRefSum{<ラベル>}: 例のアレ.
\NewDocumentCommand\myRefSum{m}{%
  % 値が記録されてなければ警告
  \RefUndefinedWarn{my/#1}{label}%
  \RefUndefinedWarn{my/#1}{page}%
  % 両方の値が記録されていれば合計値を出力する
  \IfPropertyRecordedTF{my/#1}{label}{%
    \IfPropertyRecordedTF{my/#1}{page}{%
      % 展開可能なので \inteval 中で使用可能
      \inteval{\RefProperty{my/#1}{label}%
               +\RefProperty{my/#1}{page}}%
    }{}%else
  }{}%else
}
\begin{document}
\setcounter{section}{41}
\section{Duck}\myLabel{sec:duck}
Quack!
\section{Conclusion}
% 番号を取得する例
label=\RefProperty{my/sec:duck}{label};
page=\RefProperty{my/sec:duck}{page}.\par
% \myRefSum の例
sum=\myRefSum{sec:duck}.
\end{document}

なぜこんな仕様なのか

仕様書（ltproperties-doc.pdf）に次のような記述がある。

Currently the code has nearly no impact on the main \label and \ref commands as too many external packages rely on the concrete implementation. There is one exception: the label names share the same namespace. That means that if both \label{ABC} and \RecordProperties{ABC}{page} are used there is a warning Label ‘ABC’ multiply defined.

（訳）
現状では、大本の\labelおよび\ref命令はこの［新機能実装の］コードの影響をほぼ受けない。外部パッケージでその具体的な実装に依存したものがあまりに多いからである。一つだけ例外がある：ラベルの名前は名前空間を共有している。つまり、\label{ABC}と\RecordProperties{ABC}{page}の両方を使うと、Label ‘ABC’ multiply definedの警告が発生する。

従来の相互参照と文書プロパティを「全く無関係な別個のもの」と位置付けるならば、両者でラベルの名前空間を共有するのは明らかに不合理なはずである。共有させているということは、恐らくLaTeXチームは「究極的には両者を統一したい」と考えているようにも思える。今は既存のパッケージの問題があって実現できていないようであるが、将来的には何か手を打つのがもしれない。

まとめ

とりあえず今のところは、ざんねん🙃（ざんねん🙃）

「文書プロパティ」はLaTeXの概念であり、PDFの「文書のプロパティ」とは無関係である。↩
相互参照を利用しているので、文書のビルドの際には2回タイプセットが必要である。以降の例の文書でも同様。↩
話を簡単にするため、当該のカウンタ（とページカウンタ）の表示書式は算用数字であることを仮定する。つまり、カウンタ番号のトークン列はカウンタ値の整数として通用する。↩
主に「\refや\pagerefの『実装において展開可能として動作する実行パス』を利用する」という方法と「相互参照情報を保存するマクロr@‹ラベル›を直接操作する」という2つの方法がある。↩
hyperref等のパッケージの読込によって実装が置き換わる。また、最近のLaTeXの改修でも相互参照周りの実装が変動していて、従来の実装が動作しないという不具合が発生している。↩
定義する命令が\NewPropertyで、記録する命令が\RecoedProperties。↩

2024-02-24

100万回ハローワールドするTeX言語的な方法

TeX

とあるプログラミング言語¹が超絶アレなためムシャクシャしたので、チョットTeX芸してみた。

[↓お題]

ループや再帰なしで100万回Hello, World!するには？ #ゆっくり解説ショート始めました。https://t.co/2tUpBoErLh pic.twitter.com/UFXdu7QyME
— えびま (@evima0) 2024年2月22日

[↓結果🙃]

想定はCみたいだけれど、関数型※（TeX言語🤮）ならこう書けるよ🤯
（1ページ53行（最終ページだけ49行）で18868ページ）
※諸説あります#TeX #TeX言語 #TeX芸人 pic.twitter.com/QV9T9Gqwmd
— 某ZR（ざんねん🙃） (@zr_tex8r) 2024年2月23日

※上記のプログラムはplain TeX用のものである。texコマンドでコンパイルするとDVIファイル、pdftexでコンパイルするとPDFファイルが得られる。以下、この記事で扱うコードはplain TeXを前提とする。

とりあえず

なるべくTeX言語特有の変態な方法を使う

という方向性にこだわってみた。

参考：フツー(?)の方法

なお、元ネタで使っている方針はもちろんTeX言語でも使える。TeX言語チョットデキル人であれば思いつくであろう²。

\let\z.\def~{\z}\def\y{\edef~{~~~~~~~~~~}}\y\y\y\y\y\y
\def\z{Hello world!\par}~\bye

※TeXを対話モードで使っていて「反復処理を書きたい」という場合に、このパターンを実際に使うことがたまにある。（TeXでループを書くのは面倒なので。）

変態な方法

{\catcode`\m=\active\gdefm{\hbox{Hello world!}$\par$}}
\mathcode`m="8000$\romannumeral1000000000\relax$\bye

ポイントは\romannumeral1000000000である。ローマ数字で“10億”を出力しようとしているが、（TeXの）ローマ数字で最大の数字は“m=1000”なので、結果的にTeXはこのコードをmを100万個並べた文字列に展開する。これでループ的な実行制御なしで“同じトークン100万個”を得ることに成功した🙃

ただしこのmのカテゴリコードは12³なので、このままでは“m”以外のテキストを出力するのには使えない。カテゴリコードが12の文字トークン⁴でマクロを実行させたい……となると、math-acriveを使うことが考えられる。

文字のmath codeを"8000に設定することを“math-active”という⁵。文字をmath-activeにすると、数式モード中で当該の文字の（カテゴリコードが11または12の）文字トークンが実行されたときに「代わりにその文字のアクティブ（カテゴリコード13）な文字トークンが実行される」という動作になる。標準のplain TeX（やLaTeX）では数式モード中での'の入力でプライム記号（\prime）が上添字として出力されるが、この挙動は'をmath-activeにすることで実現している。

今の場合はmの入力で“Hello world!”を出力させたいので、アクティブなmにマクロを定義した上で\mathcode`\m="8000を設定する。その上で、数式モードに入って\romannumeral1000000000を実行すればよいことになる。ただし数式モードに入るのは飽くまでmath-activeのためで文字列自体は非数式で出力したいなので\hboxを使う。さらに「数式モード中では改段落ができない」のを回避するために「一旦数式モードを終結してから改段落してまた数式モードに入る」という対策をとった。

まとめ

新しいテフライブが無事にリリースできるといいですね😊（まとめろ）

ただしTeX言語以外😲↩
先頭の\let\z.は「\zを（一時的に）展開不能にする」ために入れている。1行目を実行した時点で~の意味は「\zを100万個並べたもの」に展開されるマクロになる。↩
\romannumeralの展開結果は\the文字列なのでこのmのカテゴリコードは11ではなく12である。↩
e-TeXを前提するなら\scantokensを使うという手段もありそうだが、これは実際にやってみると\scantokensのバッファが100万文字に耐えられずに失敗した。↩
もしかしたら“math-active”はオレ用語なのかもしれない🙃↩

2024-02-11

Typstで“calc.abs(-8)”はメソッド呼出なのか

Typst

Typstのメソッド呼出を完全に理解する話

Typstの一部の型はメソッドをもつ。例えばarray型の値は自身の長さ（要素数）を取得するためのlen()メソッドをもっている。

#let ary = (1, 2, 3)
#ary.len() //==> 3

ここで注意すべきなのは、これはary,lenという（function型の）フィールドに関数呼出の括弧を付けたものではない、ということである。実際、array型の値aryにはary.lenというフィールドは存在しない¹。

#ary.len //--> error: cannot access fields on type array

Typstにおいてフィールドの参照とメソッドの参照が異なる概念であることはdictionary型をみればさらに明らかになる。以下の例をみてわかるように、フィールドとメソッドの空間は全く別になっている。

#let dict = (foo: calc.abs, len: 42)
#dict.len     //==>42
#dict.len()   //==>2
#dict.foo     //==>abs (function値の表示)
#dict.foo(-8) //-->error: type dictionary has no method `foo`
#dict.keys    //-->error: dictionary does not contain key "keys"
#dict.keys()  //==>("foo", "len")

ということは、Typstではval.name(...)という形²の式は「メソッド呼出」を表すものであり、これとval.nameの形の「フィールド参照」とは全く別のものである、といえそうである。もし「フィールドのfunction値を呼び出す式」を書きたいのなら、val.name(...)という“形式”を回避する必要があり、簡単な方法としてはval.nameの部分に括弧を付ければよい。

#(dict.foo)(-8) //==>8 ('calc.abs(-8)'の値)

“メソッド呼出の意味論”についてはTypstの公式のドキュメントに説明がある。

Scripting

すなわち、val.name(...)というメソッド呼出はtype(val).name(val, ...)と等価になる。先の例でdict.len()はtype(dict)がdictionary³であるので次の式と等価になり、これは実際に2を返す。

dictionary.len(dict)

Typstのメソッド呼出がなにもわからない話

ところで先のdictionaryの例でcalc.absという関数を使った。これは組込のcalcモジュール（module型の値⁴）に属している関数で、数値の絶対値を返すものである。通常はcalc.absに関数呼出の括弧を付けて使う。

#calc.abs(-8) //==>8

何の変哲もないコードであったはずだが、ここで先の考察を踏まえるとある疑問が湧いてくる。このcalc.abs(-8)というのは「メソッド呼出」なのであろうか？

この式はまさにval.name(...)という形なので形式の上ではメソッド呼出のはずである。ただし先のdictionaryやarrayの話と決定的に異なる点がある。calc.absは実際にcalcのフィールドとして存在するのである。これはcalc.absの部分に括弧を付けても呼び出せることからわかる。

#(calc.abs)(-8) //==>8

これを踏まえるとcalc.abs(-8)は「calc.absというフィールド値に関数呼出の括弧を付けた式」でありメソッド呼出でない気がしてくる🤔

やっぱりメソッド呼出でありそうな話

こういう関数を考える。

#let call-len(val) = val.len()

Typstは動的型の言語であるため、valの型は実行時にしか決まらない。もしここで、valにarrayの値とmoduleの値のどちらも受け付けるのであれば、val.len()という1つの式が成立する以上「calc.abs(-8)がary.len()とは異なる構文である」ということはありえないことになる。実際に確かめてみよう。

[mod.typ]（len()という関数をもつモジュール）

#let len() = 42

[main.typ]（このファイルを実行する）

#import "mod.typ"
#let call-len(val) = val.len()
#let ary = (1, 2, 3)
#let dict = (foo: calc.abs, len: 42)
#call-len(ary)   //==>3
#call-len(dict)  //==>2
#call-len(mod)   //==>42

“期待通り”の結果になった。ということは、やっぱりcalc.abs(-8)はメソッド呼出である……？🤔🤔

やっぱりメソッド呼出でなさそうな話

calc.abs(-8)がメソッド呼出であるなら、先ほど紹介した“メソッド呼出の意味論”を満たすはずである。つまり、type(calc)はmoduleであるからcalc.abs(-8)は以下と同値になる。

module.abs(calc, -8)

つまり、module（type値）にはmodule.absというフィールド⁵がありその値は「引数のモジュールのabsフィールドの関数を呼び出す」という役割をもった関数、ということになる。もちろんモジュール内の関数名には任意の識別子が使えるので、この理屈に従うと「moduleにはありとあらゆる名前のフィールドが定義されている」というオソロシイことになる。まあ論理的にありえない話ではないので、実際に確かめてみよう。

#module.abs           //-->error: type self does not contain field `abs`
#module.abs(calc, -8) //-->error: type self does not contain field `abs`

どうやらそんなオソロシイ話はなかったようである😊 でもこれだとやっぱりcalc.abs(-8)はメソッド呼出ではない……？🤔🤔🤔

Typstのメソッド呼出がチョットデキル話

なにもわからなくなったので、処理系の実装をみてみよう。

v0.10.0のソース：crates/typst/src/eval/call.rs（71行目）

詳細の説明は（メンドクサイので🙃）省くが、やはり、val.name(...)の形式の式の実行においてはvalの型によって解釈を変えているようである。

valの型がsymbol、function、type、moduleの何れかである場合⁶は、フィールドval.nameの値に対する関数呼出と解釈する。
それ以外の場合は先述の“メソッド呼出の意味論”に従う。

つまり結論としては：

val.name(...)はval.nameとは全く別の構文である。
しかしvalの型によって「メソッド呼出」になったり結局「val.nameの関数呼出」になったりする。
calc.abs(-8)は後者に該当するので「メソッド呼出」ではない。

まとめ

皆さん、そんな細かいことは一切気にせずに、どんどんTypstしましょう😃

そもそも、array型の値はフィールドを一切持っていない。↩
nameは単一の識別子に限るが、valの部分は任意の式でよい。↩
つまり、トップレベルでdictionaryとして定義されているtype型の値。↩
意外かもしれないがTypstではモジュールは第一級値（first-class value）である。↩
valがtype値である場合のval.name()は（module値であるときと同様に）フィールドのval.nameの関数呼出と同じ動作になる。例えばdictionary.lenというフィールドは実際に存在する。↩
本当はこの場合でもtype(val).nameのフィールドが存在する場合は“メソッド呼出の意味論”が優先されるようである。ただ型の性質を考える限り、この4つの型にメソッドが設定される可能性はほぼなさそうである。↩