自然言語処理研究者によって立ち上げられた、検索エンジンを開発する会社。 2007年8月から始められたベータテストにおいて、質問文などの文章の形式による入力に対して、ウィキペディアを加工して答えるサービスを公開した。2008年7月マイクロソフトに買収され、Live.com の検索エンジンの一部を受け持っている。
この記事内では圏論の概念・用語は使ってませんが、背景は圏論的です。-- 関数は関係の特別なものとみなせます。単葉で全域的な関係が関数です。この特徴付けは、圏論的には「関数は、関係の2-圏の左随伴1-射」と言えるのでした(「左随伴関係は関数」参照)。では、関係の2-圏の右随伴1-射は何でしょう? これは、随伴パートナーが転置で与えられることから簡単にわかります。関係の2-圏の右随伴1-射は弱分割関係(本文内で定義)です。弱分割関係も関係の特別なものですが、その“特別さ”は関数の“特別さ”と同等なものです。関数が重要な概念であるなら、弱分割関係も重要な概念のはずです。圏論/随伴の文脈を離れても、弱…
これの続き sugarknri.hatenablog.com何を埋めてないかぐっと睨まれると垢バレする気がするけど気にしないぜ401 主客転倒でO(√N) D - Sum of Divisors 凸包テクでO~(N^(1/3))になるらしい。1乗のときの解説はここ 凸関数に囲まれた領域の中の格子点の凸包の頂点を列挙する一般的なテク - 競プロをはじめた家事手伝いロボットのブログ402 定義からM(a,b,c)|gdc(f(1)-f(-1),f(2)-f(-2))であり、ある定数Xが存在してgdc(f(1)-f(-1),f(2)-f(-2))|Xなので、S(n)はn%Xごとにn/Xの3次式403…
今日偶然知ったことその 2。 GitHub の共同創業者 Tom Preston-Werner (@mojombo) と Chris Wanstrath (@defunkt) は GitHub を作る前に Powerset という検索エンジンの会社で働いていた Tom Preston-Werner and Chris Wanstrath worked at Powerset and left after the acquisition to found GitHub (also acquired by Microsoft).[15] LinkedIn のプロフィールを見た感じだと @mojom…
グラフの一種と考えられる組み合わせ構造〈combinatorial structure〉があるのですが、その構造の呼び名が安定してなてく困っています。nLab項目 semi-graph に従い、ここでは「半グラフ〈semi-graph〉」という呼称を採用します。様々な著者が半グラフを定義して使っているのですが、定義も用語もバラバラで、可視化した図形との関係の説明がまったくないか、あってもミスリーディングだったりします。僕が一番分かりやすいと感じたのは上記nLab項目です。nLab項目のもとになった定義は、ABC予想で有名な望月新一さんによるものです。なお、記事本文中では、望月新一さんを敬称なし…
「データベース:: テーブルのキーって何なのよ?」の続きです。データベース理論は数理科学の一分野だろうし、みずからそう標榜しています。しかしその割には曖昧だよなー、と僕は感じます。「定義や主張を論理式で書く」とか「命題とメタ命題を区別する」とか「構文論と意味論を区別する」とか、正確さ・明晰性の向上のためにやるべき事を(専門的論文以外では)あまりやってない印象です。通常の解説では、ハッキリした定義もないままに、曖昧な自然言語による印象や連想や雰囲気に頼った議論をしています。それじゃ、正確なコミュニケーションにはなりません。「データベース:: テーブルのキーって何なのよ?」を読んでもらえれば分かる…
2019年に「データベース:: 論理の使い所は」という記事を書きました。タイトルに「データベース::」という接頭辞を付けたのは、一連の記事を検索しやすくするためです。一連の記事とは、次の意図で書かれる“はずだった”記事です。 ちゃんと書こうと思うと億劫になるので、ふと思い立ったときに、データベースと論理に関するラフなメモ書きを残すことにします。 ところが、接頭辞「データベース::」が付いた記事は2019年の記事一本だけ。続きはありませんでした。最近(2023年6月)、「カーディナリティ〈多重度〉の“カラスの足”記法が分からない」という記事を書きました。この記事を書いた後で、「データベースに関連…
こんにちは!ノイです! 機械学習でクラス分類のモデルでラベル数が多くなってしまうことがあります。精度や学習時間が課題となることも多いので、記事にまとめました。 極端多ラベル分類 Extreme multi-label classification(極端多ラベル分類)は、非常に多数の可能なラベルを持つデータセットに対する機械学習のタスクです。通常、ラベル数は数千から数百万に及びます。 例えば、商品のタグ付け、音楽のジャンル分類、ニュース記事のトピック分類などが考えられます。これらのタスクでは、各データポイントは多数のラベルを持ち、それぞれのラベルに対して正確な予測を行う必要があります。 極端多ラ…