MeCab

このタグでブログを書く

言葉の解説

ネットで話題

MeCab

(コンピュータ)

【めかぶ】

日本語の形態素解析器。
同機能を持つChaSenの3-4倍はやい。
また、はてなキーワードの抽出をTRIE を使って1600倍早くするPerl(&C++)スクリプトを公開している。
http://chasen.org/~taku/blog/archives/2005/09/post_812.html
近頃ではMysqlの全文検索ソフトSennaへの組み込みや、
作者の工藤氏によるAJAXによる日本語変換など、何かと話題になることが多い。

このタグの解説について

この解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

約束の地•2年前

Apple Silicon の Mac で MeCab の出力が文字化けするようになったときの対応

現象 $ mecab 隣の客はよく柿喰う客だ。隣 ̾��,��,*,*,*,*,* の ̾��,��,*,*,*,*,* 客 ̾��,��,*,*,*,*,* はよく ̾��,��,*,*,*,*,* 柿喰 ̾��,��,*,*,*,*,* う ̾��,��,*,*,*,*,* 客 ̾��,��,*,*,*,*,* だ ̾��,��,*,*,*,*,* 。 ̾��,��³,*,*,*,*,* EOS 結論一回 MeCab をアンインストールして、インストールし直す。具体的な方法アンインストール方法依存関係があるので辞書からアンインストールする*…

#MeCab

ネットで話題

1061ブックマーク日本語形態素解析の裏側を覗く！MeCab はどのように形態素解析しているか - クックパッド開発者ブログ

techlife.cookpad.com

603ブックマーク MeCab: Yet Another Part-of-Speech and Morphological Analyzer(形態素解析エンジン)MeCab に至るまでの形態素解析器開発の歴史等はこちらをご覧くださいメーリングリスト一般ユーザ向けメーリングリスト開発者向けメーリングリスト新着情報 2008-02-03 MeCab 0.97 マルチスレッド環境で辞書を開くときの排他制御がうまくいっていなかったバグの修正 Windows版でインストール時に辞書の文字コードを指...

mecab.sourceforge.net

597ブックマーク形態素解析エンジンMeCabにて文章中から短歌を抽出 - inaniwa3's blog

inaniwa3.hatenablog.com

453ブックマーク新形態素解析器JUMAN++を触ってみたけど思ったより高精度でMeCabから乗り換えようかと思った話

qiita.com

450ブックマーク Pythonでつくる検索エンジン(Webクローラ, Mecab, MongoDB, Flask) - c-bata web

nwpct1.hatenablog.com

424ブックマークきまぐれ日記: MeCabがiPhone,OSXに載っていると言うのは止めようと思う iPhoneのSDKの条項に変更が加わり、Flashのクロスコンパイルを含む純正開発ツール以外で作成されたバイナリの配布が禁止となるようです。世間でも散々言われていますが、この変更は正直とても残念です。 Apple的には「製品のクオリティーが保てないから」という理由だそうですが、 Windows版iTunesが意味もなくQuickTi...

chasen.org

375ブックマーク MeCabの辞書にはてなキーワードを追加しよう - 不可視点

code46.hatenablog.com

368ブックマーク [O] MeCab 用の新語辞書 mecab-ipadic-neologd を公開しました MeCab 用の新語辞書 mecab-ipadic-neologd を公開しました Tweet [NLP] 日本語の文書を機械的に処理しようと思った時に、ほとんどの人が MeCabとIPADIC(IPA辞書)の両方、または、どちらかを使うことになります。 IPADICはとてもよく出来ていますが、更新されないまま年月が過ぎているので、例えば2015年3月上旬に急に流...

diary.overlasting.net

246ブックマーク AWS、PythonでMeCabを使う際の語彙データを無料公開 | Ledge.ai

ledge.ai

関連ブログ

約束の地•2年前

MeCab の辞書をビルドするときに文字コードが euc-jp になってしまう場合の対処方法

結論 mecab-ipadic-2.7.0-20070801 を --with-charset=utf8 のオプション付きでビルドする。 $ ./configure --with-charset=utf8 Natto で確認する期待通りの挙動になっているかを Natto で確認します。 > require 'natto' > nm = Natto::MeCab.new => #<Natto::MeCab:0x00007f2546c63280 @model=#<FFI::Pointer address=0x0000561020b78620>, @tagger=#<FFI::Pointer ad…

#MeCab#Natto

ミシシッピ川以東のルイジアナ•2年前

MeCab で形態素解析をしよう、あとゴママヨ

はじめにこの記事は UEC Advent Calendar 2023 10日目になります。 9日目はへるくんさんの「免許合宿に行きました」でした。 helkun.dev さらに、免許取得したら色んな場所に行きやすくなり、フットワークが軽くなります。世界は広いと実感させられます。これはかなり真で、普通自動車を運転できることで人類が到達可能な陸地の99%に行けるようになり、さらに限界旅行の手段が格段に増えることが一般に知られている。したがって人類は軽率に普通運転免許を取得し、努めて移動などをするべきです。また、 UEC 2 Advent Calendar 2023 9日目の記事はこうくんの「…

#自然言語処理#形態素解析#MeCab#C++

さみっとの部屋•3年前

Lambdaで形態素解析をする

最近業務でAWSを触ることが多く、その中で形態素解析をする機会があったので、その際の内容を備忘録として残しておきます。やったこと手順手順詳細参考やったこと AWSのサービスを使い、ファイルがS3に置かれたら自動で形態素解析ができるようなシステムを作るサービスとして、今回はLambdaを採用した形態素解析ツールとしてMeCabを利用する手順今回実装した大まかな手順は以下になります EC2インスタンスを作成し、SSH接続をする EC2インスタンス上にDockerとAWS CLIをインストールする EC2インスタンス上でDockerfile、requirements.txt、lam…

#AWS#形態素解析#MeCab

PyDocument•3年前

PythonとMeCabを使って日本語の形態素解析を行う方法

Pythonで自然言語処理を行うためには、MeCabと呼ばれる形態素解析器を使用することができます。MeCabは日本語のテキストを単語や品詞などの形態素に分解することができ、Pythonから簡単に利用することができます。本記事では、MeCabを使った日本語の形態素解析の方法を具体的な例とコードを交えて説明します。 MeCabのインストール Macの場合 Windowsの場合 1. MeCabのインストール 2. 辞書のインストール Pythonライブラリのインストール Macの場合 Windowsの場合解析の準備形態素解析の実行具体例よく発生するエラーと対応法 MeCabをインストール…

#Python#自然言語処理#形態素解析#MeCab

keep-loving-pythonのブログ•3年前

解決策。MeCabのRuntimeError（Windowsでのpythonにて）

MeCabのRuntimeError（Windowsでのpythonにて）エラー内容環境解決策その前にコメント MeCabのRuntimeError（Windowsでのpythonにて）エラー内容 _MeCab.Tagger_swiginit(self, _MeCab.new_Tagger(*args)) RuntimeError 詳細 Traceback (most recent call last): File "mecab_test.py", line 6, in <module> mecab = MeCab.Tagger("-O chasen -d /var/lib/mec…

#MeCab#RuntimeError

Frqux’s Laboratory•3年前

単語に飽きたら、文書を愛そう！？Doc2Vecによる文書表現の解説

こんにちは。ふらうです。今回、Doc2Vecというものに触れていきたいと思います。使用環境 OS Windows 10 Home Anaconda（windows） Python 3.7.16 CPU Intel(R) Core(TM) i9-10900 CPU @ 2.80GHz 2.80 GHz GPU NVIDIA Geforce RTX 3070 メモリ 32GB gensim 3.8.3 Doc2Vecとは Doc2Vecの2種類のアーキテクチャ PV-DM（Distributed memory Model of Paragraph Vectors） PV-DBOW（Distri…

#機械学習#深層学習#自然言語処理#機械学習システム#MeCab

空飛ぶチンアナゴの統計解析日記•4年前

RMeCabをMacで使いたいという話

RMeCabをMac、しかもUTF-8環境で使いたいという条件で色々やって大変だったので、過程をメモしておきます。ついでにcondaをメインで使っている都合上、Homebrewはインストールしないものとして環境を構築します。また、前提としてXcodeからコンパイラーはインストールされているものとします。さらにインストールするMeCabは本体が「mecab-0.996.tar.gz」、辞書が「mecab-ipadic-2.7.0-20070801.tar.gz」とします。 MeCabのインストール 1. MeCabのダウンロードとインストール 2. 辞書のインストール事前にnkfコマンドを…

#R#RMeCab#MeCab

京橋のバイオインフォマティシャンの日常•4年前

R環境で小説のテキストマイニングをやってみたら、○○○な結末になった件【その2: 形態素解析と辞書設定】

はじめに: 『R環境で小説のテキストマイニング』の連載シリーズです。連載シリーズの目次実行環境形態素解析と辞書設定 mecabを使った形態素解析 MeCabの辞書設定辞書による形態素解析結果の違いデフォルトのipadic辞書を使った場合 neologd辞書を使った場合 unidic辞書を使った場合 jumandic辞書を使った場合 RMeCabで辞書設定を変更する方法 RMeCab形態素解析 + neologd辞書を用いた「坊ちゃん」の第1章テキストの形態素解析 RMeCab形態素解析 + neologd辞書を用いた「坊ちゃん」の第2章以降のテキストの形態素解析まとめテキスト処理…

#テキストマイニング#テキスト解析#MeCab#RMeCab#自然言語処理

CUEBiC TEC BLOG•4年前

MeCabで形態素解析すれば品名の表記が異なっても一向にかまわんッッ

はじめまして。キュービックでWebエンジニアを担当しているthと申します。本年（2022年）は梅雨をすっ飛ばして突然真夏に突入してしまいましたが、みなさんいかがお過ごしでしょうか。背景・概要さて、早速ですが今回のお話の概要です。複数のECサイトにて販売されている商品を一つのサイトにまとめて掲載する、いわゆる「価格比較サイト」のようなサービスの展開を検討しました。このときに、各ECサイトにてJANコードのような商品が一意に識別できるIDが付与（掲載）されていればそれを元に「同一商品である」と簡単にみなすことができますが、サイトによって付与されているIDがまちまち、またはそもそも掲載され…

#形態素解析#MeCab