Eine kurze Liste.
Mecab (C++)
http://mecab.sourceforge.net/
|
http://code.google.com/p/mecab/
Chasen
http://chasen-legacy.sourceforge.jp/
Cabocha
http://chasen.org/~taku/software/cabocha/
|
http://code.google.com/p/cabocha/
Japanese Dependency Analysis using Cascaded Chunking
Sen/GoSen (Java)
http://sourceforge.net/projects/itadaki/
lucene-gosen
http://code.google.com/p/lucene-gosen/
cmecab-java (JNI-binding für MeCab)
http://code.google.com/p/cmecab-java/
kuromoji (Java)
https://github.com/atilika/kuromoji
|
http://www.atilika.org/
igo (Java)
http://igo.sourceforge.jp/
Verfügbare Corpora
IPADIC (nicht mehr gepflegt)
http://sourceforge.jp/projects/ipadic/
NAIST Japanese Dictionary (IPADIC Nachfolger)
http://sourceforge.jp/projects/naist-jdic/
Unidic
https://www.tokuteicorpus.jp/dist/index.php
UniDic 近代文語 (basiert auf Unidic)
http://www.kokken.go.jp/lrc/index.php?UniDic%2F%B6%E1%C2%E5%CA%B8%B8%ECUniDic