Eine kurze Liste.
- Mecab (C++) http://mecab.sourceforge.net/ | http://code.google.com/p/mecab/
- Chasen http://chasen-legacy.sourceforge.jp/
- Cabocha http://chasen.org/~taku/software/cabocha/ | http://code.google.com/p/cabocha/
Japanese Dependency Analysis using Cascaded Chunking - Sen/GoSen (Java) http://sourceforge.net/projects/itadaki/
- lucene-gosen http://code.google.com/p/lucene-gosen/
- cmecab-java (JNI-binding für MeCab) http://code.google.com/p/cmecab-java/
- kuromoji (Java) https://github.com/atilika/kuromoji | http://www.atilika.org/
- igo (Java) http://igo.sourceforge.jp/
Verfügbare Corpora
- IPADIC (nicht mehr gepflegt) http://sourceforge.jp/projects/ipadic/
- NAIST Japanese Dictionary (IPADIC Nachfolger) http://sourceforge.jp/projects/naist-jdic/
- Unidic https://www.tokuteicorpus.jp/dist/index.php
- UniDic 近代文語 (basiert auf Unidic) http://www.kokken.go.jp/lrc/index.php?UniDic%2F%B6%E1%C2%E5%CA%B8%B8%ECUniDic
Überblick
Inhalte