ELUTE/zh-hant
出自Taipedia
Essential libraries and utilities of text engineering. 採用 SRILM 與 中文維基百科語料 製作的雙元語言模型,支援:
- 中文斷詞 (C# 與 C++ 版),
- 雙元詞語式 (而非單字詞或單元詞語式) 簡繁轉換 (C#),
- 音節/字根轉漢字 (C# 與 C++ 版),及
- 漢字轉音節/字根 (C# 與 Python 版)。
目錄 |
[編輯] 專案網站
[編輯] 文件
[編輯] 中文
- Bi-gram 中文應用範例:以 C# 實作
- Bi-gram 中文應用範例:虛擬碼
- Bi-gram 中文應用範例:Language model 的授權問題
- Bi-gram 中文應用範例:Maximum Likelihood Estimation 演算法流程圖
[編輯] 英文