From 63d471539fc3593f8b7eb309eadd984b7b1d2c16 Mon Sep 17 00:00:00 2001 From: Rongzhong Lian Date: Thu, 10 Aug 2017 20:52:33 +0800 Subject: [PATCH] add novel model --- model/README.md | 12 ++++++++++++ 1 file changed, 12 insertions(+) diff --git a/model/README.md b/model/README.md index b558a3a..dfaa900 100644 --- a/model/README.md +++ b/model/README.md @@ -25,3 +25,15 @@ * webpage_slda.model # Sentence-LDA模型参数, 存储格式为libSVM格式 * webpage_twe_lda.model # TWE模型参数, 二进制存储, 包括词向量与主题向量 * vocab_info.txt # 词表文件, 中文编码采用UTF-8 + +### 小说主题模型 + +使用百度万级别小说数据训练,词表规模243617,LDA模型主题数为500,SentenceLDA(SLDA)模型主题数为500。 +模型包括LDA、SentenceLDA(SLDA), Topical Word Embedding (TWE), 其中模型均存放于model/novel目录中 + + * lda.conf # LDA模型inference所需配置文件 + * slda.conf # Sentence-LDA模型inference所需配置文件 + * novel_lda.model # LDA模型参数, 存储格式为libSVM格式 + * novel_slda.model # Sentence-LDA模型参数, 存储格式为libSVM格式 + * novel_twe_lda.model # TWE模型参数, 二进制存储, 包括词向量与主题向量 + * vocab_info.txt # 词表文件, 中文编码采用UTF-8