为Lucene定制word2vec Word2vec-Lucene

Apache 2.0
Java 查看源码»
跨平台
2016-04-21
开源中国股瞎

word2vec(word to vector)是一个将单词转换成向量形式的工具,Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包,Word2vec-Lucene是用于将Lucene检索到的内容转换成向量形式的工具。

的码云指数为
超过 的项目
加载中

评论(0)

暂无评论

暂无资讯

暂无问答

学习笔记CB011:lucene搜索引擎库、IKAnalyzer中文切词工具、检索服务、查询索引、导流、word2vec

影视剧字幕聊天语料库特点,把影视剧说话内容一句一句以回车换行罗列三千多万条中国话,相邻第二句很可能是第一句最好回答。一个问句有很多种回答,可以根据相关程度以及历史聊天记录所有回答...

2018/04/21 09:25
21
0
Java实现中文word2vec

word2vec最早是google的一个开源项目,它通过对文本进行上下文分析,从而将词向量化,达到语义识别的目的。本文借助java开源深度学习引擎deeplearning4j和开源中文分词引擎ansj_seg实现java环...

2016/04/21 14:23
3.4K
5
word2vec原理推导与代码分析

本文摘录整编了一些理论介绍,推导了word2vec中的数学原理;并考察了一些常见的word2vec实现,评测其准确率等性能,最后分析了word2vec原版C代码;针对没有好用的Java实现的现状,移植了原版...

2016/07/21 12:37
62
1
Google开源的Deep-Learning项目word2vec处理中文

推荐word2Vec,说的非常强大、有意思。故找了篇文章看,分享下。 全文转自http://www.cnblogs.com/wowarsenal/p/3293586.html google最近新开放出word2vec项目,该项目使用deep-learning技术...

2016/06/15 11:03
28
0
Windows下使用Word2vec继续词向量训练

word2vec是Google在2013年提出的一款开源工具,其是一个Deep Learning(深度学习)模型(实际上该模型层次较浅,严格上还不能算是深层模型,如果word2vec上层再套一层与具体应用相关的输出层,...

2016/06/15 11:01
56
0
Windows下使用Word2vec继续词向量训练

word2vec是Google在2013年提出的一款开源工具,其是一个Deep Learning(深度学习)模型(实际上该模型层次较浅,严格上还不能算是深层模型,如果word2vec上层再套一层与具体应用相关的输出层,...

2016/06/15 10:59
58
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部