开源中国

我们不支持 IE 10 及以下版本浏览器

It appears you’re using an unsupported browser

为了获得更好的浏览体验,我们强烈建议您使用较新版本的 Chrome、 Firefox、 Safari 等,或者升级到最新版本的IE浏览器。 如果您使用的是 IE 11 或以上版本,请关闭“兼容性视图”。
Prose Go首页、文档和下载 - Go 语言文本处理库 - 开源中国社区
全部项目分类
我要评价
MIT
Google Go
跨平台
分享
收藏
45 人收藏
收录时间:2017-09-25
Prose Go 详细介绍

Prose 是一款用于Go 语言的文本处理库(主要是英文),支持 okenization(分词)、part-of-speech tagging(词性标注)、named-entity extraction(命名实体提取)等。 

安装

$ go get github.com/jdkato/prose/...

使用

Tokenizing

单词、句子和 regexp tokenizer 可用。 每个分词器实现相同的接口,这样可以轻松地在库的其他部分中自定义词语切分。

package main

import (
    "fmt"

    "github.com/jdkato/prose/tokenize"
)

func main() {
    text := "They'll save and invest more."
    tokenizer := tokenize.NewTreebankWordTokenizer()
    for _, word := range tokenizer.Tokenize(text) {
        // [They 'll save and invest more .]
        fmt.Println(word)
    }
}
Prose Go

选择将代码托管在码云
你还在等什么

可能是中国最大最好的代码托管平台


大家对 Prose Go 的评论 (全部 0 条评论)
{{repayCom.userName}}
顶部