开源中国

我们不支持 IE 10 及以下版本浏览器

It appears you’re using an unsupported browser

为了获得更好的浏览体验,我们强烈建议您使用较新版本的 Chrome、 Firefox、 Safari 等,或者升级到最新版本的IE浏览器。 如果您使用的是 IE 11 或以上版本,请关闭“兼容性视图”。
html2article-golang首页、文档和下载 - 基于文本密度的 html2article 实现 - 开源中国社区
全部项目分类
我要评价
未知
Google Go 查看源码»
跨平台
sundy-li
分享
收藏
3 人收藏
收录时间:2017-07-23
html2article-golang 详细介绍

html2article — 基于文本密度的html2article实现[golang]

Install

go get -u -v github.com/sundy-li/html2article

Performance

avg 3.2ms per article, accuracy >= 98% (对比其他开源实现,可能是目前最快的html2article实现,我们测试的数据集约3kw来自于微信公众号,各大类中文科技媒体历史文章,目前能达到98%以上准确率)

Examples

参考examples from_url.go

package main

import (
	"github.com/sundy-li/html2article"
)

func main() {
	article, err := html2article.FromUrl("https://www.leiphone.com/news/201602/DsiQtR6c1jCu7iwA.html")
	if err != nil {
		panic(err)
	}
	println("article title is =>", article.Title)
	println("article publishtime is =>", article.Publishtime)
	println("article content is =>", article.Content)
}

Algorithm

html2article-golang

选择将代码托管在码云
你还在等什么

可能是中国最大最好的代码托管平台


大家对 html2article-golang 的评论 (全部 0 条评论)
{{repayCom.userName}}
顶部