ctb

一个用C++实现的 中文句法分析 工具包,采用的是中文宾州树库标准(Chinese Tree Bank),并提供源代码。 可以对原始的文档(GBK编码)进行自动繁简转换,分句,分词,词性标注,依存句法分析。 该句法分析工具采用了标准的图模型算法,即最大生成树算法(projective Maximum Spanning Tree)。该算法由Eisner于96年提出,复杂度为句子长度的三次方。详情可参见论文[1] 句法分析目前尚属于研究阶段,离实际应用还有很长的距离。其关...

相关文章

加载中

[博客] 宾州树库和CTB的Python预处理脚本

https://my.oschina.net/u/1410510/blog/1560824

本文由码农场同步,最新版本请查看原文:http://www.hankcs.com/nlp/ptb-ctb-python.html 在写句法分析器之前,通常需要将PTB和CTB预处理为:一行一个句子,单文件;符合规范比例的训练集/开...

2017/11/04 00:00

[博客] Cesium 生成terrain地形数据----CTB方式及步骤

https://my.oschina.net/u/4396877/blog/3523592

背景:项目前端使用Cesium,地形服务一直使用外网的,常常因为翻墙访问的问题,导致地形数据取不到,进而导致地球不能加载,故决定搭建自己的地形服务,彻底解决这个问题。博文包含以下几个过...

2019/05/26 00:00

[博客] 基于学习的编码(一):使用CNN进行环路滤波

https://my.oschina.net/u/3908734/blog/4556741

06/19 00:00

[博客] 编码块划分

https://my.oschina.net/u/3908734/blog/4556914

2019/05/10 00:00

[博客] 基于学习的编码(三):ACNNLF

https://my.oschina.net/u/3908734/blog/4542136

06/26 00:00

[博客] C++ 对象模型学习笔记五: 拷贝构造函数语义

https://my.oschina.net/u/4269669/blog/4284612

  测试验证编译器在什么情况下会帮助我们合成出拷贝构造函数,及编译器合成出来的拷贝构造函数又要干什么事情? 知识点 拷贝构造函数语义 在下面情况下,如果我们不写自己的拷贝构造函数,...

05/20 00:00

[博客] 【转】H.266 QTBT(Quadtree plus Binary Tree)块结构介绍

https://my.oschina.net/u/4402258/blog/3868789

联发科公司提出的QTBT块结构被JVET采纳,集成在JEM3.0及其后的版本中,替代了原来HEVC的四叉树(QT)块结构。QTBT与四叉树划分的主要区别: 1、QTBT块结构在四叉树的叶结点,继续往下做二叉树...

2018/08/12 00:00

[博客] 神经网络的parser源代码学习(一)

https://my.oschina.net/u/4384785/blog/4229405

一:源数据data文件夹。 进入data 目录,一共有以下几个文件: ctb_dev.jsonl:开发集 ctb_test.jsonl:测试文件,存放用于测试用的句子,存放格式如下所示:该句子对应的动作序列+该句子的分词...

2018/02/05 00:00

[博客] 环路滤波(五):SAO

https://my.oschina.net/u/3908734/blog/4556822

02/25 00:00

[博客] 分享开源Cesium地形制作工具

https://my.oschina.net/u/4599572/blog/4636746

07/14 00:00

[博客] Cesium 生成和加载离线地图

https://my.oschina.net/u/4296616/blog/3599319

[TOC] 操作过程 获取 DEM 地形文件 网上有多种公开的全球 DEM 地形数据,包括 GDEM、SRTM、DLR 等,也有很多下载渠道,就不一一列举了,感兴趣的朋友可以在参考资料里详细了解。我个人选择的...

2019/03/25 00:00

[博客] VVC环路滤波(一):ALF

https://my.oschina.net/u/3908734/blog/4556830

02/16 00:00

[博客] 使用Stanford Word Segmenter and Stanford Named Entity Recognizer (NER)实现中文命名实体识别

https://my.oschina.net/u/1042602/blog/692199

一、分词介绍 http://nlp.stanford.edu/software/segmenter.shtml 斯坦福大学的分词器,该系统需要JDK 1.8+,从上面链接中下载stanford-segmenter-2014-10-26,解压之后,如下图所示 ,进入d...

2016/06/15 00:00

[博客] fastHan: 基于BERT的中文NLP集成工具 - 知乎

https://my.oschina.net/u/4303989/blog/4308133

简介 fastHan是基于fastNLP与pytorch实现的中文自然语言处理工具,像spacy一样调用方便。 其内核为基于BERT的联合模型,其在13个语料库中进行训练,可处理中文分词、词性标注、依存句法分析、...

06/12 00:00

[博客] C++中const重载

https://my.oschina.net/u/7429/blog/807679

众所周知,C++实现函数重载有两种情况:函数参数的类型不同,参数的个数不同。而与函数的返回值没有什么关系。 需要注意的是在如下情况下: float f1(float a, float b){ } flaot f1(float a...

[博客] 复旦邱锡鹏团队最新成果fastHan:基于BERT的中文NLP集成工具

https://my.oschina.net/u/3267804/blog/4375571

谷歌开源“穷人版”摘要生成NLP模型:训练成本低,只要1000个样本就能打败人类 本文分享自微信公众号 - 相约机器人(xiangyuejiqiren)。 如有侵权,请联系 support@oschina.cn 删除。 本文参...

06/16 00:00

[博客] 因头文件顺序不正确引起的错误

https://my.oschina.net/u/177531/blog/120719

E:wxWidgets-2.8.12includewxmswwinundef.h||In function 'HWND CreateDialog(HINSTANCE, LPCTSTR, HWND, DLGPROC)':| E:wxWidgets-2.8.12includewxmswwinundef.h|39|error: cannot convert ...

2013/04/07 00:00

[博客] MySql行转列应用示范

https://my.oschina.net/u/1045414/blog/693652

最近在做一个系统时,因为商品有不确定个数的价格信息,因此将商品的价格信息做成了子表形式,而其中TypeID为1,2时分别代表成本价和标准零售价,这儿就需要吧这两个价格转化成行用于触发器中...

2016/06/17 00:00

[问答] 重读经典-《Effective C++》Item3:尽可能使用const

https://www.oschina.net/question/234345_42076

本博客(http://blog.csdn.net/livelylittlefish )贴出作者(三二一@小鱼)相关研究、学习内容所做的笔记,欢迎广大朋友指正! 1. const关键字 const可以修饰的对象分类 在class外部修饰glo...

2012/03/09 00:00

[博客] Lun4R-CyBRICSCTF wp

https://my.oschina.net/u/4416479/blog/4437774

和小伙伴们一起打了这个xctf|俄罗斯战队的比赛,题目质量真心不错hhh,部分题解小伙伴们还没更新,先发出来,嘻嘻。 WEB Hunt (Web, Baby, 50 pts) 打断点,然后就一个一个被抓住了... 接着F...

07/27 00:00
返回顶部
顶部