结巴分词在hadoop平台怎么使用?

a1064328629 发布于 2013/09/12 20:40
阅读 334
收藏 0

@sunjunyi 你好,想跟你请教个问题:

    首先感谢您写的结巴分词程序,很好很强大。

    不过,我现在遇到一个问题。我需要借助别人的hadoop平台来运行一个任务,其中涉及到中文分词。这个平台可以通过hadoop流的方式运行python程序。可,我没有权限在平台上安装结巴分词。所以,我想到了把结巴分词打包,通过zipimport来引用,可牵扯到dict.txt的路径,我现在没法通过zip的文件形式来使用结巴分词。所以,希望您能给我提示一下,怎么办?

   谢谢

加载中
返回顶部
顶部