php有没有检测输入的字符串是什么语言种类的方法?

Mike_shu 发布于 2017/03/01 09:15
阅读 271
收藏 0
PHP

比如用户输入:hello 那么就回一个 en (英文简写)
比如用户输入:你好,那么就返回一个 zh-cn (中文的简写)

还可以辨识:法文、日文、韩文、西班牙语、葡萄牙语 等等

有没有这样的  类库? 函数?  或者  php能不能先把输入字符进行unicode转码,比如输入泰文,然后泰文有一个区间范围这样子就知道他是泰文了,但是日文,韩文,中文是不是有些字符公用一个编码,这样子区间范围有没有用呀

不需要api  万分感谢!!!

加载中
0
宇润
宇润

我研究过识别字符串编码,如你所说日文,韩文,中文等等的编码是有冲突的,而且冲突的还挺多,包括常用文字。

网上查了,有人根据字符串中常用字出现频率,来做算法实现编码识别的。但是这种一定要求文字多,如果是单词可能识别不准。

下过notepad++的代码看过,好像也是类似的算法实现。

0
inuxor
inuxor

这个你看百度翻译就行了,单纯一两个单词没法准确判断是什么语言

inuxor
inuxor
回复 @Mike_shu : 如果样本大,兴许有这样的东西,然而估计不是一个类库就能解决的。得有各种语言的单词库才行。
M
Mike_shu
翻译的数据有每天都有几千行,所以看看有没有类可以实现
返回顶部
顶部