使用cjieba(结巴分词库)实现php扩展中文分词-支持php5, php7
作者git地址:https://github.com/jonnywang/…
编译安装
git clone https://github.com/jonnywang/jz.git (php7) git clone https://github.com/jonnywang/phpjieba.git (php5) cd jz/cjieba make cd .. phpize ./configure --enable-jieba make make install 配置php.ini extension=jz.so jz.enable_jieba=1 jz.dict_path=/Users/xingqiba/data/softs/jz/cjieba/dict #指向jz库dict目录
使用
<?php $result = jz_jieba('小明硕士毕业于中国科学院计算所,后在日本京都大学深造'); print_r($result); $result = jz_jieba('小明硕士毕业于中国科学院计算所,后在日本京都大学深造', true, 6); print_r($result);
效果
Array ( [0] => 小明 [1] => 硕士 [2] => 毕业 [3] => 于 [4] => 中国 [5] => 科学 [6] => 学院 [7] => 科学院 [8] => 中国科学院 [9] => 计算 [10] => 计算所 [11] => , [12] => 后 [13] => 在 [14] => 日本 [15] => 京都 [16] => 大学 [17] => 日本京都大学 [18] => 深造 )
Array ( [0] => 计算所 [1] => 小明 [2] => 京都大学 [3] => 深造 [4] => 硕士 [5] => 中国科学院 )
欢迎您加入我们的专属QQ讨论群组① 233415606 ② 233415756
原文地址:https://segmentfault.com/a/1190000008734720
相关推荐
-
C++ 的脚本语言:ChaiScript c/c++
2019-3-29
-
const深度分析 c/c++
2019-9-11
-
c++快速排序算法 c/c++
2019-7-24
-
C语言指针专题——常见问题解答合集 c/c++
2019-3-30
-
超详细的排序算法讲解!一看就懂! c/c++
2020-6-15
-
C语言编译器不能帮你完成这项检查 c/c++
2019-3-29
-
C语言学习_内存分区 c/c++
2019-3-28
-
利用dxflib读写cad文件 c/c++
2019-3-29
-
基本数据结构 —— 堆以及堆排序(C++实现) c/c++
2019-8-9
-
【开发语言】PHP、Java、C语言的编译执行过程 c/c++
2019-3-30