主页 M

PHP过滤敏感词

2021-01-10 网页编程网 网页编程网

1.一般方法

function transgress_keyword($content){//定义处理违法关键字的方法
	$keyword = array ('明日', '编程', '图书', '软件' );//定义敏感词
	$m = 0;
	for($i = 0; $i < count ( $keyword ); $i ++) {//根据数组元素数量执行for循环
		//应用substr_count检测文章的标题和内容中是否包含敏感词
		if (substr_count ( $content, $keyword [$i] ) > 0) {
			$m ++;
		}
	}
	return $m;	//返回变量值,根据变量值判断是否存在敏感词
if (transgress_keyword($_POST[title])> 0 || transgress_keyword($_POST[content])> 0 ) {//判断返回值大于0说明包含敏感词
	echo "<script>alert('您输入的内容中含有敏感词'); history.back();</script>";
}

2.高效方法

效率对比(12688个字符,替换1次):

str_replace: 0.109937906265秒

strtr: 0.0306839942932秒

替换结果对比

比如:「张三」、「张三丰」、「张三丰田」 均为违禁词 (为何会有这样的区分?请参见 「法X」、「法Xgong」)

原文:「我今天开着张三丰田去上班 」

strtr:「我今天开着****去上班 」(四个词均替换为了*)

str_replace:「我今天开着**丰田去上班 」(仅仅替换了第一个匹配项)

所以使用str_replace替换,是不能本质上解决问题。

时间对比:

关键词数量:6712 (无重复)

<?php
//badword.php
$badword = array( '张三','张三丰','张三丰田');
?>
<?php
//demo.php
require('badword.php');
$badword1 =array_combine($badword,array_fill(0,count($badword),'*'));
$bb = '我今天开着张三丰田上班';
$str = strtr($bb,$badword1);
echo $str;
?>

测试结果:我今天开着*上班

分析:strtr函数比str_replace和正则的效率高。

阅读原文
阅读 3284
123 显示电脑版