1.一般方法
function transgress_keyword($content){//定义处理违法关键字的方法 $keyword = array ('明日', '编程', '图书', '软件' );//定义敏感词 $m = 0; for($i = 0; $i < count ( $keyword ); $i ++) {//根据数组元素数量执行for循环 //应用substr_count检测文章的标题和内容中是否包含敏感词 if (substr_count ( $content, $keyword [$i] ) > 0) { $m ++; } } return $m; //返回变量值,根据变量值判断是否存在敏感词 if (transgress_keyword($_POST[title])> 0 || transgress_keyword($_POST[content])> 0 ) {//判断返回值大于0说明包含敏感词 echo "<script>alert('您输入的内容中含有敏感词'); history.back();</script>"; }
2.高效方法
效率对比(12688个字符,替换1次):
str_replace: 0.109937906265秒
strtr: 0.0306839942932秒
替换结果对比
比如:「张三」、「张三丰」、「张三丰田」 均为违禁词 (为何会有这样的区分?请参见 「法X」、「法Xgong」)
原文:「我今天开着张三丰田去上班 」
strtr:「我今天开着****去上班 」(四个词均替换为了*)
str_replace:「我今天开着**丰田去上班 」(仅仅替换了第一个匹配项)
所以使用str_replace替换,是不能本质上解决问题。
时间对比:
关键词数量:6712 (无重复)
<?php //badword.php $badword = array( '张三','张三丰','张三丰田'); ?> <?php //demo.php require('badword.php'); $badword1 =array_combine($badword,array_fill(0,count($badword),'*')); $bb = '我今天开着张三丰田上班'; $str = strtr($bb,$badword1); echo $str; ?>
测试结果:我今天开着*上班
分析:strtr函数比str_replace和正则的效率高。