《PHP去掉文章內容中的所有外鏈并允許部分鏈接存在》要點:
本文介紹了PHP去掉文章內容中的所有外鏈并允許部分鏈接存在,希望對您有用。如果有疑問,可以聯系我們。
相關主題:PHP開發
分享一個很實用的自定義函數,這個函數的功能是把文章內容中所有的外鏈清除掉,并允許保留部分指定的鏈接。
函數非常實用,以后采集或COPY文章,不必再擔心其中的鏈接了。
調用方法:echo replaceLinks( $str, array('www.fzlkiss.com') );
本函數已實用了很長一段時間,相當穩定。只要是localhost本地地址或非允許的鏈接,全部刪除
注意:
1、函數中Config('allowUrls');是維易PHP配置項允許的外鏈,是數組形式。需要換成你自己的。
2、函數中有Config('top_domain')是頂級域名,也需要換成你自己的,比如vephp.com這樣的頂級域名。
函數代碼:
/** * 文章外鏈處理:刪除非站內的外部鏈接 echo replaceLinks( $str, array('www.fzlkiss.com') ); * @param string $content 內容 * @param array/string $allowUrls 允許的超鏈接:一般在系統配置項 allowUrls 中可以設置,也可以臨時用本參數傳遞要容許的鏈接地址或域名 * 只有一個域名時,可以直接用字串傳參。 * @return string **/ function replaceLinks( &$content, $allowUrls=array() ) { $cfgAllowUrl = Config('allowUrls'); #換成你的配置項 if(!empty($allowUrls) && !is_array($allowUrls)) $allowUrls = (array)$allowUrls; if(!empty($cfgAllowUrl)){ $allowUrls = array_merge($cfgAllowUrl, $allowUrls); } foreach ($allowUrls as $k=>$link){ $allowUrls[$k]=preg_quote($link,'#'); //避免組合成字串后,其中的“|”也被轉義 } $allowUrlList = join('|', $allowUrls); $allowUrlList = preg_replace("#[\n\r]#", '', $allowUrlList); $selfDomain = parse_url(SITE); //允許自己站內鏈接 $selfDomain = $selfDomain['host']; $topDomain = $selfDomain=='localhost' ? '' : (!empty(Config('top_domain')) ? Config('top_domain') : getTopDomain($selfDomain)); //localhost 或 vephp.com if(!empty($topDomain) && stripos($allowUrlList,$topDomain)===false) { $allowUrlList .= (empty($allowUrlList)? '' : '|') . preg_quote($topDomain,'#'); } preg_match_all("#<a [^>]*href\s*=\s*[\"']?([^'\"]+)[\"']?[^>]*>(.*?)<\/a>#is", $content, $arr); if( is_array($arr[0]) ) { $rparr = $tgarr = array(); foreach($arr[0] as $i=>$link) { if (substr($arr[1][$i],0,2)=='./' || substr($arr[1][$i],0,3)=='../' || substr($arr[1][$i],0,1)=='/') continue; //內鏈 if( empty($allowUrlList) || !preg_match( '#(?:'.$allowUrlList.')#is', $arr[1][$i]) ) { //檢查是否為允許的鏈接 $rparr[] = $link; $tgarr[] = $arr[2][$i]; } } if( !empty($rparr) ) $content = str_replace($rparr, $tgarr, $content); } unset($arr,$rparr,$tgarr); return $content; }