PDA

View Full Version : پیدا کردن کلمات کلیدی در متن فارسی ؟



saeedvir
دوشنبه 17 اسفند 1394, 12:30 عصر
با سلام ، این تابع برای جملات انگلیسی به خوبی جواب میده ، ولی برای جملات فارسی نه ،
میشه کمک کنید تا بشه برای جملات فارسی هم استفاده کرد ؟


<meta charset="utf-8"><?phpfunction extract_keywords($str, $minWordLen = 3, $minWordOccurrences = 2, $asArray = false){ function keyword_count_sort($first, $sec) { return $sec[1] - $first[1]; } $str = preg_replace('/[^\p{L}0-9 ]/', ' ', $str); $str = trim(preg_replace('/\s+/', ' ', $str)); $words = explode(' ', $str); $keywords = array(); while(($c_word = array_shift($words)) !== null) { if(strlen($c_word) < $minWordLen) continue; $c_word = strtolower($c_word); if(array_key_exists($c_word, $keywords)) $keywords[$c_word][1]++; else $keywords[$c_word] = array($c_word, 1); } usort($keywords, 'keyword_count_sort'); $final_keywords = array(); foreach($keywords as $keyword_det) { if($keyword_det[1] < $minWordOccurrences) break; array_push($final_keywords, $keyword_det[0]); } return $asArray ? $final_keywords : implode(', ', $final_keywords);} //How to use //Basic lorem ipsum text to extract the keywords$text = "لورم ایپسوم یا طرح‌نما به متنی آزمایشی و بی‌معنی در صنعت چاپ، صفحه‌آرایی و طراحی گرافیک گفته می‌شود. طراح گرافیک از این متن به عنوان عنصری از ترکیب بندی برای پر کردن صفحه و ارایه اولیه شکل ظاهری و کلی طرح سفارش گرفته شده استفاده می نماید، تا از نظر گرافیکی نشانگر چگونگی نوع و اندازه فونت و ظاهر متن باشد. ";
echo extract_keywords($text);?>

saeedvir
چهارشنبه 19 اسفند 1394, 04:10 صبح
دوستان کسی نظری نداره ؟