PDA

View Full Version : بهترین الگوریتم جستجوی ترکیبی متن با استفاده از الگو در دیتابیس



saeidd
دوشنبه 24 دی 1397, 21:38 عصر
سلام.
در دیتابیسی مثل SQlite که امکان FTS داره، امکانات مختلفی برای جستجوی ترکیبی وجود داره مثل وجود یک کلمه، عدم وجود یک کلمه، وجود یک عبارت، فاصله بین دو کلمه و ... .

حالا مساله اینه که اگه بخوایم این امکانات رو بصورت یک سری قوانین جستجو با استفاده از علائم در برنامه ارائه بدیم، برای تحلیل متن مورد جستجو بهترین الگوریتم چیه؟ مثلا فرض کنید که قوانین رو اینطور قرار بدیم: علامت + برای وجود کلمه، علامت - برای عدم وجود کلمه، علامت "" برای جستجوی عبارت و ... .

حالا مثلا کاربر این عبارت رو برای جستجو وارد کرده:
+محمد +علی -حسن +"فوتبال تماشا کردند"

این یعنی جستجو باید شامل رکوردهایی باشه که در اون فیلد متنی ما، هم کلمه محمد باشه، هم کلمه علی باشه، هم عبارت «فوتبال تماشا کردند» باشه و همچنین شامل کلمه حسن نباشه.

سوال اینه که اساسا چه الگوریتمها و روشهایی برای تحلیل متن وارد شده وجود داره و بهترین اونها کدومه؟

یوسف زالی
دوشنبه 24 دی 1397, 22:06 عصر
سلام
در مورد عبارات با قاعده جستجو کنید
Regular Expression
در یونیت RegEx

saeidd
سه شنبه 25 دی 1397, 09:22 صبح
سلام
در مورد عبارات با قاعده جستجو کنید
Regular Expression
در یونیت RegEx

آقای زالی عزیز ممنونم از شما. یک ساعتی جستجو کردم و صفحات زیادی رو خوندم. بحث عبارات با قاعده بحث پیچیده ایه و به این راحتی نمیشه ازش استفاده کرد. نمی دونم از کجا باید شروع کنم. خود شما یا دوستان دیگه ای که کار کردن می تونید عبارت با قاعده همین مثالی که در پست اول زدم رو برام بنویسید که بتونم با اون شروع کنم و تکمیلش کنم؟