PDA

View Full Version : جستجو در تعداد زیادی فایل html



carbon
شنبه 30 شهریور 1387, 23:06 عصر
سلام
می خواستم بدونم آیا راهی وجود داره که بشه درون تعداد زیادی فایل HTML جستجو کرد. البته نه مثل کد خودم که بسیار کنده. به یه راهی مثل ایندکس کردن یا چیزی مثل اون.
یه چیزی مثل برنامه هایی که با کتابساز شتاب می سازن. کنار فایل ها یه فایلی با نام index.mdb می سازه. که البته من از ساختارش چیزی نفهمیدم.

با تشکر.

vcldeveloper
یک شنبه 31 شهریور 1387, 00:11 صبح
می خواستم بدونم آیا راهی وجود داره که بشه درون تعداد زیادی فایل HTML جستجو کرد.
خب یک راهش اینه که خودتون یک Indexer بنویسید که بطور پیوسته فایل های وجود در شاخه یا شاخه های خاص را پیمایش میکنه، و یک Index از کلمات و عبارات موجود در فایل های HTML موجود در اون شاخه ها میسازه تا بعدا بشه از طریق اون Index سریعتر در فایل های HTML موجود جستجو کرد.

راه دیگه اش استفاده از تکنولوژی های آماده هست. در ویندوز می تونید از MS Indexing Service استفاده کنید که وظیفه اش ایندکس کردن فایل ها ست.
غیر از این، کامپوننت های دیگه ایی هم توسط بعضی شرکت ها برای این کار نوشته شده، که من الان حضور ذهن ندارم، اسمشون رو بگم، ولی با یک جستجو ساده در اینترنت باید بتونید پیداشون کنید.



کنار فایل ها یه فایلی با نام index.mdb می سازه. که البته من از ساختارش چیزی نفهمیدم.
اگر MDB هست، پس احتمالا یک فایل بانک اطلاعاتی MS Access هست، و باید بتونید با برنامه Access راحت بازش کنید و داده های داخلش را ببینید.

carbon
سه شنبه 02 مهر 1387, 12:10 عصر
سلام و تشکر از پاسختون.
در مورد موقعیت فایل ها که فایلهام کم و زیاد نمیشه یعنی تعداد ثابت و فولدربندی ثابتی داره و باهاش مشکلی ندارم. به همین خاطر یک index ثابت خواهد داشت.

اما در مورد indexer نوشتن مشکلاتی دارم. یعنی هیچ تصوری ندارم. چند تا لینک یا مطلب اگه لطف کنید برای شروع ممنون میشم.

اون فایل mdb هم که گفتم میدونم access هستش ولی نمیدونم ساختارشو چه جوری ایجاد کرده.

در حال حاضر من میام فایل html رو به عنوان rtf یعنی توی یک richedit باز میکنم و با تابع find جستجو میکنم. و فایل بعدی و بعدی و الی آخر. به نظر خودم که خیلی اشتباه و باید از همون روش ایندکس استفاده کنم. درسته؟؟؟؟

بازم ممنون که وقت صرف جواب می کنید.