PDA

View Full Version : استفاده از Full Text Index برای فایلهای پی دی اف



حسین محمدی
پنج شنبه 12 اردیبهشت 1387, 15:22 عصر
با سلام

چگونه می توان در sql server فایلهای pdf را ایندکس گذاری کرد و بعد داخل متن آنها را جستجو کرد؟

AminSobati
پنج شنبه 12 اردیبهشت 1387, 18:18 عصر
دوست عزیزم،
این نوع فایلها باید در فیلد از نوع باینری ذخیره بشه (مثل Image یا varbinay max) و یک فیلد دیگه در جدول نیاز هست تا Extension اون فایل رو معرفی کنه (کاراکتر هست این فیلد). فرضا در یک رکورد ممکنه فایل Word داشته باشید که طبعا DOC ذخیره میشه و در رکورد بعدی شاید از نوع pdf باشه که در اون فیلد PDF ذخیره میشه. ادامه کار در Wizard ساخت Full Text Index مشخصه

حسین محمدی
شنبه 14 اردیبهشت 1387, 12:01 عصر
با تشکرمن جدول ودم را به این شکل ساخته ام
use library go
CREATE TABLE eBooks(eBook_AutoNo int primary key identity(1, 1), eBook_Extention varchar(5), eBookContent varbinary(max)) textimage_on libTextImageFileGroup
insert eBooks(eBook_Extention, eBookContent) select '.pdf', * from OPENROWSET(BULK 'D:\Book1.pdf', SINGLE_BLOB) AS X
exec sp_fulltext_database 'enable'
CREATE FULLTEXT CATALOG ftCatalog AS DEFAULT;
CREATE FULLTEXT INDEX ON dbo.eBooks(eBookContent TYPE COLUMN eBook_Extention) KEY INDEX [PK__eBooks__03317E3D] ON ftCatalogولی در جواب select خود هیچ رکوردی را نمی بینم
select * from eBooks where contains(eBookContent, 'Word');متن pdf من انگلیسی می باشد و کلماتی را که در آن وجود دارد را جستجو می کنم ولی هیچ موردی را پیدا نمی کند.

حسین محمدی
شنبه 14 اردیبهشت 1387, 12:31 عصر
نمی دانم سایت برنامه نویس چه مشکلی پیدا کرده که تمام کدهای من را در یک خط نشان می دهد. من برای اینکه همه کدها در یک خط قرار نگیرند آنها در چند کد قرار دادم.

AminSobati
یک شنبه 15 اردیبهشت 1387, 16:27 عصر
http://jtkane.spaces.live.com/Blog/cns!33DA9EBF0ACF8558!537.entry

حسین محمدی
سه شنبه 17 اردیبهشت 1387, 17:56 عصر
با تشکر

دستور زیر چه کار می کند؟



exec sp_fulltext_service 'clean_up'

AminSobati
جمعه 20 اردیبهشت 1387, 01:34 صبح
به نقل از Books Online:



Searches for and removes the full-text catalog resources in the file system that do not have corresponding entries in sysfulltextcatalogs.