نمایش نتایج 1 تا 5 از 5

نام تاپیک: مشکل در استخراج متن چندسطری با ریجکس

  1. #1
    کاربر دائمی آواتار samiasoft
    تاریخ عضویت
    مهر 1391
    محل زندگی
    اردبیل
    پست
    1,065
    تشکر کردن
    735
    327 بار تشکر شده در 275 پست

    مشکل در استخراج متن چندسطری با ریجکس

    سلام دوستان

    من همیشه برای استخراج متن موردنظر از لابه لای تگ ها از ریجکس استفاده میکردم اما در یک موردی به متن زیر برخورد کردم :

    <"content="استاد رائفی پور#دهمین_صراط#قسمت_دوم
    پیرامون #امام_هادی(علیه السلام)
    باب ورود به امام زمان از امام هادی است"/>

    میبنید که این چند سطری هست ...حالا ارایش ریجکس رو برای استخراج این متن به چه صورت بنویسیم؟

    اگر کل این در یک سطر بود با ارایش زیر میشد به راحتی استخراج کرد :
    content.*.>

  2. #2
    کاربر دائمی آواتار 336699
    تاریخ عضویت
    خرداد 1391
    محل زندگی
    ایران
    پست
    233
    تشکر کردن
    15
    92 بار تشکر شده در 81 پست

    نقل قول: مشکل در استخراج متن چندسطری با ریجکس

    سلام
    لینکی که این متن داخلش هست رو ارسال کنید تا بررسی شود
    البته استفاده از ریجکس برای استخراج متن از بین تگها زیاد جالب نیست.

  3. کاربرانی که به خاطر مطلب مفید 336699 از وی تشکر کرده‌اند:


  4. #3
    کاربر دائمی آواتار samiasoft
    تاریخ عضویت
    مهر 1391
    محل زندگی
    اردبیل
    پست
    1,065
    تشکر کردن
    735
    327 بار تشکر شده در 275 پست

    نقل قول: مشکل در استخراج متن چندسطری با ریجکس

    نقل قول نوشته شده توسط 336699 مشاهده تاپیک
    سلام
    لینکی که این متن داخلش هست رو ارسال کنید تا بررسی شود
    البته استفاده از ریجکس برای استخراج متن از بین تگها زیاد جالب نیست.
    ممنون از توجهتون...با ریجکس من درواقع استفاده خیلی زیادی کردم فقط همین مورد چندخطی رو مشکل دارم

    لینک که متن داخلشه از سورس سایت اپارات هست اما اگر در این متن این مورد روپیاده کنیم من جاهای دیگر هم مشکلم حل خواهد شد .

    فرض کنید متن بصورت زیر هست :


    You want to extract all lines from one starting pattern throughan ending pattern<h1> or from a starting line number up to an ending
    line number.
    A common example of this is extracting the first
    10 lines of a file (line numbers 1 to 10) or just
    the body of a mail<h2> message (everything past the blank line)


    حال میخواستم کل متن بین تگ <h1> تا <h2> را استخراج کنم. که تعداد سطر بین این دو تگ میتواند متغییر هم باشد.

    اگر بتونیم اینتر رو در متن به ریجکس شناسایی کنیم در واقع استفاده از \r\n ولی چطوری؟!

  5. #4
    کاربر دائمی آواتار 336699
    تاریخ عضویت
    خرداد 1391
    محل زندگی
    ایران
    پست
    233
    تشکر کردن
    15
    92 بار تشکر شده در 81 پست

    نقل قول: مشکل در استخراج متن چندسطری با ریجکس

    شما چرا از HAP استفاده نمی کنید؟

    http://html-agility-pack.net/

  6. کاربرانی که به خاطر مطلب مفید 336699 از وی تشکر کرده‌اند:


  7. #5
    مدیر بخش آواتار danialafshari
    تاریخ عضویت
    تیر 1387
    محل زندگی
    هر کجا هستم باشم آسمان مال من است
    پست
    2,684
    تشکر کردن
    152
    1,788 بار تشکر شده در 1,320 پست

    نقل قول: مشکل در استخراج متن چندسطری با ریجکس

    نقل قول نوشته شده توسط samiasoft مشاهده تاپیک
    ممنون از توجهتون...با ریجکس من درواقع استفاده خیلی زیادی کردم فقط همین مورد چندخطی رو مشکل دارم

    لینک که متن داخلشه از سورس سایت اپارات هست اما اگر در این متن این مورد روپیاده کنیم من جاهای دیگر هم مشکلم حل خواهد شد .

    فرض کنید متن بصورت زیر هست :


    You want to extract all lines from one starting pattern throughan ending pattern<h1> or from a starting line number up to an ending
    line number.
    A common example of this is extracting the first
    10 lines of a file (line numbers 1 to 10) or just
    the body of a mail<h2> message (everything past the blank line)


    حال میخواستم کل متن بین تگ <h1> تا <h2> را استخراج کنم. که تعداد سطر بین این دو تگ میتواند متغییر هم باشد.

    اگر بتونیم اینتر رو در متن به ریجکس شناسایی کنیم در واقع استفاده از \r\n ولی چطوری؟!
    با سلام
                MatchCollection mc = Regex.Matches(textBox1.Text, "<h1>(?<TagText>.*?)<h2>", RegexOptions.Singleline);
    foreach (Match m in mc)
    {
    MessageBox.Show(m.Groups["TagText"].Value);
    }

    موفق باشید
    لطفاً از پرسیدن سوال در خصوصی خودداری کنید.
    قبل از ایجاد تاپیک، حتماً قوانین سایت را مطالعه فرمایید.
    قوانین پرسش های دانشجویی
    برای درست وارد شدن کد در قالب C#‎‎‎ سایت، ابتدا کد رو درون Notepad.exe کپی سپس از اونجا به سایت در قالب C#‎‎‎ منتفل کنید
    نرم افزار code manager دستیار برنامه نویسان جهت نگهداری کد ها

  8. کاربرانی که به خاطر مطلب مفید danialafshari از وی تشکر کرده‌اند:


تاپیک های مشابه

  1. سوال: مشکل در استخراج متن از doc
    نوشته شده توسط niloofar13 در بخش C#‎‎
    پاسخ: 1
    آخرین پست: سه شنبه 14 مرداد 1393, 13:40 عصر
  2. سوال: مشکل در ذخیره متن فارسی با ادیتور tinymce - فوررررری!!! plz
    نوشته شده توسط eniac_4 در بخش ASP.NET
    پاسخ: 4
    آخرین پست: دوشنبه 23 تیر 1393, 08:47 صبح
  3. سوال: مشكل در export متن فارسي با استفاده ازReport Viewer در asp.net
    نوشته شده توسط gloria-2008 در بخش ابزارهای گزارش سازی
    پاسخ: 1
    آخرین پست: دوشنبه 12 تیر 1391, 13:50 عصر
  4. سوال: مشکل در ارسال متن طولانی با KylixSMS
    نوشته شده توسط شهرياري در بخش کامپوننت های سایر شرکت ها، و توسعه کامپوننت
    پاسخ: 1
    آخرین پست: سه شنبه 17 آبان 1390, 14:09 عصر
  5. سوال: مشکل در export کردن CrystalReport با متن فارسی
    نوشته شده توسط Alt+F4 در بخش گزارش سازی با Crystal Report
    پاسخ: 1
    آخرین پست: شنبه 21 شهریور 1388, 11:39 صبح

قوانین ایجاد تاپیک در تالار

  • شما نمی توانید تاپیک جدید ایجاد کنید
  • شما نمی توانید به تاپیک ها پاسخ دهید
  • شما نمی توانید ضمیمه ارسال کنید
  • شما نمی توانید پاسخ هایتان را ویرایش کنید
  •