PDA

View Full Version : سوال: حذف تگ ها از یک فایل متنی



WebStarBushehr
پنج شنبه 20 مهر 1391, 14:27 عصر
سلام. من میخام تگ های HTML رو از یک فایل text حذف کنم. کسی میتونه بهم کمک کنه.

مثلا ورودی :
<html DIR="rtl">
<head>
<title> Sama Uni </title>
</head>
<body>
This is my text.
<hr color=red size=100 width=300 align=center>
line 1.
</body>
</html>

خروجی :

Sama Uni
This is my text.
line 1.

مسعود اقدسی فام
پنج شنبه 20 مهر 1391, 14:34 عصر
یه حلقه بساز. داخل متن با FirstIndexOf محل اولین < و > رو پیدا کن. اصولا دومی بعد از اولی می‌شه دیگه. اون فاصله رو پاک کن. چون داخل تگه. همینطور حلقه ادامه پیدا کنه تا جایی که دیگه این علامتا نباشن. یعنی اندیس ۱- بده.

البته دقت که که بعضی تگها نقش متنی هم دارن. مثلا br خط جدید می‌بره. یا p. در کل بعد الگوریتم بالا کل متن به هم می‌چسبه.

WebStarBushehr
پنج شنبه 20 مهر 1391, 15:01 عصر
تشکر. این رو نوشتم و جواب داد
int FirstChr=0;
int lastChr=0;
while (MainString.IndexOf("<") >= 0)
{
FirstChr = MainString.IndexOf("<");
lastChr = MainString.IndexOf(">");
MainString = MainString.Remove(FirstChr, lastChr - FirstChr + 1);
}

txt.Text = MainString;