PDA

View Full Version : حذف اطلاعات اضافی متن کپی شده از سند word



morteza_mokhtari
چهارشنبه 25 بهمن 1391, 21:39 عصر
سلام دوستان بنده تویه سایتم یه قسمتی رو قرار دادم که کاربران بتونند اطلاعاتشون رو قرار بدهند وقتی کاربری اطلاعاتی رو از یک سند word کپی میکنه و وارد ادیتور میکنه و دکمه ارسال رو میزنه خطایی تویه سایت گرفته میشه مبنتی بر فرمت متن وارد شده حالا بنده میخوام اطلاعات اضافی متن کپی شده از word رو حذف کنم یک عبارت منظمی پیدا کردم ولی نمیدونم چرا جواب نمیده ممنون میشم راهنمایی کنید.




public static string CleanHtml(string html)
{
// start by completely removing all unwanted tags
html = Regex.Replace(html, @"<[/]?(font|span|xml|del|ins|[ovwxp]:\w+)[^>]*?>", "", RegexOptions.IgnoreCase);
// then run another pass over the html (twice), removing unwanted attributes
html = Regex.Replace(html, @"<([^>]*)(?:class|lang|style|size|face|[ovwxp]:\w+)=(?:'[^']*'|""[^""]*""|[^\s>]+)([^>]*)>", "<$1$2>", RegexOptions.IgnoreCase);
html = Regex.Replace(html, @"<([^>]*)(?:class|lang|style|size|face|[ovwxp]:\w+)=(?:'[^']*'|""[^""]*""|[^\s>]+)([^>]*)>", "<$1$2>", RegexOptions.IgnoreCase);
return html;
}