|
Удаляем HTML тэги
Наверняка многие из Вас сталкивались с задачей удаления лишних символов из текстовых файлов.
Сегодня я покажу как одной строкой удалить все HTML тэги из текстового файла.
Для этого мы будем использовать регулярные выражения - класс Regex и метод Replace()
Вот собственно код
string content = "";
// Начитываем весь файл в переменную string
StreamReader sr = new StreamReader(lFile.Text);
string line = sr.ReadLine();
while (line != null)
{
content += line;
line = sr.ReadLine();
}
sr.Close();
// С помощью регулярного выражения удаляем все тэги
content = Regex.Replace(content, @"</?.+?>", "");
// записываем результат в новый файл
StreamWriter sw = new StreamWriter(lFile.Text+".txt");
sw.WriteLine(content);
sw.Close();
MessageBox.Show("Создан файл "+lFile.Text + ".txt");
|
Полный текст программы
Оглавление   
Следующая стр.
Средняя оценка:     (3,5 - 4 голосов) Для оценки необходимо зарегистрироваться
Только зарегистрировавшиеся пользователи могут оставлять комментарии
Комментирует james 11.01.2010 21:30:49 Отличный пост
Комментирует james 11.01.2010 21:31:33 да уж
Комментирует jwsoft 11.01.2010 21:39:00 автор "жжет"
Комментирует jwsoft 11.01.2010 21:42:32
Комментирует jwsoft 11.01.2010 21:42:48
Комментирует jwsoft 11.01.2010 21:43:25 фыв
Комментирует jwsoft 11.01.2010 21:43:44 qqqq
|
|