Vinnyl
|
member
|
|
|
|
Рег.: 17.10.2003
|
Сообщений: 172
|
|
Рейтинг: -8
|
|
Нужна помощь в ASP
07.08.2007 13:26
|
|
|
Есть сайт, написаныый на asp. Попросили написать поиск. Искать нужно в файлах, так как пока базы нету. В результаты поиска понятно не нужно чтобы попадал какой-нибудь код или комментарии в файлах. Все html-кода удаляю с помощью следующей функции:
code: Function RemoveHTML( strText )
Dim RegEx
Set RegEx = New RegExp
RegEx.Pattern = "<[^>]*>"
RegEx.Global = True
strText = Replace(strText, "<br>", chr(10))
text = RegEx.Replace(strText, "")
End Function
Однако при таком задании шаблона внутренность скриптов вида:
code:
<script LANGUAGE=JavaScript>
...
document.write(...);
...
</script>
доступна для поиска.
Как изменить шаблон, чтобы внутренность скриптов тоже вырезать? Заранее спасибо за помощь.
|
|
Keres
|
Raver
|
|
|
|
Рег.: 27.10.2003
|
Сообщений: 4699
|
Из: Теплый Стан
|
Рейтинг: 3879
|
|
Re: Нужна помощь в ASP
[re: Vinnyl]
07.08.2007 13:30
|
|
|
Ну в 2 захода удаляй - сначала скрипты, шаблон примерно такой: <script.*</script> . Потом все остальное ЗЫ С регекспами в асп не очень знаком
|
Dance hard. Die fast.
|
|
Vinnyl
|
member
|
|
|
|
Рег.: 17.10.2003
|
Сообщений: 172
|
|
Рейтинг: -8
|
|
Re: Нужна помощь в ASP
[re: Keres]
07.08.2007 13:37
|
|
|
Да я вот тоже с шаблонами не очень дружу. Твой шаболон не работает.
|
|
Keres
|
Raver
|
|
|
|
Рег.: 27.10.2003
|
Сообщений: 4699
|
Из: Теплый Стан
|
Рейтинг: 3879
|
|
Re: Нужна помощь в ASP
[re: Vinnyl]
07.08.2007 13:49
|
|
|
либо на точку либо на слеш не так реагирует. попробуй <script[.]*</script>
|
Dance hard. Die fast.
|
|
Vinnyl
|
member
|
|
|
|
Рег.: 17.10.2003
|
Сообщений: 172
|
|
Рейтинг: -8
|
|
Re: Нужна помощь в ASP
[re: Keres]
07.08.2007 14:20
|
|
|
Теперь код:
code: Function RemoveScript( strText )
Dim RegEx
Set RegEx = New RegExp
RegEx.Pattern = "<script[.]*</script>"
RegEx.Global = True
'strText = Replace(strText, "<br>", chr(10))
text = RegEx.Replace(strText, "")
End Function
Function RemoveHTML( strText )
Dim RegEx
Set RegEx = New RegExp
RegEx.Pattern = "<[^>]*>"
RegEx.Global = True
strText = Replace(strText, "<br>", chr(10))
text = RegEx.Replace(strText, "")
End Function
' В переменной text содержимое asp файла
RemoveScript(text)
RemoveHTML(text)
После этого внутренность скриптов в перемнной text остаються, а все теги включая <script> удаляются. Может еще как-то можно попробовать шаблон изменить?
|
|
Keres
|
Raver
|
|
|
|
Рег.: 27.10.2003
|
Сообщений: 4699
|
Из: Теплый Стан
|
Рейтинг: 3879
|
|
Re: Нужна помощь в ASP
[re: Vinnyl]
07.08.2007 14:46
|
|
|
<script[\s\S]*</script>
|
Dance hard. Die fast.
|
|
Vinnyl
|
member
|
|
|
|
Рег.: 17.10.2003
|
Сообщений: 172
|
|
Рейтинг: -8
|
|
Re: Нужна помощь в ASP
[re: Keres]
07.08.2007 15:15
|
|
|
Спасибо. Это работает.
|
|
Vinnyl
|
member
|
|
|
|
Рег.: 17.10.2003
|
Сообщений: 172
|
|
Рейтинг: -8
|
|
Re: Нужна помощь в ASP
[re: Vinnyl]
07.08.2007 15:26
|
|
|
Столкнулся с еще одной проблемой - остаються комментарии вида <!-- .... -->
|
|
botWi
|
|
|
|
|
Рег.: 22.11.2003
|
Сообщений: 10160
|
Из: Moscow
|
Рейтинг: 1764
|
|
Re: Нужна помощь в ASP
[re: Vinnyl]
07.08.2007 15:33
|
|
|
а не проще готовый HTML парсер взять? наверняка их полно в инете валяется на вод они получают строчку с сурцом сайта на выход выдают текст
тоесть что тебе и нада
|
Хватит дрочить на рейтинги |
|
Vinnyl
|
member
|
|
|
|
Рег.: 17.10.2003
|
Сообщений: 172
|
|
Рейтинг: -8
|
|
Re: Нужна помощь в ASP
[re: botWi]
07.08.2007 15:41
|
|
|
Уже все написано, так что уже проще дописать.
|
|
Keres
|
Raver
|
|
|
|
Рег.: 27.10.2003
|
Сообщений: 4699
|
Из: Теплый Стан
|
Рейтинг: 3879
|
|
Re: Нужна помощь в ASP
[re: Vinnyl]
07.08.2007 16:09
|
|
|
ну точно так же <!--[\s\S]*-->
|
Dance hard. Die fast.
|
|
botWi
|
|
|
|
|
Рег.: 22.11.2003
|
Сообщений: 10160
|
Из: Moscow
|
Рейтинг: 1764
|
|
Re: Нужна помощь в ASP
[re: Vinnyl]
07.08.2007 17:00
|
|
|
вот не соглашусь, что все написано одно тянется за другим и так далее
|
Хватит дрочить на рейтинги |
|
DarkGray
|
Carpal Tunnel
|
|
|
|
Рег.: 30.09.2002
|
Сообщений: 31415
|
|
Рейтинг: 8952
|
|
Re: Нужна помощь в ASP
[re: botWi]
07.08.2007 17:51
|
|
|
соглашусь с botWi на regex-ах парсер можно долго писать
|
|
Vinnyl
|
member
|
|
|
|
Рег.: 17.10.2003
|
Сообщений: 172
|
|
Рейтинг: -8
|
|
|
А мне не надо парсер в чистом виде. Уже все сделано. Сначало убираем скрипты, потом комментарии и теги. вот вся задача. Нужно только вытянуть текст. Нет нужды выводить форматно. Keres, спасибо за помощь.
|
|
botWi
|
|
|
|
|
Рег.: 22.11.2003
|
Сообщений: 10160
|
Из: Moscow
|
Рейтинг: 1764
|
|
Re: Нужна помощь в ASP
[re: Vinnyl]
07.08.2007 23:44
|
|
|
когда попадется пример который твой парсер не обрабатывает тогда вспомнишь наши слова
|
Хватит дрочить на рейтинги |
|