![]() |
![]() |
#1 |
se ксенофоб
Доцент
Регистрация: 14.07.2020
Адрес: Севастополь, Россия
Сообщений: 173
Сказал(а) спасибо: 127
Получил(а) "Спасибо": 33
Нарушения: 0/0 (0)
Репутация: 28076
|
![]()
парсер настроен парсить всеиз div class="article"
в нем есть сразу поле div class="photo" а в нем span class="caption" оно как раз и нужно. Когда оно заполнено проблем нет, парсер берет его и все счастливы но бывает так что в самом начале span caption отсутствует НО есть следующая конструкция: div class="content" в нем div class="photo" а в нем span class="caption" и парсер берет это поле, а оно не подходит к заглавной картинке как парсеру указать что надо брать его только в первом случае, и если там пусто то не брать вот то из контента ![]() пробовал XPATH Код:
.//div[@class="photo"]/span[@class="caption"] Код:
.photo span.caption |
![]() |
![]() |
![]() |
#2 |
se ксенофоб
Доцент
Регистрация: 14.07.2020
Адрес: Севастополь, Россия
Сообщений: 173
Сказал(а) спасибо: 127
Получил(а) "Спасибо": 33
Нарушения: 0/0 (0)
Репутация: 28076
|
![]()
есть возможность каким то выражением исключить полностью из выборки div class="content"?
|
![]() |
![]() |
![]() |
#3 |
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 903
Сказал(а) спасибо: 1,094
Получил(а) "Спасибо": 2,155
Нарушения: 0/0 (0)
Репутация: 757769
|
![]()
seokotov, более точно укажи путь от .article .photo span.caption
|
![]() |
![]() |
![]() |
#4 |
se ксенофоб
Доцент
Регистрация: 14.07.2020
Адрес: Севастополь, Россия
Сообщений: 173
Сказал(а) спасибо: 127
Получил(а) "Спасибо": 33
Нарушения: 0/0 (0)
Репутация: 28076
|
![]()
а куда уж точнее? вот прямо так и есть же:
указываю так .article .photo span.caption а оно считает что можно и так взять .article .content .photo span.caption точнее в полученном сыром коде нет .article он является контейнером откуда изначально производится выборка может както RegExp взять это но отсечь блок content? |
![]() |
![]() |
![]() |
#5 |
Позитив =)
Академик
Регистрация: 21.06.2020
Адрес: Санкт-Петербург
Сообщений: 4,405
Сказал(а) спасибо: 25,027
Получил(а) "Спасибо": 13,864
Нарушения: 0/0 (0)
Репутация: 1412767
|
![]()
А что за парсер хоть? Ивзинямс за глупый вопрос
![]() |
![]() |
![]() |
![]() |
#6 |
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 903
Сказал(а) спасибо: 1,094
Получил(а) "Спасибо": 2,155
Нарушения: 0/0 (0)
Репутация: 757769
|
![]() |
![]() |
![]() |
![]() |
#7 |
se ксенофоб
Доцент
Регистрация: 14.07.2020
Адрес: Севастополь, Россия
Сообщений: 173
Сказал(а) спасибо: 127
Получил(а) "Спасибо": 33
Нарушения: 0/0 (0)
Репутация: 28076
|
![]() |
![]() |
![]() |
Сказали спасибо: |
![]() |
#8 |
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 903
Сказал(а) спасибо: 1,094
Получил(а) "Спасибо": 2,155
Нарушения: 0/0 (0)
Репутация: 757769
|
![]() |
![]() |
![]() |
![]() |
#9 |
se ксенофоб
Доцент
Регистрация: 14.07.2020
Адрес: Севастополь, Россия
Сообщений: 173
Сказал(а) спасибо: 127
Получил(а) "Спасибо": 33
Нарушения: 0/0 (0)
Репутация: 28076
|
![]() |
![]() |
![]() |
![]() |
#10 | |
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 903
Сказал(а) спасибо: 1,094
Получил(а) "Спасибо": 2,155
Нарушения: 0/0 (0)
Репутация: 757769
|
![]() Цитата:
или же там есть ещё какая-то обёртка |
|
![]() |
![]() |
![]() |
Опции темы | |
|
|
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Где можно взять бесплатные, хорошие, вечные ссылки? | Had | Ссылки: покупка, продажа, обмен | 17 | 29.01.2023 12:08 |
DLE, вывеси доп. поле в speedbar.tpl | Globus | Веб-строительство | 0 | 23.02.2022 08:20 |
A-Parser - универсальный многопоточный парсер | A-Parser | Биржа услуг | 0 | 16.04.2021 20:09 |
Ошибка в Гугл Отсутствует поле url | rty9000 | Гугл и другие поисковики | 44 | 11.01.2021 21:26 |
Где взять/купить SSL-сертификат ? | Diversant | Хостинг и домены | 8 | 29.08.2020 16:31 |