![]() |
|
Разносортица Если Вы не нашли подходящий раздел, то можете разместить свою тему здесь. Коммерческие объявления запрещены |
![]() |
|
Опции темы |
![]() |
#1 |
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 905
Сказал(а) спасибо: 1,099
Получил(а) "Спасибо": 2,159
Нарушения: 0/0 (0)
Репутация: 757769
|
![]()
вопрос к прогерам, кто чем xml версии 1.1 обрабатывает за исключением С++
и к пользователям, чем собственно говоря вы его открываете? |
![]() |
![]() |
![]() |
#2 |
долботатус
Доцент
Регистрация: 21.06.2020
Адрес: дно Марианского разлома
Сообщений: 383
Сказал(а) спасибо: 2,850
Получил(а) "Спасибо": 625
Нарушения: 0/0 (0)
Репутация: -27474
|
![]()
burunduk, а с++ причём?..... Открывается любым листнером, это же текстовый файл типа html.......
|
![]() |
![]() |
![]() |
#3 |
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 905
Сказал(а) спасибо: 1,099
Получил(а) "Спасибо": 2,159
Нарушения: 0/0 (0)
Репутация: 757769
|
![]()
sony, мне не исходный код его нужен, что бы посмотреть, а данные что бы с ними работать
а для пользователей, например ie и фф его не откроют, office тоже с ним не работает |
![]() |
![]() |
![]() |
#4 |
Senior Member
Доцент
Регистрация: 25.07.2020
Сообщений: 437
Сказал(а) спасибо: 486
Получил(а) "Спасибо": 712
Нарушения: 0/0 (0)
Репутация: 7417
|
![]()
Фокс и Хром открывают с данными, чтоб посмотреть код, смотрится исходный код.
Для обработки xml много чего есть, кто с чем и на чем привык. Ну, а для php, например, такой пример: http://coderhs.com/archive/sitemapxml-to-html По самой библиотеке мануал: https://www.php.net/manual/ru/book.simplexml.php Можно также через регулярные, через библиотеку simplehtmldom https://simplehtmldom.sourceforge.io/ Можно через парсеры других языков: *) через библиотеки PHP, например: PHP Simple HTML DOM Parser PHPQuery Zend_DOM_Query Nokogiri *) Или через js, например: PhantomJS CasperJS SlimerJS Zombie.js *) Python: lxml BeautifulSoup Grab html5lib HTMLParser pyQuery xml.dom.minidom Leaf mechanize *) + на иных языках |
![]() |
![]() |
![]() |
#5 | ||
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 905
Сказал(а) спасибо: 1,099
Получил(а) "Спасибо": 2,159
Нарушения: 0/0 (0)
Репутация: 757769
|
![]() Цитата:
PHP код:
Цитата:
|
||
![]() |
![]() |
![]() |
#6 |
Senior Member
Доцент
Регистрация: 25.07.2020
Сообщений: 437
Сказал(а) спасибо: 486
Получил(а) "Спасибо": 712
Нарушения: 0/0 (0)
Репутация: 7417
|
![]()
Ну, парсить можно что угодно, а насчёт открытия пока проверить у меня не получится - но даже если что, то погуглить и найти подходящее решение всегда можно - это не супер специфический момент.
|
![]() |
![]() |
![]() |
#7 |
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 905
Сказал(а) спасибо: 1,099
Получил(а) "Спасибо": 2,159
Нарушения: 0/0 (0)
Репутация: 757769
|
![]()
это вам так кажется, в сети нет ничего
вы видимо не совсем понимаете в чём разница http://iso.ru/ru/press-center/journal/2010.phtml |
![]() |
![]() |
![]() |
#8 |
Junior Member
Студент
Регистрация: 27.07.2020
Сообщений: 22
Сказал(а) спасибо: 35
Получил(а) "Спасибо": 50
Нарушения: 0/0 (0)
Репутация: 21974
|
![]()
А в чем проблема?
Код:
from bs4 import BeautifulSoup from pprint import pprint html = '''<?xml version='1.1' encoding='UTF-8'?> <Data> <sample> <status>HTTP_2XX</status> <http_code>200</http_code> <url>https:</url> <access_date>2020-06-20T08:05:43.000+03:00</access_date> </sample> <sample> <status>HTTP_3XX</status> <http_code>301</http_code> <url>https:</url> <access_date>2020-06-20T08:05:43.000+03:00</access_date> </sample> </Data>''' soup = BeautifulSoup(html, 'lxml') res = [] for el in soup.find_all('sample'): o = {} for i in el: if i.name: o[i.name] = i.get_text() res.append( o ) pprint(res) exit() Код:
[{'access_date': '2020-06-20T08:05:43.000+03:00', 'http_code': '200', 'status': 'HTTP_2XX', 'url': 'https:'}, {'access_date': '2020-06-20T08:05:43.000+03:00', 'http_code': '301', 'status': 'HTTP_3XX', 'url': 'https:'}] |
![]() |
![]() |
![]() |
#9 |
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 905
Сказал(а) спасибо: 1,099
Получил(а) "Спасибо": 2,159
Нарушения: 0/0 (0)
Репутация: 757769
|
![]() |
![]() |
![]() |
![]() |
#10 | ||
Junior Member
Студент
Регистрация: 27.07.2020
Сообщений: 22
Сказал(а) спасибо: 35
Получил(а) "Спасибо": 50
Нарушения: 0/0 (0)
Репутация: 21974
|
![]()
Ну, XML такой формат, который домохозяйки не пользуют и с которым всегда проще программно.
Код:
from bs4 import BeautifulSoup from pprint import pprint import pyexcel as pe html = 'тот же самый' soup = BeautifulSoup(html, 'lxml') res = [] for el in soup.find_all('sample'): o = [] for i in el: if i.name: o.append(i.get_text()) res.append( o ) pe.save_book_as(bookdict={'from xml 1.1': res, 'еще from xml 1.1': res}, dest_file_name="/var/web/pypy/data/xml.xlsx") exit() import csv, time, asyncio
|
||
![]() |
![]() |