![]() |
|
|||||||
| Разносортица Если Вы не нашли подходящий раздел, то можете разместить свою тему здесь. Коммерческие объявления запрещены |
![]() |
|
|
Опции темы |
|
|
#1 |
|
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 911
Сказал(а) спасибо: 1,129
Получил(а) "Спасибо": 2,182
Нарушения: 0/0 (0)
Репутация: 757769
|
вопрос к прогерам, кто чем xml версии 1.1 обрабатывает за исключением С++
и к пользователям, чем собственно говоря вы его открываете? |
|
|
|
|
|
#2 |
|
долботатус
Доцент
Регистрация: 21.06.2020
Адрес: дно Марианского разлома
Сообщений: 383
Сказал(а) спасибо: 2,866
Получил(а) "Спасибо": 626
Нарушения: 0/0 (0)
Репутация: 673
|
burunduk, а с++ причём?..... Открывается любым листнером, это же текстовый файл типа html.......
|
|
|
|
|
|
#3 |
|
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 911
Сказал(а) спасибо: 1,129
Получил(а) "Спасибо": 2,182
Нарушения: 0/0 (0)
Репутация: 757769
|
sony, мне не исходный код его нужен, что бы посмотреть, а данные что бы с ними работать
а для пользователей, например ie и фф его не откроют, office тоже с ним не работает |
|
|
|
|
|
#4 |
|
Senior Member
Доцент
Регистрация: 25.07.2020
Сообщений: 437
Сказал(а) спасибо: 486
Получил(а) "Спасибо": 712
Нарушения: 0/0 (0)
Репутация: 7417
|
Фокс и Хром открывают с данными, чтоб посмотреть код, смотрится исходный код.
Для обработки xml много чего есть, кто с чем и на чем привык. Ну, а для php, например, такой пример: http://coderhs.com/archive/sitemapxml-to-html По самой библиотеке мануал: https://www.php.net/manual/ru/book.simplexml.php Можно также через регулярные, через библиотеку simplehtmldom https://simplehtmldom.sourceforge.io/ Можно через парсеры других языков: *) через библиотеки PHP, например: PHP Simple HTML DOM Parser PHPQuery Zend_DOM_Query Nokogiri *) Или через js, например: PhantomJS CasperJS SlimerJS Zombie.js *) Python: lxml BeautifulSoup Grab html5lib HTMLParser pyQuery xml.dom.minidom Leaf mechanize *) + на иных языках |
|
|
|
|
|
#5 | ||
|
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 911
Сказал(а) спасибо: 1,129
Получил(а) "Спасибо": 2,182
Нарушения: 0/0 (0)
Репутация: 757769
|
Цитата:
PHP код:
Цитата:
|
||
|
|
|
|
|
#6 |
|
Senior Member
Доцент
Регистрация: 25.07.2020
Сообщений: 437
Сказал(а) спасибо: 486
Получил(а) "Спасибо": 712
Нарушения: 0/0 (0)
Репутация: 7417
|
Ну, парсить можно что угодно, а насчёт открытия пока проверить у меня не получится - но даже если что, то погуглить и найти подходящее решение всегда можно - это не супер специфический момент.
|
|
|
|
|
|
#7 |
|
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 911
Сказал(а) спасибо: 1,129
Получил(а) "Спасибо": 2,182
Нарушения: 0/0 (0)
Репутация: 757769
|
это вам так кажется, в сети нет ничего
вы видимо не совсем понимаете в чём разница http://iso.ru/ru/press-center/journal/2010.phtml |
|
|
|
|
|
#8 |
|
Junior Member
Студент
Регистрация: 27.07.2020
Сообщений: 22
Сказал(а) спасибо: 35
Получил(а) "Спасибо": 50
Нарушения: 0/0 (0)
Репутация: 21974
|
А в чем проблема?
Код:
from bs4 import BeautifulSoup
from pprint import pprint
html = '''<?xml version='1.1' encoding='UTF-8'?>
<Data>
<sample>
<status>HTTP_2XX</status>
<http_code>200</http_code>
<url>https:</url>
<access_date>2020-06-20T08:05:43.000+03:00</access_date>
</sample>
<sample>
<status>HTTP_3XX</status>
<http_code>301</http_code>
<url>https:</url>
<access_date>2020-06-20T08:05:43.000+03:00</access_date>
</sample>
</Data>'''
soup = BeautifulSoup(html, 'lxml')
res = []
for el in soup.find_all('sample'):
o = {}
for i in el:
if i.name:
o[i.name] = i.get_text()
res.append( o )
pprint(res)
exit()
Код:
[{'access_date': '2020-06-20T08:05:43.000+03:00',
'http_code': '200',
'status': 'HTTP_2XX',
'url': 'https:'},
{'access_date': '2020-06-20T08:05:43.000+03:00',
'http_code': '301',
'status': 'HTTP_3XX',
'url': 'https:'}]
|
|
|
|
|
|
#9 |
|
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 911
Сказал(а) спасибо: 1,129
Получил(а) "Спасибо": 2,182
Нарушения: 0/0 (0)
Репутация: 757769
|
|
|
|
|
|
|
#10 | ||
|
Junior Member
Студент
Регистрация: 27.07.2020
Сообщений: 22
Сказал(а) спасибо: 35
Получил(а) "Спасибо": 50
Нарушения: 0/0 (0)
Репутация: 21974
|
Ну, XML такой формат, который домохозяйки не пользуют и с которым всегда проще программно.
Код:
from bs4 import BeautifulSoup
from pprint import pprint
import pyexcel as pe
html = 'тот же самый'
soup = BeautifulSoup(html, 'lxml')
res = []
for el in soup.find_all('sample'):
o = []
for i in el:
if i.name:
o.append(i.get_text())
res.append( o )
pe.save_book_as(bookdict={'from xml 1.1': res, 'еще from xml 1.1': res}, dest_file_name="/var/web/pypy/data/xml.xlsx")
exit()
import csv, time, asyncio
|
||
|
|
|