XML 1.1 чем обрабатывать? - Форум об интернет-маркетинге

burunduk · 06.08.2020, 02:10

вопрос к прогерам, кто чем xml версии 1.1 обрабатывает за исключением С++
и к пользователям, чем собственно говоря вы его открываете?

sony · 06.08.2020, 02:15

burunduk, а с++ причём?..... Открывается любым листнером, это же текстовый файл типа html.......

burunduk · 06.08.2020, 02:20

sony, мне не исходный код его нужен, что бы посмотреть, а данные что бы с ними работать

а для пользователей, например ie и фф его не откроют, office тоже с ним не работает

Coder · 06.08.2020, 16:09

Фокс и Хром открывают с данными, чтоб посмотреть код, смотрится исходный код.

Для обработки xml много чего есть, кто с чем и на чем привык.

Ну, а для php, например, такой пример:

http://coderhs.com/archive/sitemapxml-to-html

По самой библиотеке мануал:

https://www.php.net/manual/ru/book.simplexml.php

Можно также через регулярные, через библиотеку simplehtmldom https://simplehtmldom.sourceforge.io/

Можно через парсеры других языков:

*) через библиотеки PHP, например:
PHP Simple HTML DOM Parser
PHPQuery
Zend_DOM_Query
Nokogiri

*) Или через js, например:
PhantomJS
CasperJS
SlimerJS
Zombie.js

*) Python:
lxml
BeautifulSoup
Grab
html5lib
HTMLParser
pyQuery
xml.dom.minidom
Leaf
mechanize

*) + на иных языках

burunduk · 06.08.2020, 16:59

Цитата:

Сообщение от Coder

Фокс и Хром открывают с данными, чтоб посмотреть код, смотрится исходный код.

речь про версию xml 1.1, а не 1.0

PHP код:


			
<?xml version='1.1' encoding='UTF-8'?><Data><sample><status>HTTP_2XX</status><http_code>200</http_code><url>https:</url><access_date>2020-06-20T08:05:43.000+03:00</access_date></sample></Data>

Цитата:

Сообщение от Coder

Ну, а для php, например, такой пример:

http://coderhs.com/archive/sitemapxml-to-html

это тоже 1.0

Coder · 06.08.2020, 17:20

Ну, парсить можно что угодно, а насчёт открытия пока проверить у меня не получится - но даже если что, то погуглить и найти подходящее решение всегда можно - это не супер специфический момент.

burunduk · 06.08.2020, 17:30

Цитата:

Сообщение от Coder

это не супер специфический момент

это вам так кажется, в сети нет ничего
вы видимо не совсем понимаете в чём разница http://iso.ru/ru/press-center/journal/2010.phtml

Marat · 06.08.2020, 17:36

Цитата:

Сообщение от burunduk

речь про версию xml 1.1

А в чем проблема?

Код:

from bs4 import BeautifulSoup
from pprint import pprint
html = '''<?xml version='1.1' encoding='UTF-8'?>
<Data>
    <sample>
        <status>HTTP_2XX</status>
        <http_code>200</http_code>
        <url>https:</url>
        <access_date>2020-06-20T08:05:43.000+03:00</access_date>
    </sample>
    <sample>
        <status>HTTP_3XX</status>
        <http_code>301</http_code>
        <url>https:</url>
        <access_date>2020-06-20T08:05:43.000+03:00</access_date>
    </sample>
</Data>'''

soup = BeautifulSoup(html, 'lxml')
res = []
for el in soup.find_all('sample'):
    o = {}
    for i in el:
        if i.name:
            o[i.name] = i.get_text()
    res.append( o )
pprint(res)
exit()

Результат

Код:

[{'access_date': '2020-06-20T08:05:43.000+03:00',
  'http_code': '200',
  'status': 'HTTP_2XX',
  'url': 'https:'},
 {'access_date': '2020-06-20T08:05:43.000+03:00',
  'http_code': '301',
  'status': 'HTTP_3XX',
  'url': 'https:'}]

burunduk · 06.08.2020, 18:06

Цитата:

Сообщение от Marat

А в чем проблема?

в том что нет штатных средств работы с форматом, всегда танцы с бубнами
т.е. фактически пользователь не может просто взять и открыть xml документ в том же экселе и работать с данными

Marat · 06.08.2020, 19:17

Цитата:

Сообщение от burunduk

нет штатных средств работы с форматом

Ну, XML такой формат, который домохозяйки не пользуют и с которым всегда проще программно.

Код:

from bs4 import BeautifulSoup
from pprint import pprint
import pyexcel as pe


html = 'тот же самый'

soup = BeautifulSoup(html, 'lxml')
res = []
for el in soup.find_all('sample'):
    o = []
    for i in el:
        if i.name:
            o.append(i.get_text())
    res.append( o )

pe.save_book_as(bookdict={'from xml 1.1': res, 'еще from xml 1.1': res}, dest_file_name="/var/web/pypy/data/xml.xlsx")

exit()

import csv, time, asyncio

Не дает xls(x), zip загрузить.

06.08.2020, 02:10	#1
burunduk попробуй отними Профессор Регистрация: 14.07.2020 Сообщений: 911 Сказал(а) спасибо: 1,131 Получил(а) "Спасибо": 2,183 Нарушения: 0/0 (0) Репутация: 757769	XML 1.1 чем обрабатывать? вопрос к прогерам, кто чем xml версии 1.1 обрабатывает за исключением С++ и к пользователям, чем собственно говоря вы его открываете?

06.08.2020, 02:15	#2
sony долботатус Доцент Регистрация: 21.06.2020 Адрес: дно Марианского разлома Сообщений: 384 Сказал(а) спасибо: 2,873 Получил(а) "Спасибо": 627 Нарушения: 0/0 (0) Репутация: 673	Re: XML 1.1 чем обрабатывать? burunduk, а с++ причём?..... Открывается любым листнером, это же текстовый файл типа html....... ✀ > ^ делал плохие сайтики > ^ the Working Tapes

06.08.2020, 02:20	#3
burunduk попробуй отними Профессор Регистрация: 14.07.2020 Сообщений: 911 Сказал(а) спасибо: 1,131 Получил(а) "Спасибо": 2,183 Нарушения: 0/0 (0) Репутация: 757769	Re: XML 1.1 чем обрабатывать? sony, мне не исходный код его нужен, что бы посмотреть, а данные что бы с ними работать а для пользователей, например ie и фф его не откроют, office тоже с ним не работает

06.08.2020, 16:09	#4
Coder Senior Member Доцент Регистрация: 25.07.2020 Сообщений: 437 Сказал(а) спасибо: 486 Получил(а) "Спасибо": 712 Нарушения: 0/0 (0) Репутация: 7417	Re: XML 1.1 чем обрабатывать? Фокс и Хром открывают с данными, чтоб посмотреть код, смотрится исходный код. Для обработки xml много чего есть, кто с чем и на чем привык. Ну, а для php, например, такой пример: http://coderhs.com/archive/sitemapxml-to-html По самой библиотеке мануал: https://www.php.net/manual/ru/book.simplexml.php Можно также через регулярные, через библиотеку simplehtmldom https://simplehtmldom.sourceforge.io/ Можно через парсеры других языков: ) через библиотеки PHP, например: PHP Simple HTML DOM Parser PHPQuery Zend_DOM_Query Nokogiri ) Или через js, например: PhantomJS CasperJS SlimerJS Zombie.js ) Python: lxml BeautifulSoup Grab html5lib HTMLParser pyQuery xml.dom.minidom Leaf mechanize ) + на иных языках

06.08.2020, 17:20	#6
Coder Senior Member Доцент Регистрация: 25.07.2020 Сообщений: 437 Сказал(а) спасибо: 486 Получил(а) "Спасибо": 712 Нарушения: 0/0 (0) Репутация: 7417	Re: XML 1.1 чем обрабатывать? Ну, парсить можно что угодно, а насчёт открытия пока проверить у меня не получится - но даже если что, то погуглить и найти подходящее решение всегда можно - это не супер специфический момент.