Как получить xml файл с сайта
Перейти к содержимому

Как получить xml файл с сайта

  • автор:

Как получить данные из карты сайта.xml?

viktorvsk

С учетом тегов вопроса, отвечу:
Выделить мышкой site.ru и нажать ctrl+c.

А так, могут предложить или регулярным выражением вытаскивать (в итоге, будет что-то типа /^(.*?)/ ) Или, что правильнее, использовать DOM-парсеры.
Язык не указали, поэтому, вот PHP:
php.net/manual/ru/book.simplexml.php
Вот ruby:
www.nokogiri.org
Python:
https://docs.python.org/2/library/xml.etree.elemen.

Ответ написан более трёх лет назад

Комментировать

Нравится Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

html

  • HTML
  • +2 ещё

Нужно составить xPath, в зависимости от содержимого родительских узлов, как?

  • 1 подписчик
  • 26 февр.
  • 48 просмотров

Кто нибудь понял как получить xml файл с нужного сайта?

Хорошо рассказано как парсить с xml файла, но не слова где его взять. Просмотрел урок про то как записывать файлы и на тех простых примерах из урока все понятно, но с точки зрения практичности признаюсь, что не фига не понял. Если кто то понял как получить xml файл с нужного вам сайта, поделитесь опытом. Плиз! Очень надо. Спасибо заранее!

1 ответов

Не все сайты отдают XML. Некоторые сайты предоставляют официальный API и позволяют делать запросы к их сайту, а на выходе получать XML или JSON. Например, VK отдает данные в XML или JSON: https://vk.com/dev/first_guide Гуглится обычно название сервиса, например Facebook API. К сайтам, которые не предоставляют API, пишут грабберы используя разные библиотеки, например PHP Simple HTML DOM Parser. т.е. с помощью этой библиотеки парсят HTML данные на сайте, затем сохраняют данные в удобном виде в базу или сразу отдают данные в виде XML/JSON.

Sign up or Log in to write an answer

  • Интерактивные уроки и курсы программирования и создания сайтов (дистанционное обучение) помогут вам в игровой форме изучить основы языков программирования веб-разработки и веб-программирования с нуля. Обучение онлайн 24/7.

Общие ссылки

  • Отзывы
  • Политика конфидециальности
  • Условия использования
  • Блог
  • Цена и оплата
  • Курсы и скринкасты
  • Сертификаты
  • Партнерская программа
  • Комьюнити

Наши курсы и скринкасты

  • HTML/CSS Advanced
  • Bootstrap 4
  • Vue JS
  • Linux, GIT and web-hosting
  • HTML and CSS
  • Modern Javascript
  • Javascript/jQuery
  • Codeigniter
  • Все курсы и скринкасты

Просмотр XML файлов

XML файл можно просматривать во всех основных браузерах. Однако не стоить ждать, что он будет отображаться, как HTML.

Просмотр XML файлов

   Tove Jani Напоминание Не забудь обо мне в эти выходные!  

Посмотрите этот XML файл: note.xml.

В большинстве браузерах XML документ будет отображаться с подкрашенными корневым и дочерними элементами. На знак плюс (+) или минус (-) слева от элементов можно нажать, и тогда структура элемента развернется или наоборот свернется. Чтобы просмотреть исходный код XML файла (без знаков + и — ), выберите пункт меню браузера «Исходный код».

Примечание: В старых браузерах Safari отображается только текст элемента. Чтобы просмотреть код XML документа, необходимо кликнуть правой кнопкой мыши на страницу и выбрать «Просмотреть исходный код».

Просмотр поврежденного XML файла

Если попытаться открыть некорректно составленный XML файл, то некоторые браузеры выдадут сообщение об ошибке, а некоторые некорректно его отобразят.

Попробуйте открыть следующий XML файл в браузерах Chrome, IE, Firefox, Opera и Safari : note_error.xml.

Другие примеры XML

Просмотр следующих XML документов поможет вам освоиться с выводом XML.

XML каталог растений (plant_catalog.xml)
Каталог растений из магазина растений, сохраненный в виде XML данных.

Простое меню (simple.xml)
Меню завтрака из ресторана, сохраненное в виде XML данных.

Почему XML отображается таким образом?

XML документы не несут никакой информации о том, каким образом нужно отображать их данные.

Без информации о том, как следует отображать эти данные, большинство браузеров будут отображать XML документ просто как есть.

Использование Visual C# для чтения XML-данных из URL-адреса

В этой статье показано, как использовать XmlTextReader класс для чтения XML из URL-адреса. Потоковая информация может поступать из разных источников, таких как поток байтов с сервера, файла или TextReader класса.

Оригинальная версия продукта: Visual Studio
Исходный номер базы знаний: 307643

Требования

В этой статье предполагается, что вы знакомы со следующими разделами:

  • Microsoft Visual Studio
  • Терминология XML
  • Создание и чтение XML
  • URL-адреса и создание конечной точки XML

В этой статье описывается пространство System.Xml имен библиотеки классов платформа .NET Framework .

Чтение XML-данных из URL-адреса

В этом примере используется файл с именемBooks.xml. Вы можете создать собственный файлBooks.xml или использовать пример файла, который входит в краткие руководства по пакету SDK для .NET. Этот файл также доступен для скачивания; См. первый элемент в разделе Ссылки этой статьи, чтобы получить сведения о расположении скачивания.

  1. Скопируйте файлBooks.xml в папку \Inetpub\Wwwroot на компьютере.
  2. Откройте Visual Studio.
  3. Создайте консольное приложение Visual C#. Вы можете перейти к разделу Полный список кода или выполнить следующие действия, чтобы создать приложение.
  4. Укажите директиву using в System.Xml пространстве имен, чтобы не требовалось указывать XmlTextReader объявления классов позже в коде. Директиву using необходимо использовать перед любыми другими объявлениями.

using System.Xml; 
String URLString = "http://localhost/books.xml"; 
XmlTextReader reader = new XmlTextReader (URLString); 

Примечание. На этом шаге показан базовый внешний while цикл, а в следующих двух шагах описывается использование этого цикла и чтение XML.

После загрузки выполняет последовательные операции чтения для XmlTextReader перемещения между XML-данными и использует Read метод для получения следующей записи. Если Read записей больше нет, метод возвращает значение false.

while (reader.Read()) < // Do some work here on the data. Console.WriteLine(reader.Name); >Console.ReadLine(); 

Примечание. В этом примере атрибуты элемента игнорируется.

while (reader.Read()) < switch (reader.NodeType) < case XmlNodeType.Element: // The node is an element. Console.Write(""); break; case XmlNodeType.Text: //Display the text in each element. Console.WriteLine (reader.Value); break; case XmlNodeType. EndElement: //Display the end of the element. Console.Write(""); break; > > 
while (reader.Read()) < switch (reader.NodeType) < case XmlNodeType.Element: // The node is an element. Console.Write(""); Console.WriteLine(">"); break; case XmlNodeType.Text: //Display the text in each element. Console.WriteLine (reader.Value); break; case XmlNodeType. EndElement: //Display the end of the element. Console.Write(""); break; > > 

Полный список кода

using System; using System.Xml; namespace ReadXMLfromURL < /// /// Summary description for Class1. /// class Class1 < static void Main(string[] args) < String URLString = "http://localhost/books.xml"; XmlTextReader reader = new XmlTextReader (URLString); while (reader.Read()) < switch (reader.NodeType) < case XmlNodeType.Element: // The node is an element. Console.Write(""); Console.WriteLine(">"); break; case XmlNodeType.Text: //Display the text in each element. Console.WriteLine (reader.Value); break; case XmlNodeType. EndElement: //Display the end of the element. Console.Write(""); break; > > > > > 

Пример выходных данных

   The Autobiography of Benjamin Franklin  Benjamin Franklin  8.99  > The Confidence Man Herman Melville  11.99   The Gorgias  Plato  9.99   

Устранение неполадок

При тестировании кода может появилось следующее сообщение об ошибке исключения:

Необработанное исключение типа System.Xml. XmlException произошло в system.xml.dll Дополнительные сведения: Неожиданное объявление XML. Объявление XML должно быть первым узлом в документе, и перед ним не могут отображаться символы пробелов. Строка 1, позиция 4.

Ошибка исключения возникает в следующей строке кода.

while (reader.Read()) 

Чтобы устранить ошибку исключения, удалите символ пробела, который предшествует первому узлу в документеBooks.xml .

Ссылки

  • XML в .NET: платформа .NET Framework классы XML и C# предлагают простые масштабируемые операции с данными
  • Класс XmlReader

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *