XPath
X
Definition complete
XPath (XML Path Language) est un langage de requete permettant de naviguer et selectionner des elements dans un document XML ou HTML. Il utilise une syntaxe de chemin similaire aux systemes de fichiers pour cibler des noeuds specifiques dans l'arborescence du document.
La syntaxe utilise des expressions de chemin : / (racine), // (descendants), . (courant), .. (parent), @ (attribut), et des predicats [] pour filtrer. Les fonctions integrees manipulent texte, nombres et booleens.
Les usages courants incluent : le web scraping (extraction de donnees de pages web), les transformations XSLT, les tests automatises (Selenium utilise XPath pour localiser les elements), et le parsing de configurations XML.
En web scraping, XPath est souvent prefere aux selecteurs CSS pour sa puissance sur les documents complexes, bien que CSS soit plus lisible pour les cas simples.
Exemples pratiques
- Selection basique :
//div[@class="product"]/h2/text()- Selectionne le texte des h2 dans les divs de classe "product". - Selenium test :
driver.find_element(By.XPATH, "//button[contains(@class, 'submit')]")- Localise un bouton contenant "submit" dans sa classe. - Web scraping :
//table[@id="results"]//tr[position()>1]/td[2]- Extrait la 2e colonne de toutes les lignes (sauf l'en-tete) d'un tableau.
A quoi sert XPath ?
XPath sert a extraire des donnees de documents XML/HTML, localiser des elements pour les tests automatises, transformer des documents XML (XSLT), et parser des configurations complexes.
XPath en pratique chez 123web
Chez 123web, nous utilisons XPath pour les integrations necessitant du parsing XML ou du scraping. Extraction de donnees, tests automatises, et transformations de documents : nos developpeurs maitrisent cette syntaxe puissante.