Ce forum est maintenant fermé, seule cette archive statique reste consultable.
  FORUM Matbe.com
  OS, Software, Réseaux
  Programmation

  PHP - Récupérer les valeurs d'un tableau html

Bas de page
Auteur Sujet :

PHP - Récupérer les valeurs d'un tableau html

n°73180
fredo490
Mais pourquoi donc ?
Posté le 30-08-2011 à 09:58:37  
 

Bonjour à tous,
  J'ai une petite question technique. J'ai le code source d'un tableau codé en HTML que je dois épurer pour ne conserver que le texte. En gros, je dois pouvoir lire les valeurs de chaque case (et en particulier se qui est en gras ci-dessous). Il y a un certain nombre de paramètre constant comme le nombre de colonne mais le formatage n'est jamais 100% identique.
 
Quelle est la méthode la plus simple et le plus robuste à mettre en place ?
 

Code :
  1. <tr valign="top">
  2. <td></td>
  3. <td><img width="16" height="1" src="/icons/ecblank.gif" border="0" alt=""><font size="2"><a href="/Regulatory_and_Guidance_Library/rgFar.nsf/2caf347ad1d4b35e852566c70067018b/71ca81754ab792aa85256687006b565d!OpenDocument"></FONT></TD>
  4. <TD NOWRAP WIDTH=65><FONT SIZE=2><A target="_blank" HREF="/Regulatory_and_Guidance_Library\rgFAR.nsf/0/71CA81754AB792AA85256687006B565D?OpenDocument">Sec. 23.1</A></a></font></td>
  5. <td><font size="2"></FONT></TD>
  6. <TD NOWRAP WIDTH=203><FONT SIZE=2>Applicability.</font></td>
  7. <td align="center"><font size="2"></FONT></TD>
  8. <TD NOWRAP WIDTH=50><FONT SIZE=2></font></td>
  9. <td align="center"><font size="2"></FONT></TD>
  10. <TD NOWRAP WIDTH=48><FONT SIZE=2>02/01/1965</font></td>
  11. <td align="center"></td>
  12. <td><img width="1" height="16" src="/icons/ecblank.gif" border="0" alt=""></td>
  13. </tr>


---------------
Ha oui, c'est ici qu'on écrit notre signature.
mood
Pub
Posté le 30-08-2011 à 09:58:37  
 

n°73181
LostSoul
Belgian Beer Forever (en slip)
Posté le 30-08-2011 à 09:59:25  
 

XML + XPath ? (si la table porte un id c'est encore plus fastoche)


---------------
Le cheval, c'est bon, mangez-en!  
[ www.in-wonderland.net | www.start64.com | www.majorgeeks.com | updt-bdnq ]
n°73182
Ashe
reenignE esreveR
Posté le 30-08-2011 à 11:42:59  
 

sauf que c'est pas du xml :p
zont pas une API rest ou autre ?


---------------
pcx360 | Binary Genetics | Dreaming Prophet
“Entropy isn’t what it used to be.”
n°73183
fredo490
Mais pourquoi donc ?
Posté le 30-08-2011 à 12:48:23  
 

Et si on veut généraliser ça :D
 
En gros, mettre à jour (automatiquement) une base de donnée à partir de ce genre de tableau :  
http://rgl.faa.gov/Regulatory_and_ [...] .1&Count=1
 
Le problème majeur, c'est de virer les balises de formatage.


---------------
Ha oui, c'est ici qu'on écrit notre signature.
n°73184
LostSoul
Belgian Beer Forever (en slip)
Posté le 30-08-2011 à 13:14:41  
 

Ashe a écrit :

sauf que c'est pas du xml :p
zont pas une API rest ou autre ?


 
si c'est du xhtml c'est du xml, sinon ils ont qu'à revoir leur code pourri :o


---------------
Le cheval, c'est bon, mangez-en!  
[ www.in-wonderland.net | www.start64.com | www.majorgeeks.com | updt-bdnq ]
n°73185
Ashe
reenignE esreveR
Posté le 30-08-2011 à 14:43:35  
 

LostSoul a écrit :


 
si c'est du xhtml c'est du xml, sinon ils ont qu'à revoir leur code pourri :o


<TD NOWRAP WIDTH=65><FONT SIZE=2>
Faut lire :p


---------------
pcx360 | Binary Genetics | Dreaming Prophet
“Entropy isn’t what it used to be.”
n°73186
LostSoul
Belgian Beer Forever (en slip)
Posté le 30-08-2011 à 15:05:17  
 

C'est ce que je dis, le 1er truc à faire pour travailler correctement c'est virer ce code pourri :o


---------------
Le cheval, c'est bon, mangez-en!  
[ www.in-wonderland.net | www.start64.com | www.majorgeeks.com | updt-bdnq ]
n°73194
arl-guhr
kan g faim je mange
Posté le 30-08-2011 à 20:49:55  
 

Tu cherche les "TD" après un "<" et avant un ">" et tu gicles tout ce que se trouverais entre "<" et ">" incluent?


---------------
il s'appel le ronge me doute
n°73195
LostSoul
Belgian Beer Forever (en slip)
Posté le 30-08-2011 à 20:51:22  
 

Bah y'a bien des parsers html quand même ...


---------------
Le cheval, c'est bon, mangez-en!  
[ www.in-wonderland.net | www.start64.com | www.majorgeeks.com | updt-bdnq ]
n°73196
Ashe
reenignE esreveR
Posté le 30-08-2011 à 23:09:48  
 

Bah $doc = new DomDocument(); $doc->loadHTML( le html ); ca peut passer (avec eventuellement un bon coup de libxml_use_internal_error(true) si ca fait des warnings)


---------------
pcx360 | Binary Genetics | Dreaming Prophet
“Entropy isn’t what it used to be.”
  FORUM Matbe.com
  OS, Software, Réseaux
  Programmation

  PHP - Récupérer les valeurs d'un tableau html