Outils pour utilisateurs

Outils du site


4.7_web_parsing_tarif_du_lendemain

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
4.7_web_parsing_tarif_du_lendemain [2012/02/03 22:48]
remyfr
4.7_web_parsing_tarif_du_lendemain [2020/08/20 20:30] (Version actuelle)
Ligne 10: Ligne 10:
  
 http://bleuciel.edf.com/abonnement-et-contrat/les-prix/les-prix-de-l-electricite/option-tempo/la-couleur-du-jour-2585.html&coe_i_id=2585 http://bleuciel.edf.com/abonnement-et-contrat/les-prix/les-prix-de-l-electricite/option-tempo/la-couleur-du-jour-2585.html&coe_i_id=2585
 +
 +
 +http://ejp.es-energies.fr
 +
  
  
Ligne 20: Ligne 24:
 **''webparse''** **''webparse''**
  
-**''webpage=http://bleuciel.edf.com/abonnement-et-contrat/les-prix/les-prix-de-l-electricite/option-tempo/la-couleur-du-jour-2585.html&coe_i_id=2585''**+**''webpage=http://particuliers.edf.com/abonnement-et-contrat/les-prix/les-prix-de-l-electricite/option-tempo/la-couleur-du-jour-2585.html&coe_i_id=2585''**
  
 **''search=<h4>Demain''** **''search=<h4>Demain''**
Ligne 29: Ligne 33:
  
 **''end=</span>''** **''end=</span>''**
 +
 +**''filter=Jour non EJP;Jour EJP''**
  
 **''Blanc=1''** **''Blanc=1''**
Ligne 49: Ligne 55:
  
 **end=** identifie la chaine de caractère qui délimite la fin du texte à trouver dans le site web, une seule occurrence possible. **end=** identifie la chaine de caractère qui délimite la fin du texte à trouver dans le site web, une seule occurrence possible.
 +
 +**filter=** est facultatif, certains site web modifient leur structure html en fonction de leur contenu ce qui rends le resultat du parsing inutilisable car il garde des inclusions de code html. 
 +
 +**filter=** permet de définir une liste de résultat attendus, par exemple le tarif du lendemain est **Jour non EFP** ou  **Jour EJP**, on defini **filter=Jour non EJP;Jour non EJP** , le séparateur est le point virgule
 +
 +LogisDom compare le résultat à la liste fournie, si un élément de la liste est contenu dans le résultat (qui pourrait contenir encore des morceau de code html) seul l'élément de la liste correspondant sera pris comme résultat. Si aucun élément de la liste ne correspond, le résultat original sera pris en compte.
  
 \\ \\
Ligne 103: Ligne 115:
   - **''search=       ''**   - **''search=       ''**
   - **''end=   ''**   - **''end=   ''**
 +  - **''filter=   ''**
   - **''Liste correspondance Texte=Valeur''**   - **''Liste correspondance Texte=Valeur''**
  
4.7_web_parsing_tarif_du_lendemain.1328280500.txt.gz · Dernière modification: 2020/08/20 20:30 (modification externe)