home
products
contribute
download
documentation
forum
Home
Forums
New posts
Search forums
What's new
New posts
All posts
Latest activity
Members
Registered members
Current visitors
Donate
Log in
Register
What's new
Search
Search
Search titles only
By:
New posts
Search forums
Search titles only
By:
Menu
Log in
Register
Navigation
Install the app
Install
More options
Contact us
Close Menu
Forums
MediaPortal 1
Development
Submit: Movie Info Grabbers
[French] allocine.fr (2009-01-31)
Contact us
RSS
JavaScript is disabled. For a better experience, please enable JavaScript in your browser before proceeding.
You are using an out of date browser. It may not display this or other websites correctly.
You should upgrade or use an
alternative browser
.
Reply to thread
Message
<blockquote data-quote="nazgul64" data-source="post: 736082" data-attributes="member: 91990"><p>Bonjour,</p><p></p><p>Effectivement j'ai aussi des problèmes pour trouver les films dans la base de données Allociné.</p><p>J'ai donc regardé le comportement de la fonction <strong>FindFilm</strong> sur quelques exemples.</p><p></p><p>Tout semble se jouer (sauf erreur) au niveau de la ligne d'extraction via expression régulière : </p><p><span style="color: DarkGreen">MatchCollection myMatches = Regex.Matches(strBody, "<a href='/film/fichefilm_gen_cfilm=(?<IDfilm>[0-9]{4,6}).html'>(?<nom>[^</a>].*?)</a>(?<name>[^<br].*?)<br />.*?(?<annee>[0-9]{4}).*?<div>");</span></p><p></p><p><u>Problèmes constatés :</u></p><p>_ l'occurence du titre original (champ <span style="color: DarkGreen"><name></span>) peut perturber l'acquisition des données relatives au film.</p><p>_ la présence des balises <b> dans le champ <span style="color: DarkGreen"><nom></span> peut aussi être problématique surtout lorsqu'elles sont collées au caractère ">" (exemple : ".html'><b>Les</b> <b>Douze</b> <b>Travaux</b> <b>d'Asterix</b>")</p><p></p><p><u>Solutions temporaires :</u> (pas satisfaisantes car peu élégantes et surtout dégradation des fonctions initiales)</p><p>_ enlèvement du titre original de la lecture.</p><p>_ remplacement des occurences "><b" par "> <b" avant le traitement par expression régulière.</p><p></p><p>=></p><p><span style="color: RoyalBlue">----------------------------------------------------------- Code remplacé -----------------------------------------------------------</span></p><p><span style="color: RoyalBlue"></span></p><p><span style="color: RoyalBlue">strBody= strBody.Replace("\n", "").Replace("\r", "") ;</span></p><p><span style="color: RoyalBlue">MatchCollection myMatches = Regex.Matches(strBody, "<a href='/film/fichefilm_gen_cfilm=(?<IDfilm>[0-9]{4,6}).html'>(?<nom>[^</a>].*?)</a>(?<name>[^<br].*?)<br />.*?(?<annee>[0-9]{4}).*?<div>");</span></p><p><span style="color: RoyalBlue"></span></p><p><span style="color: RoyalBlue">----------------------------------------------------------- Code de remplacement -----------------------------------------------------------</span></p><p><span style="color: RoyalBlue">strBody= strBody.Replace("\n", "").Replace("\r", "") ;</span></p><p><span style="color: RoyalBlue">strBody = strBody.Replace("><b", "> <b");</span></p><p><span style="color: RoyalBlue">MatchCollection myMatches = Regex.Matches(strBody, "<a href='/film/fichefilm_gen_cfilm=(?<IDfilm>[0-9]{4,6}).html'>(?<nom>[^</a>].*?)</a>.*?(?<annee>[0-9]{4}).*?<div>");</span></p><p></p><p></p><p>Finallement, sur les quelques exemples que j'ai testés, <strong>FindFilm</strong> refonctionne. </p><p>Par contre, j'ai constaté un autre problème (fonction <strong>GetDetails</strong>), certaines données (comme le "genre") ne sont plus importées.</p><p></p><p>En espérant que cela fasse avancer les choses <img src="data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7" class="smilie smilie--sprite smilie--sprite8" alt=":D" title="Big Grin :D" loading="lazy" data-shortname=":D" /></p></blockquote><p></p>
[QUOTE="nazgul64, post: 736082, member: 91990"] Bonjour, Effectivement j'ai aussi des problèmes pour trouver les films dans la base de données Allociné. J'ai donc regardé le comportement de la fonction [B]FindFilm[/B] sur quelques exemples. Tout semble se jouer (sauf erreur) au niveau de la ligne d'extraction via expression régulière : [COLOR="DarkGreen"]MatchCollection myMatches = Regex.Matches(strBody, "<a href='/film/fichefilm_gen_cfilm=(?<IDfilm>[0-9]{4,6}).html'>(?<nom>[^</a>].*?)</a>(?<name>[^<br].*?)<br />.*?(?<annee>[0-9]{4}).*?<div>");[/COLOR] [U]Problèmes constatés :[/U] _ l'occurence du titre original (champ [COLOR="DarkGreen"]<name>[/COLOR]) peut perturber l'acquisition des données relatives au film. _ la présence des balises <b> dans le champ [COLOR="DarkGreen"]<nom>[/COLOR] peut aussi être problématique surtout lorsqu'elles sont collées au caractère ">" (exemple : ".html'><b>Les</b> <b>Douze</b> <b>Travaux</b> <b>d'Asterix</b>") [U]Solutions temporaires :[/U] (pas satisfaisantes car peu élégantes et surtout dégradation des fonctions initiales) _ enlèvement du titre original de la lecture. _ remplacement des occurences "><b" par "> <b" avant le traitement par expression régulière. => [COLOR="RoyalBlue"]----------------------------------------------------------- Code remplacé ----------------------------------------------------------- strBody= strBody.Replace("\n", "").Replace("\r", "") ; MatchCollection myMatches = Regex.Matches(strBody, "<a href='/film/fichefilm_gen_cfilm=(?<IDfilm>[0-9]{4,6}).html'>(?<nom>[^</a>].*?)</a>(?<name>[^<br].*?)<br />.*?(?<annee>[0-9]{4}).*?<div>"); ----------------------------------------------------------- Code de remplacement ----------------------------------------------------------- strBody= strBody.Replace("\n", "").Replace("\r", "") ; strBody = strBody.Replace("><b", "> <b"); MatchCollection myMatches = Regex.Matches(strBody, "<a href='/film/fichefilm_gen_cfilm=(?<IDfilm>[0-9]{4,6}).html'>(?<nom>[^</a>].*?)</a>.*?(?<annee>[0-9]{4}).*?<div>");[/COLOR] Finallement, sur les quelques exemples que j'ai testés, [B]FindFilm[/B] refonctionne. Par contre, j'ai constaté un autre problème (fonction [B]GetDetails[/B]), certaines données (comme le "genre") ne sont plus importées. En espérant que cela fasse avancer les choses :D [/QUOTE]
Insert quotes…
Verification
Post reply
Forums
MediaPortal 1
Development
Submit: Movie Info Grabbers
[French] allocine.fr (2009-01-31)
Contact us
RSS
Top
Bottom