Voici mes modifications du code afin de corriger les problèmes suivants:
_ récupération image du film
_ récupération du titre
_ récupération du synopsis
Je suis partie du script édité par Dezelee le 2010-08-12 et je n'ai pas encore mergé mes modifications avec celles de Tarkin effectuées le 2010-11-28
------------------------------------------------------------------------------------------------------------
Voici les modifs (toutes concernent la méthode .GetDetails) :
// TITRE
string movieTitlebasic;
movieTitlebasic = removeUnwantedChars(Regex.Match(strBodyDetail, "<h1>.*?</h1>").ToString());
if (movieTitlebasic == "")
{
movieTitlebasic = removeUnwantedChars(Regex.Match(strBodyDetail, "<h1 property=\"v:itemreviewed\">.*?</h1>").ToString());
}
...
// AFFICHE
string patern = "<div class=\"poster\">.*<img src=.*" + movieTitlebasic + ".*</div>";
movieDetails.ThumbURL = Regex.Match(strBodyDetail, patern).ToString();
movieDetails.ThumbURL = Regex.Match(movieDetails.ThumbURL , "http://[^<]*(jpg|gif)").ToString();
movieDetails.ThumbURL = movieDetails.ThumbURL.Replace("r_160_214/b_1_cfd7e1", "r_760_x");
...
// SYNOPSIS
string strBodyDetailcleaned;
strBodyDetailcleaned = strBodyDetail.Replace("<b>", "");
strBodyDetailcleaned = strBodyDetailcleaned.Replace("</b>", "");
strBodyDetailcleaned = strBodyDetailcleaned.Replace("<i>", "");
strBodyDetailcleaned = strBodyDetailcleaned.Replace("</i>", "");
Match Plot = Regex.Match(strBodyDetailcleaned, "<span property=\"v:summary\">([^<]*)<");
movieDetails.Plot = removeUnwantedChars(Plot.Groups[1].Value);
------------------------------------------------------------------------------------------------------------
NB1: mes connaissances en expressions régulières sont faibles et je n'ai pas pu coder ce que je voulais, pour le synopsis ([^<]*)< n'est pas optimal (j'ai du filtrer le formatage .. gras et italique mais ce n'est pas propre et suffisant à mon avis) ... quelle est la syntaxe pour filter un mot entier dans une expression régulière (ex: </span>) :sorry:
_ récupération image du film
_ récupération du titre
_ récupération du synopsis
Je suis partie du script édité par Dezelee le 2010-08-12 et je n'ai pas encore mergé mes modifications avec celles de Tarkin effectuées le 2010-11-28
------------------------------------------------------------------------------------------------------------
Voici les modifs (toutes concernent la méthode .GetDetails) :
// TITRE
string movieTitlebasic;
movieTitlebasic = removeUnwantedChars(Regex.Match(strBodyDetail, "<h1>.*?</h1>").ToString());
if (movieTitlebasic == "")
{
movieTitlebasic = removeUnwantedChars(Regex.Match(strBodyDetail, "<h1 property=\"v:itemreviewed\">.*?</h1>").ToString());
}
...
// AFFICHE
string patern = "<div class=\"poster\">.*<img src=.*" + movieTitlebasic + ".*</div>";
movieDetails.ThumbURL = Regex.Match(strBodyDetail, patern).ToString();
movieDetails.ThumbURL = Regex.Match(movieDetails.ThumbURL , "http://[^<]*(jpg|gif)").ToString();
movieDetails.ThumbURL = movieDetails.ThumbURL.Replace("r_160_214/b_1_cfd7e1", "r_760_x");
...
// SYNOPSIS
string strBodyDetailcleaned;
strBodyDetailcleaned = strBodyDetail.Replace("<b>", "");
strBodyDetailcleaned = strBodyDetailcleaned.Replace("</b>", "");
strBodyDetailcleaned = strBodyDetailcleaned.Replace("<i>", "");
strBodyDetailcleaned = strBodyDetailcleaned.Replace("</i>", "");
Match Plot = Regex.Match(strBodyDetailcleaned, "<span property=\"v:summary\">([^<]*)<");
movieDetails.Plot = removeUnwantedChars(Plot.Groups[1].Value);
------------------------------------------------------------------------------------------------------------
NB1: mes connaissances en expressions régulières sont faibles et je n'ai pas pu coder ce que je voulais, pour le synopsis ([^<]*)< n'est pas optimal (j'ai du filtrer le formatage .. gras et italique mais ce n'est pas propre et suffisant à mon avis) ... quelle est la syntaxe pour filter un mot entier dans une expression régulière (ex: </span>) :sorry: