[Approved] [Russian] kinopoisk.ru (2 Viewers)

ajs

Development Group
  • Team MediaPortal
  • February 29, 2008
    15,646
    10,591
    Kyiv
    Home Country
    Ukraine Ukraine
    Всё равно режет
    Попробуй заменить в скрипте:
    XML:
    rx_strip += @"[\+\s]*" + strip;
    На
    XML:
    rx_strip += @"[\.\s_]*" + strip;
    А то что то я знака + в именах не встречал ни разу :)
     

    RabinoVich

    Portal Pro
    December 29, 2009
    258
    36
    Khabarovsk
    Home Country
    Russian Federation Russian Federation
    А то что то я знака + в именах не встречал ни разу
    14+, 1+1, например
    Попробуй заменить в скрипте
    Не помогло, всё ранво срезает все пробелы. Да ещё и в лог ошибок сыпит
     

    Attachments

    • conf-error.txt
      2.8 KB

    ajs

    Development Group
  • Team MediaPortal
  • February 29, 2008
    15,646
    10,591
    Kyiv
    Home Country
    Ukraine Ukraine
    Глянул в исходники МП, он заменяет все точки и подчеркивания на пробел, т.е. их можно с правил вычеркивать :)
    C#:
          Regex rx = new Regex(vdbParserStr[0], RegexOptions.IgnoreCase);
          strUrl = rx.Replace(strUrl, "");
          strUrl = strUrl.Replace(".", " ");
          strUrl = strUrl.Replace("_", " ").Trim();
          return strUrl;
    Обновил скрипт, проверил, залил на ГитХаб, ваши правила при этом будут примерно такие:
    XML:
                <strip>[\(\[]?(240|360|480|720|1080|1280|2160)(p|i)?[\(\]]?</strip>
                <strip>rus|ukr|eng|(hard|soft)?sub</strip>
                <strip>(h|x)26(3|4|5)</strip>
                <strip>VC-?1</strip>
                <strip>-?AVC</strip>
                <strip>-?AC(3|C)</strip>
                <strip>(Xvid|DivX)</strip>
                <strip>X?VCD</strip>
                <strip>Tele(cine|sync)</strip>
                <strip>BluRay</strip>
                <strip>HD(TS|TV)</strip>
                <strip>(DVD|VHS)Scr(eener)?</strip>
                <strip>DVD(-?(5|9))</strip>
                <strip>(Super|HQ\s?)DVD</strip>
                <strip>(((i|n)?VOD|CAM|SAT|DS|VHS|(PD)?TV|IPTV|DVB(-T\s?)?|DT(heater)?|L(aser)?D(isc)?|WEB|BD|B(lu)?R(ay)?|HD(TV)?|(HD-?)?DVD)-?((DL-?)?Rip|DL|Remux))</strip>
                <strip>[\(\[]?(S?CAM|(Super-?)?TS|TC|SCR|R5|WP)[\)\]]?</strip>
                <strip>[\(\[]?(((A|S|1|2|D|M)VO)|((D|S)UB))[\)\]]?</strip>
                <strip>(\d{3,4}MB)</strip>
                <strip>^$|(\s\d\s\d{2}$)</strip>
                <strip>[\(\[]?(Extended|Theatrical|Director's.cut|Unrated)[\)\]]?</strip>
                <strip>[\[\(]?(((ru-?)?(t(racke|o)r(rent)?)\s([a-z]{2,3})(?![a-z]))|((HD|nnm|IRON)-?Club|HELLYWOOD|iTunes))[\]\)]?</strip>
                <strip>by\s[^\s]+?$</strip>
               <strip>\[[a-z]+?\]</strip>
               <strip>^$|\[|\]</strip>
               <strip>^$|-\s</strip>
     

    RabinoVich

    Portal Pro
    December 29, 2009
    258
    36
    Khabarovsk
    Home Country
    Russian Federation Russian Federation
    Работает теперь как надо и пробелы не режет! Однако всё ранво ошибается при поиске :cry:
    Например
    Code:
    1. http://www.kinopoisk.ru/index.php?set_result_type=simple&kp_query=%d1%e0%ef%ee%e6%ed%e8%ea+The+Cobbler+2014
    2. http://www.kinopoisk.ru/index.php?set_result_type=simple&kp_query=%ce%f1%f2%e0%ed%fc%f1%ff+Stay+2005
    3. http://www.kinopoisk.ru/index.php?set_result_type=simple&kp_query=%cc%e0%eb%e5%ed%fc%ea%e0%ff+%f1%ec%e5%f0%f2%fc+The+Little+Death+2014
    Ссылки 1 и 3 находит правильно, если удалять артикль 'The'. Может его добавить в правила?
    Ссылку 2 находит, если убирать год. Как вариант, убирать год из названия, если название короткое - оно сбивает поиск с толку

    Некоторые фильмы нашлись кинопоиском правильно, если верить ссылкам в логах, но по итогу в базу грузанулся совсем другой фильм
    Например:
    Code:
    Миссия невыполнима Племя изгоев - Mission Impossible Rogue Nation [2015] [720].mkv
    Третье желание [2009].avi
    Возможно из-за неверных результатов уже при поиске на IMDB


    В лог ошибок таки попадают записи:
    Code:
    [2016-01-10 02:08:32,032] [Config ] [IMDBFetcher] [ERROR] - Exception for Kinopoisk.ru lookup of %d0%9c%d0%b0%d0%bb%d0%b5%d0%bd%d1%8c%d0%ba%d0%b0%d1%8f+%d1%81%d0%bc%d0%b5%d1%80%d1%82%d1%8c+-+The+Little+Death+%5b2014%5d+%5b720%5d err:Эта операция не может быть выполнена после того, как был передан запрос. stack:  в System.Net.HttpWebRequest.set_ReadWriteTimeout(Int32 value)
      в WebSession.Retrieve(String requestUrl, Encoding encoding, String& responseUrl, String& data)
      в Grabber.MediaPortal.Video.Database.IIMDBScriptGrabber.FindFilm(String strSearch, Int32 iLimit, ArrayList elements)
    Ну и по традиции в атаче логи, где всё развёрнуто
     

    Attachments

    • conf-error.txt
      8.6 KB

    ajs

    Development Group
  • Team MediaPortal
  • February 29, 2008
    15,646
    10,591
    Kyiv
    Home Country
    Ukraine Ukraine
    Ссылки 1 и 3 находит правильно, если удалять артикль 'The'. Может его добавить в правила?
    По желанию :)
    XML:
    <strip>The</strip>
    Ссылку 2 находит, если убирать год. Как вариант, убирать год из названия, если название короткое - оно сбивает поиск с толку
    Некоторые фильмы нашлись кинопоиском правильно, если верить ссылкам в логах, но по итогу в базу грузанулся совсем другой фильм
    Для этого есть ручной анализ :) в скрипте Кинопоиска с соответсвием по ИМДБ, очень много возможных вариантов, поэтому автомат будет ошибаться и достаточно часто.
    Все равно автомат Медиапортала принимает решение какой из списка на его усмотрение более правильный :) Тут я безсилен ...
    Эта операция не может быть выполнена после того, как был передан запрос.
    Где то был таймаут, Кинопоиск таким страдает :)
     

    RabinoVich

    Portal Pro
    December 29, 2009
    258
    36
    Khabarovsk
    Home Country
    Russian Federation Russian Federation
    Для этого есть ручной анализ :) в скрипте Кинопоиска с соответсвием по ИМДБ, очень много возможных вариантов, поэтому автомат будет ошибаться и достаточно часто
    Насколько я понимаю, скрипт работает так:
    1. Ищет по Уинопоиску и находит, допустим, верный вариант
    2. По оригинальному названию с кинопоиска на английском ищет уже на ИМДБ. Допустим подобрал верно
    3. Тянет с Кинопоиска описание, облогу, актёров, факты, ошибки
    4. Тянет с ИМДБ фанарт, доп.облоги, логотипы

    Но почему, если на Кинопоиске фильм нашёлся правильно, а на ИМДБ не правильно он начинает тянуть неправильный фильм с Кинопоиска?
    Может изменить приоритет?
     

    ajs

    Development Group
  • Team MediaPortal
  • February 29, 2008
    15,646
    10,591
    Kyiv
    Home Country
    Ukraine Ukraine
    Ищет по Уинопоиску и находит, допустим, верный вариант
    Нет, он находит Н вариантов согласно установкам в Медиапортале, и так же для каждого из Н вариантов находит Р вариантов на IMDB согласно настроек граббера.
    По оригинальному названию с кинопоиска на английском ищет уже на ИМДБ. Допустим подобрал верно
    Он ничего не подбирает :) он полученный выше список отдает Медиапорталу, который или отдает его пользователю на усмотрение, или выбирает сам, что по его мнению правильный фильм а что нет.
    И когда решение принято то:
    Тянет с Кинопоиска описание, облогу, факты, ошибки
    И т.п. типа Студий, Языков, Стран и еще куча всякой информации как с Кинопоиск так и с IMDB, Актеров тянет сам Медиапортал по фильму если у него есть IMDBID.
    Тянет с ИМДБ фанарт, доп.облоги, логотипы
    Фанарт тянет так же сам Медиапортал, и не с IMDB а зависит от настроек и от граббера картинок :) Доп.Облоги никто не тянет, т.к. нет смысла. Логотипы так же никто не тянет.
    Но почему, если на Кинопоиске фильм нашёлся правильно, а на ИМДБ не правильно он начинает тянуть неправильный фильм с Кинопоиска?
    Повторюсь: Он ничего не подбирает :) он полученный выше список отдает Медиапорталу, который или отдает его пользователю на усмотрение, или выбирает сам, что по его мнению правильный фильм а что нет.
    Может изменить приоритет?
    Приоритет чего?
     

    Users who are viewing this thread

    Top Bottom