- October 12, 2011
- 28
- 6
- Home Country
- Germany
Hallo Merlyn,
danke für deine ausführliche Antwort.
Bei Punkt 1 wollet ich folgendes sagen: Soweit ich das verstanden habe schaust Du erst in der "deutschen IMDB". Solltest Du dort keinen Eintrag finden fällst Du zurück auf die "englische IMDB" und liest die verfügbaren englischen Daten ein. Das führt zu 99,xx% zu einem Treffer. Und das ist auch gut so. Leider aber, nach meiner Erfahrung, ziemlich oft zu englischen Daten. Aber: Warum auf halben weg anhalten und nur die IMDB abfragen? Da es bei dem Scraper ja darum geht deutsche Daten zu erhalten wäre es doch nur konsequent zwischen die "deutsche IMDB" und die englische noch weitere deutsche Zwischenstufen einzuziehen und so eine Art deutschen Super-Scraper zu bauen. Also nach dem Motto:
1. deutsche IMDB abfragen
2. deutsche TMDB abfragen
3. weitere andere DBs mit deutschen Daten abfragen (falls vorhanden)
4. Daten aus der englischen IMDB nehmen.
Sobald man einen Treffer hat, wird das natürlich abgebrochen und die Daten verwendet.
Und das gerne auch noch für Filmdaten und FSK oder auch andere (sinnvolle) Datenfelder getrennt, weil ja nicht überall alle Datenfelder gefüllt sind.
Zum Schluss sollte man dann einen möglichst vollständigen Satz an Daten haben.
In dem Zusammenhang: Gibt es eigentlich irgendeine automatische Möglichkeit die Daten, die man selbst komplettiert hat in die Datenbanken zurück zu spielen? Dann sollte sich die Datenlage doch rel. schnell verbessern.
Deine Argumentation unter Punkt 3, dass über die GUI nicht vernünftig gelöscht wird unterstützt meine Idee ja nur.
danke für deine ausführliche Antwort.
Bei Punkt 1 wollet ich folgendes sagen: Soweit ich das verstanden habe schaust Du erst in der "deutschen IMDB". Solltest Du dort keinen Eintrag finden fällst Du zurück auf die "englische IMDB" und liest die verfügbaren englischen Daten ein. Das führt zu 99,xx% zu einem Treffer. Und das ist auch gut so. Leider aber, nach meiner Erfahrung, ziemlich oft zu englischen Daten. Aber: Warum auf halben weg anhalten und nur die IMDB abfragen? Da es bei dem Scraper ja darum geht deutsche Daten zu erhalten wäre es doch nur konsequent zwischen die "deutsche IMDB" und die englische noch weitere deutsche Zwischenstufen einzuziehen und so eine Art deutschen Super-Scraper zu bauen. Also nach dem Motto:
1. deutsche IMDB abfragen
2. deutsche TMDB abfragen
3. weitere andere DBs mit deutschen Daten abfragen (falls vorhanden)
4. Daten aus der englischen IMDB nehmen.
Sobald man einen Treffer hat, wird das natürlich abgebrochen und die Daten verwendet.
Und das gerne auch noch für Filmdaten und FSK oder auch andere (sinnvolle) Datenfelder getrennt, weil ja nicht überall alle Datenfelder gefüllt sind.
Zum Schluss sollte man dann einen möglichst vollständigen Satz an Daten haben.
In dem Zusammenhang: Gibt es eigentlich irgendeine automatische Möglichkeit die Daten, die man selbst komplettiert hat in die Datenbanken zurück zu spielen? Dann sollte sich die Datenlage doch rel. schnell verbessern.
Deine Argumentation unter Punkt 3, dass über die GUI nicht vernünftig gelöscht wird unterstützt meine Idee ja nur.