Zum Inhalt springen

Ads Crawlen


CRogoza

Empfohlene Beiträge

Guten Tag zusammen,

Ziel ist es aus den Suchmaschinen Google, Yahoo und Bing Ad-Anzeigen zu bestimmten Suchwörtern zu crawlen. Leider geben die APIs der genannten Suchmaschinen diese nicht her, oder ich finde es nicht in den API Doks. Kurze Tests mit den APIs haben bei den Results die Ads nicht mitgeliefert.

Hat in dem Bereich jemand Erfahrung oder eine Idee, wie das programmatisch am sinnvollsten zu lösen ist? Ein Webcrawler in Java mit Proxyrotation etc. ist schon vorhanden, weitere ETL Prozesse werden ebenfalls in Java umgesetzt.

Danke schon mal für Ideen und Kommentare!

Link zu diesem Kommentar
Auf anderen Seiten teilen

Dachte eigentlich das Ziel steht da ;)

Ziel ist es aus den Suchmaschinen Google, Yahoo und Bing Ad-Anzeigen zu bestimmten Suchwörtern zu crawlen.
Zweck ist es letztendlich die sichtbare Domain mit der tatsächlichen Redirect-Domain zu vergleichen, ob z. B. fachinformatiker.de dort steht, man aber auf einem ganz anderen Forum landet.
Link zu diesem Kommentar
Auf anderen Seiten teilen

Zweck ist es letztendlich die sichtbare Domain mit der tatsächlichen Redirect-Domain zu vergleichen, ob z. B. fachinformatiker.de dort steht, man aber auf einem ganz anderen Forum landet.

Der Link einer Anzeige steht im HTML Code und auch der Link der redirectet wird, steht auch in dem Dokument.

Also wo ist das Problem?

Link zu diesem Kommentar
Auf anderen Seiten teilen

Leider geben die APIs der genannten Suchmaschinen diese nicht her, oder ich finde es nicht in den API Doks. Kurze Tests mit den APIs haben bei den Results die Ads nicht mitgeliefert.

Das Suchen und Extrahieren funktioniert ja schon, bisher über einen Crawler + Parser. Nur ab einer bestimmten Anzahl an Querys verpasst Google einen Block auf die IP. Und das selbe Problem mit dem Block wird wohl auch bei den anderen Suchmaschinene passieren. Darum die Frage nach der API, ob jemand schon Vergleichbares mit der API gemacht hat.
Link zu diesem Kommentar
Auf anderen Seiten teilen

Sorry, -no offense- aber hast du meine Beiträge gelesen?

Die eingesetzte Sprache ist Java, sowohl beim Crawler als auch beim Parser. Und wie oben geschrieben: die APIs geben die Ads nicht her! Darum erneut die Frage: hat jemand Erfahrung damit die Ads von bestimmten Suchmaschinen (Google, Yahoo, Bing) programmatisch auszulesen und welche Möglichkeiten gibt es die dabei entstehenden Probleme wie IP Sperre zu umgehen. Falls die APIs das können, dann bitte einen Ref dazu, denn weder in der Doku noch in den Tests war es über die API möglich die Problemstellung zu lösen.

Falls das hier einfach der falsche Bereich ist, dann bitte verschieben bzw. Info an mich.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...