Zum Inhalt springen

Empfohlene Beiträge

Geschrieben

Hay liebe Com,

ich habe das Problem das ich mit bash ein kleines Programm scripte wo man einen Suchbegriff eingibt und dann alle Links die Google dazu ausspucken würde ausgespuckt werden. (Nur die Links ohne den ganzen anderen Schnickschnack) Jetzt habe ich mit folgendem Bashcode bereits den jeweiligen Quelltext der Googlesuche heruntergeladen. Das funktioniert auch prima, wenn ich den jetzt öffne sehe ich die ersten Links die Google ausspucken würde.

Code:

"

#!/bin/bash

echo "Bitte (...)" <!--Suchbegriff eingeben-->

read SU <!--Suchbegriff-->

echo "Es wird nach $SU gesucht"

sleep 1

echo "Ihre Suche nach $SU (...)"

set -x

wget --useragent 'Mozilla/5.0 (X11; U; Linux i686; de; rv:1.9.0.8)

Gecko/2009033100 Ubuntu/9.04 (jaunty) Firefox/3.0.8 -0 index.html "http://

www.google.de/search?q=$SU

"

Jetzt wurde die Googlesuche als .html gespeichert die man aufmachen kann und dann alle Links usw sehen kann. Nur wie wandele ich .html jetzt so um das Bash die Links der Ergebnisse auslesen kann?

Aus dem Quellcode lässt sich leider nichts rausfinden >.<

Danke für eure Hilfe

MfG

Vaderfone

Geschrieben

Das Problem ist, dass der Link auf der Ergebnisseite nicht der Link der Zielseite ist. Im Grunde müsstest Du eben nur die href Attribute lesen und den Inhalt von diesen zerlegen und den korrekten Link extrahieren. Awk und sed wären wohl die Tools dafür

Geschrieben

Ja diese ergeben sich allerdings leider nicht aus dem html-Quelltext, es sei den jmd. weiß wie mann die Links einer Google suche aus dem Quelltext herausliest o.O. Ich denke man muss die .html datei erst öffnen um dann die Links auszulesen (?)

Danke für deine Hilfe ;-)

Vaderfone

Geschrieben
Ich denke man muss die .html datei erst öffnen um dann die Links auszulesen (?)

Ja natürlich, wie denn sonst !?

Der Link steht im Quelltext, d.h. nimm ein Tool wie sed und suche via regulärem Ausdruck die Daten

Geschrieben
Code:

"

#!/bin/bash

echo "Bitte (...)" <!--Suchbegriff eingeben-->

read SU <!--Suchbegriff-->

echo "Es wird nach $SU gesucht"

sleep 1

echo "Ihre Suche nach $SU (...)"

set -x

wget --useragent 'Mozilla/5.0 (X11; U; Linux i686; de; rv:1.9.0.8)

Gecko/2009033100 Ubuntu/9.04 (jaunty) Firefox/3.0.8 -0 index.html "http://

www.google.de/search?q=$SU

"

Also erstmal vorneweg: Die Bash kennt keine Kommentare in der Form <!-- --> ;)

HTML Code kannst du recht einfach per links/lynx/etc... auf der Konsole darstellen: links -dump "http://www.google.com/search?q=test"

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...