Zum Inhalt springen

Empfohlene Beiträge

Geschrieben

Hay liebe Com,

ich habe das Problem das ich mit bash ein kleines Programm scripte wo man einen Suchbegriff eingibt und dann alle Links die Google dazu ausspucken würde ausgespuckt werden. (Nur die Links ohne den ganzen anderen Schnickschnack) Jetzt habe ich mit folgendem Bashcode bereits den jeweiligen Quelltext der Googlesuche heruntergeladen. Das funktioniert auch prima, wenn ich den jetzt öffne sehe ich die ersten Links die Google ausspucken würde.

Code:

"

#!/bin/bash

echo "Bitte (...)" <!--Suchbegriff eingeben-->

read SU <!--Suchbegriff-->

echo "Es wird nach $SU gesucht"

sleep 1

echo "Ihre Suche nach $SU (...)"

set -x

wget --useragent 'Mozilla/5.0 (X11; U; Linux i686; de; rv:1.9.0.8)

Gecko/2009033100 Ubuntu/9.04 (jaunty) Firefox/3.0.8 -0 index.html "http://

www.google.de/search?q=$SU

"

Jetzt wurde die Googlesuche als .html gespeichert die man aufmachen kann und dann alle Links usw sehen kann. Nur wie wandele ich .html jetzt so um das Bash die Links der Ergebnisse auslesen kann?

Aus dem Quellcode lässt sich leider nichts rausfinden >.<

Danke für eure Hilfe

MfG

Vaderfone

Geschrieben

Das Problem ist, dass der Link auf der Ergebnisseite nicht der Link der Zielseite ist. Im Grunde müsstest Du eben nur die href Attribute lesen und den Inhalt von diesen zerlegen und den korrekten Link extrahieren. Awk und sed wären wohl die Tools dafür

Geschrieben

Ja diese ergeben sich allerdings leider nicht aus dem html-Quelltext, es sei den jmd. weiß wie mann die Links einer Google suche aus dem Quelltext herausliest o.O. Ich denke man muss die .html datei erst öffnen um dann die Links auszulesen (?)

Danke für deine Hilfe ;-)

Vaderfone

Geschrieben
Ich denke man muss die .html datei erst öffnen um dann die Links auszulesen (?)

Ja natürlich, wie denn sonst !?

Der Link steht im Quelltext, d.h. nimm ein Tool wie sed und suche via regulärem Ausdruck die Daten

Geschrieben
Code:

"

#!/bin/bash

echo "Bitte (...)" <!--Suchbegriff eingeben-->

read SU <!--Suchbegriff-->

echo "Es wird nach $SU gesucht"

sleep 1

echo "Ihre Suche nach $SU (...)"

set -x

wget --useragent 'Mozilla/5.0 (X11; U; Linux i686; de; rv:1.9.0.8)

Gecko/2009033100 Ubuntu/9.04 (jaunty) Firefox/3.0.8 -0 index.html "http://

www.google.de/search?q=$SU

"

Also erstmal vorneweg: Die Bash kennt keine Kommentare in der Form <!-- --> ;)

HTML Code kannst du recht einfach per links/lynx/etc... auf der Konsole darstellen: links -dump "http://www.google.com/search?q=test"

Erstelle ein Benutzerkonto oder melde Dich an, um zu kommentieren

Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können

Benutzerkonto erstellen

Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!

Neues Benutzerkonto erstellen

Anmelden

Du hast bereits ein Benutzerkonto? Melde Dich hier an.

Jetzt anmelden

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...