Zum Inhalt springen

Webseiten auslesen


pepo

Empfohlene Beiträge

Hallo,

für ein Projekt muss ich Daten von Webseiten auslesen können.

Dh. ich muss bestimmte, selbst zu bestimmende Daten von Webseiten auslesen können und dann in einer DB speichern.

Wie könnte sowas gehen. Ich habe keine Ahnung, vielleicht kann mir ja jemand von Euch helfen. Wäre echt nett.

Ach ja fast vergessen, das ganze soll mit VB 6.0 gemacht werden

Danke schonmal

pepo

Link zu diesem Kommentar
Auf anderen Seiten teilen

du hast mindestens 4 möglichkeiten:

- windows-api:

wininet.dll und z.b. die Internet Data Transfer Library von dev asish.

- webbrowser-control:

Me!txtQuelltext =Me!wbrBrowser.Document .documentElement.OuterHTML

- IE-DOM:

Browserobject.Document.All(0).outerHTML

- XMLDOM:

Set xmlhttp = CreateObject("Msxml2.XMLHTTP")

- oder mit einem anderen bevorzugten tool (z.b. wget :floet: )

s'Amstel

Link zu diesem Kommentar
Auf anderen Seiten teilen

Wie könnte sowas gehen. Ich habe keine Ahnung, vielleicht kann mir ja jemand von Euch helfen. Wäre echt nett.
Vom Prinzip her ganz einfach:

-> Verbindung zur Webseite herstellen

-> Daten über HTTP auslesen

-> DB-Connection öffnen

-> Ausgelesene Daten in DB schreiben

Und das wars auch schon.

Link zu diesem Kommentar
Auf anderen Seiten teilen

hab hier auf der arbeit aktuell an dem rechner an dem ich sitze kein vb

wenn ich später zuhause bin oder am wochenende kann ich dir vielleicht mal ein beispiel geben.

wenn mich meine erinnerung nicht trübt war das ganze wirklich nicht schwer.

Link zu diesem Kommentar
Auf anderen Seiten teilen

sodele, hab mir malkurz zeit genommen

Mach nen neues Form

Geh auf Projekt->Komponenten und such Microsoft Internet Controls oder so :)

klatsch dat dingen auf das form, ne textbox, 2 buttons und ab innen code:


Private Enum brwTextFormat

  Plainform = 0

  HTMLform = 1

End Enum


Private Sub Command1_Click()

    Text1.Text = GetWebBrowserText(0)

End Sub


Private Sub Command2_Click()

    Text1.Text = GetWebBrowserText(1)

End Sub


'Hier lädts du die gewünschte website

Private Sub Form_Load()

    WebBrowser1.Navigate ("http://www.google.de")

End Sub


Private Function GetWebBrowserText(ByVal txtFormat As brwTextFormat) As String

    If txtFormat = Plainform Then

      'Hier grabbst du dir einfach den normalen browserinhalt als text

      GetWebBrowserText = WebBrowser1.Document.Body.InnerText

    Else

      'und hier als html

      GetWebBrowserText = WebBrowser1.Document.documentElement.OuterHTML

    End If

End Function

fertig is das rezept

MfG pico

Link zu diesem Kommentar
Auf anderen Seiten teilen

wie kann ich denn einen bestimmten teil, den der nutzer selbst auswählen können soll auslesen.

z.B. mit ...

WebBrowser1.Document.Forms(1) 'das 2. <form>-tag

WebBrowser1.Document.All.tags("A")(5).innerText 'den inhalt des 6. <A> tags

WebBrowser1.Document.All.meinBild.src 'den url des bildes mit namen meinbild

WebBrowser1.Document.frames(1).Document 'den inhalt des ersten frames im dokument

usw. usf., siehe DOM.

s'Amstel

Link zu diesem Kommentar
Auf anderen Seiten teilen

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...