Text nach Häufigkeit der Worte sortieren

17. November 201015 j

Guten Morgen,

ich würde gerne einen Text nach der Häufigkeit der auftretenden Worte sortieren. Da ich auf diesem Gebiet bisher wenig Erfahrung habe , habe ich keinen richtigen Ansatz.Ich weiss das man dies mit "cat" und "sort" machen kann , allerdings nicht genau wie . Wäre für Hilfe sehr dankbar.

grüße

homer123

17. November 201015 j

Hi,

so ganz trivial ist das nicht. Ich habe etwas gefunden:

sed -e 's/\.//g'  -e 's/ /\n/g' test.txt | tr 'A-Z' 'a-z' | sort | uniq -c | sort -nr

Das ist von hier:

Text Processing Commands

Sed ist hier eher das Mittel der Wahl, mit sort und cat wüsste ich keine Lösung.

17. November 201015 j

danks schön für die Antwort:)

ich habe das jetzt einmal so gemacht :

tr -sc 'a-zA-Z' '\012' < test.txt | sort | uniq -c | cat -n

angenommen in dem Text kommt einmal das Wort "Das" großgeschrieben und einmal "das" kleingeschrieben vor. Nun soll dies nicht als zwei Wörter, sondern als ein Wort aufgefasst werden. Geht das irgendwie

grüße

homer123

17. November 201015 j

Eine Frage zwischendurch, die nicht unbedingt mit dem Thema zu tun hat: Waren solche Fragestellungen nicht der Grund dafür, dass so Ungetüme wie awk entwickelt worden sind, bzw. später dann PERL? Warum das nicht damit lösen, oder ganz einfach mit modernen Skriptsprachen wie Python oder Ruby? Vorallem, weil die -behaupte ich einmal stumpf- wesentlich schneller von der Laufzeit her sind, als die gute alte Bash.

24. November 201015 j

Guten Morgen,

das mag sein , dass das auch einfacher geht , allerdings soll dies mit cat und sort gemacht werden.

homer123

Archiv

Dieses Thema wurde archiviert und kann nicht mehr beantwortet werden.

Zur Themenliste gehen

Anmelden

Text nach Häufigkeit der Worte sortieren

Empfohlene Antworten

Archiv

Konto

Navigation

Suchen

Configure browser push notifications

Chrome (Android)

Chrome (Desktop)

Safari (iOS 16.4+)

Safari (macOS)

Edge (Android)

Edge (Desktop)

Firefox (Android)

Firefox (Desktop)