Programm für komplexe "Textoperationen"

  • Was ich suche ist ein Programm für Windows das es mir ermöglicht Textpassagen aus großen Textfiles zu extrahieren (bzw. komplexe Operationen auf Texte anzuwenden).

    Z.b. Möchte ich an das Programm Anfragen wie: "Lösche jede zweite Zeile aus dem Textfile" oder "Ersetze jeden dritten ; durch ein =" oder wie auch immer stellen können.

    Freeware oder OSS sollte das Ding auch noch sein, wenns geht. Kennt ihr da vielleicht was? ;)

  • du bist der erste, den ich kenne und der so etwas braucht :) daher kenne ich auch keine derartigen tools.. verrätst du uns auch, wozu du es verwenden möchtest?

    sollte aber etwa in c# nicht schwer zu implementieren sein, falls du nichts findest.. eventuell könnte man es auch mit word + vba versuchen, ist aber wahrscheinlich eher unlustig...

    lg michi

  • ich würd mal ultraedit probieren.
    dort hast du eine "normale" textsuche mit ersetzen-funktion, wie auch
    zb in word. du kannst dabei auch variablen angeben. evtl is da was
    passendes dabei

    intelligenz * schönheit = const

  • ist wahrscheinlich eine dumme frage für regexp-freaks:

    wie beschreibe ich mit einer regular expression zB jeden 3. beistrich?

    sorry, thinf ist ja schon wieder 2 semester her :D

    lg michi

  • Hoffentlich blamier ich mich jetzt nicht, aber so ungefähr sollte es funktionieren (ich nehme hierzu an, daß wir bei einem Zeilenanfang mit der Suche starten):

    "^.*,.*,.*,"

    Da ist nur ein Problem - es findet den ganzen Ausdruck und nicht nur den letzten Beistrich als einzelnes Zeichen, außerdem ist das nicht ganz jeder 3. Beistrich sondern der 3. Beistrich, der nach einem Zeilenanfang kommt.

    Kommt darauf an, was man machen möchte, manchmal ist EXCEL zum Strukturieren von Daten recht nützlich, wenn man die Daten richtig importiert und z.B. mit Ultraedit (coolster non-GPL Editor wo gibt find ich, der Spaltenmodus ist echt super hilfreich) vor- oder nachbereitet.

    HaRdCoRe HaS JuSt BeGuN!

  • ^.*,.*,.*, is zwar von der Idee her gut, wird aber nicht funktionieren, weil ".*" _alle_ Zeichen (üblicherweise ohne newline) auswählt, also auch die Beistriche. Wenn man alle Zeichen außer dem Beistrich haben will sollte [^,] das Richtige sein, i.e. [^,]*,[^,]*,[^,]*, . Wie man jetzt definitiv zum letzten Zeichen kommt hängt von der verwendeten Umgebung ab (z.B. in lex via yytext & yylen).

    Ich würde auch etwas in die Richtung perl/awk/sed empfehlen.

    Why bother spending time reading up on things? Everybody's an authority, in a free land.

  • Zitat von jeuneS2

    ^.*,.*,.*, is zwar von der Idee her gut, wird aber nicht funktionieren, weil ".*" _alle_ Zeichen (üblicherweise ohne newline) auswählt, also auch die Beistriche


    ha - das hab ich vergessen!

    Bevor das Forum weg war ist mir noch eingefallen, daß man für sich wiederholende Vorgänge in Word ein Makro aufzeichnen kann und das mit einer Tastenkombination dauernd abspielen, wenn noch was fehlt, kann man das geschwind in VB dazupfuschen - wäre ne blitzschnelle Lösung, kann aber sicher nicht so viel wie andere Ansätze. Wenn ich zu faul zum Programmieren bin oder wenns schnell gehen soll, verwend ich meist ne Kombination aus Word und/oder Excel mit/ohne VB zusätzlich und UltraEdit, je nachdem was grad anfällt.

    HaRdCoRe HaS JuSt BeGuN!

  • Zitat von michi204

    du bist der erste, den ich kenne und der so etwas braucht :) daher kenne ich auch keine derartigen tools.. verrätst du uns auch, wozu du es verwenden möchtest?


    Kann ich dir verraten. Ich bin gerade in der Planungsphase für ein kleines Projekt. Genauer gesagt handelt es sich dabei um ein Freeware Multiplatform Dictionary (Win, Mac, Linux). Ich habe bereits alle möglichen unter der GPL releasden Dictionarys im "DICT" Format daheim. Das Format find' ich aber absolut scheußlich, unpraktisch und nicht erweiterbar. -> Ich werde ein eigenes XMLartiges Fileformat entwerfen.

    Dazu muss ich natürlich die DICT Files konvertieren. Tja, deswegen meine Frage. :D

    Scheint wohl doch so als ob ich nicht darum herumkommen würde, kein Skript programmieren zu müssen. Naja, was solls. Ist ja nicht so schwer. ;)

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!