Zeilenumbruch programmieren

cofi · Dienstag 6. Mai 2014, 14:05

@EyDu Das war eine Aufforderung an dich, eine Idee beizusteuern

@nfehren: Das ist zu Grob. Spiele das doch mal mit einem Beispieltext durch, dann siehst du auch die einzelnen Faelle an die du denken musst.
Wie stellst du fest, dass du umbrechen musst? Wie verwaltest du die Information welche Woerter du schon ausgegeben hast und welche noch kommen, etc etc

Hyperion · Dienstag 6. Mai 2014, 14:33

cofi hat geschrieben:@EyDu Das war eine Aufforderung an dich, eine Idee beizusteuern

So sieht es nämlich aus... außerdem wollte ich testen, ob dem OP das auffällt, indem er die bis dato vorgeschlagenen Ideen, z.B. von /me, durchgeht...

Klingt doch glaubhaft, oder?

EyDu · Dienstag 6. Mai 2014, 14:53

Nagut, wenn es so ist. Eigentlich lösen wir hier ja keine Hausaufgaben, aber hier können wir vielleicht mal eine Ausnahme machen.

Code: Alles auswählen

# -*- coding: utf-8 -*-
TEXT = u"Das hier wird ein längerer Text der einem Test dienen soll, einen Zeilenumbruch zu machen. Die Zeilen dürfen 50 Zeichen breit sein und müssen danach ein newline vorweisen können. Im Nachhinein muss man das Programm so verbessern, dass es keine ganzen Wörter abschneidet. Viel Glück!"

j=" ".join;w=lambda t:"\n".join(map(j,reduce(lambda l,y:(l[-1].append(y)if 80>=len(j(l[-1]+[y]))else l.append([y]),l)[1],t.split(),[[]])))

print w(TEXT)

Man kann da sicher noch ein wenig kürzen, aber ehrlich gesagt wollte ich aus einer überischtlichen Lösung keine unübersichtliche machen. Probleme mit Wörter >80 Zeichen werden natürlich ignoriert.

/me · Dienstag 6. Mai 2014, 15:13

EyDu hat geschrieben:Man kann da sicher noch ein wenig kürzen, aber ehrlich gesagt wollte ich aus einer überischtlichen Lösung keine unübersichtliche machen.

Das ist eindeutig die absolut übersichtlichste Variante die einem als erstes in den Sinn kommt. Vielleicht mag der Fragesteller trotzdem noch mal einen anderen Ansatz ausprobieren.

nfehren · Dienstag 6. Mai 2014, 15:53

EyDu hat geschrieben:Nagut, wenn es so ist. Eigentlich lösen wir hier ja keine Hausaufgaben, aber hier können wir vielleicht mal eine Ausnahme machen.
Code: Alles auswählen
# -*- coding: utf-8 -*-
TEXT = u"Das hier wird ein längerer Text der einem Test dienen soll, einen Zeilenumbruch zu machen. Die Zeilen dürfen 50 Zeichen breit sein und müssen danach ein newline vorweisen können. Im Nachhinein muss man das Programm so verbessern, dass es keine ganzen Wörter abschneidet. Viel Glück!"

j=" ".join;w=lambda t:"\n".join(map(j,reduce(lambda l,y:(l[-1].append(y)if 80>=len(j(l[-1]+[y]))else l.append([y]),l)[1],t.split(),[[]])))

print w(TEXT)
Man kann da sicher noch ein wenig kürzen, aber ehrlich gesagt wollte ich aus einer überischtlichen Lösung keine unübersichtliche machen. Probleme mit Wörter >80 Zeichen werden natürlich ignoriert.

Natürlich sehr nett das du dir die Mühe machst und mir den Code-Schnipsel schreibst aber darauf war ich nicht wirklich aus.. Ich möchte die Sache verstehen. Sonst könnte ich ja auch einfach dieses textwrap modul benutzen. Das was du geschrieben hast verstehe ich zum großteil nicht. Trotzdem vielen dank für die Mühe

/me · Dienstag 6. Mai 2014, 16:18

nfehren hat geschrieben:Ich möchte die Sache verstehen.

Dann habe ich hier mal einen Codeschnipsel zum experimentieren und erweitern.

Code: Alles auswählen

def get_first_part(text, max_length):
    if len(text) <= max_length:
        return text
    for pos in range(max_length - 1, 0, -1):
        if text[pos] == ' ':
            return text[:pos]

BlackJack · Dienstag 6. Mai 2014, 16:59

Ähm, um die Position eines Zeichens zu finden gibt es auch Methoden auf Zeichenketten-Objekten.

mutetella · Dienstag 6. Mai 2014, 17:59

Und ich werfe jetzt mal `''.partition()` in den Ring:

Code: Alles auswählen

>>> text = 'A long sentence, really long.'
>>> text.partition(' ')
('A', ' ', 'long sentence, really long.')

Ich könnte mir vorstellen, dass man sich damit Wort für Wort geben lässt und diese zusammensetzt, bis der zusammengesetzte Text plus das kommende Wort länger als die 80 Zeichen sind. Dann geb' ich den zusammengesetzten Text zurück und mach' weiter...

mutetella

BlackJack · Dienstag 6. Mai 2014, 18:20

@mutetella: Wäre es da nicht geschickter gleich mit `split()` alle Worte auf einmal zu trennen, anstatt das Wort für Wort zu machen?

/me · Dienstag 6. Mai 2014, 18:23

BlackJack hat geschrieben:Ähm, um die Position eines Zeichens zu finden gibt es auch Methoden auf Zeichenketten-Objekten.

Der Fragesteller wollte ja unbedingt so low-level wie möglich arbeiten.

/me · Dienstag 6. Mai 2014, 18:24

BlackJack hat geschrieben:@mutetella: Wäre es da nicht geschickter gleich mit `split()` alle Worte auf einmal zu trennen, anstatt das Wort für Wort zu machen?

Man könnte dann auch noch direkt eine Liste aus Tupeln mit Wort und Wortlänge bauen.

mutetella · Dienstag 6. Mai 2014, 19:19

@BlackJack
Ja, wäre geschickter. Aber ich wollte einfach mal das arme, vernachlässigte `partition()` aus seiner dunklen Kammer ans Licht bringen...

mutetella

Sirius3 · Mittwoch 7. Mai 2014, 00:54

Ich glaube einfache Lösungen werden hier nicht gesucht

Code: Alles auswählen

# -*- coding: utf-8 -*-
import re

TEXT = u"Das hier wird ein längerer Text der einem Test dienen soll, einen Zeilenumbruch zu machen. Die Zeilen dürfen 50 Zeichen breit sein und müssen danach ein newline vorweisen können. Im Nachhinein muss man das Programm so verbessern, dass es keine ganzen Wörter abschneidet. Viel Glück!"
print re.sub('(.{,80}) ',r'\1\n',TEXT)

EyDu · Mittwoch 7. Mai 2014, 01:10

@Sirius3: Die Lösung ist wirklich hübsch.

nfehren · Donnerstag 8. Mai 2014, 13:07

Also ich hab das jetzt mal soweit, dass er bei 50 abschneidet und mir sagt wie viele zeichen + das letzte Leerzeichen es noch gibt. Jetzt muss ich nur noch diese Anzahl der jeweiligen Zeile abziehen und an die untere vorne anhängen. Hier steh ich jetzt aber echt aufm Schlauch vor allem weil ich jetzt in einer Endlosschleife bin.

Code: Alles auswählen

while j <= len(s):
    line = ""
    for i in range (j -1 , j + z -1):
        if i < len(s):
            line += (s[i])
    if len(line) == z:
        for i in range(0, z):
            print(z -1 - i, len(line))
            if line[z -1 - i] == " ":
                break
        j += 50 - i -1
    print(i+1)
    print(line)

BlackJack · Donnerstag 8. Mai 2014, 13:34

@nfehren: Die Zeilen 2 bis 5 (inklusive) sind äusserst umständlich. Den gleichen Effekt könntest Du durch eine einzige Zeile bekommen in der Du einfach den entsprechenden Ausschnitt per „slicing” kopierst. Also ``line = s[j - 1:j + z - 1]`` wenn ich das richtig sehe.

Aber vielleicht sollte man das Ende erst mal ermitteln statt zwingend `z` Zeichen an `line` zu binden. Ich bin mir auch nicht sicher ob ``j - 1`` so eine gute Idee ist, denn `j` wird man vor der Schleife ja an 0 binden.

Du hast da noch eine literale 50 im Quelltext die vielleicht noch durch `z` ersetzt werden sollte. Beziehungsweise alle `z` dann durch einen Namen der dem Leser auf den ersten Blick verrät was der Wert in dem Algorithmus bedeutet.

Ich würde zwei Indizes verwenden, einen für die Startposition und einen für die Endposition. Und das ausschneiden der Teilzeichenkette erst machen wenn beide stimmen. Also solange der Startindex noch kleiner als die Länge des Textes ist, den Endindex ermitteln, dann die Teilzeichenkette ausgeben und den Startindex anpassen. Start und Ende kann man auch entsprechend `start` und `end` nennen, statt `i` und `j`.

BlackJack · Dienstag 13. Mai 2014, 08:11

Ich hab's mal in JavaScript umgesetzt:

Code: Alles auswählen

#!/usr/bin/env node
'use strict';

String.prototype.wrap = function (maxWidth) {
    var lines, start, end;
    maxWidth = maxWidth || 80;
    lines = [];
    start = 0;
    while (start < this.length) {
        end = start + maxWidth;
        if (end < this.length) {
            while (end > start && this[end] !== ' ') {
                end -= 1;
            }
        }
        if (start === end) {
            end += maxWidth;
        }
        lines.push(this.slice(start, end));
        start = end;
        if (this[start] === ' ') {
            start += 1;
        }
    }
    return lines.join('\n');
};

var main = function () {
    var text = 'Das hier wird ein längerer Text der einem Test dienen soll,'
        + ' einen Zeilenumbruch zu machen. Die Zeilen dürfen 50 Zeichen breit'
        + ' sein und müssen danach ein newline vorweisen können. Im Nachhinein'
        + ' muss man das Programm so verbessern, dass es keine ganzen Wörter'
        + ' abschneidet. Viel Glück! '
        + '=================================================='
        + '==================================================';
    
    console.log(text.wrap(50));
    console.log(text.wrap());
    console.log(''.wrap());
};

if (require.main === module) {
    main();
}