Seite 1 von 3

Verfasst: Donnerstag 7. Juli 2005, 10:16
von jens
Ich muß sagen, ich bin etwas enttäuscht... Warum geht's nicht einfach mit einem passendem String-Formatter???

Ich denke es kommt doch häufiger vor, das jemand tausenderpunkte für große Zahlen haben will.

Ist doch nicht's ausßergewäöhnliches...

Wäre es also ein Feature Request?

Verfasst: Donnerstag 7. Juli 2005, 13:32
von jens
@HarryH: Deine Lösung ist schon nicht schlecht. Sie funktioniert allerdings nicht richtig, wenn "%i" als Format benutzt wird :(

Bei mit kommt allerdings beides vor... Deshalb meine Variante:

Code: Alles auswählen

def formatter( number, format = "%.2f" ):
    """Formatiert Zahlen mit Tausenderpunkte"""
    num_string = format % number # Formatierung anwenden
    try:
        pre, post = num_string.split(".")
    except ValueError: # Ganzzahl liegt vor
        pre  = num_string
        post = False
    pre = pre[::-1] # umkehren
    no_split = re.findall( r"\d{3,3}|\d{0,2}", pre )[:-1] # Aufsplitten
    no = ".".join( no_split )[::-1] # Tausenderpunkte + umkehren
    if post: no += ",%s" % post # Nachkommastellen anfügen
    return no

print formatter( 1234567.89 )
print formatter( 12345.1,"%f" )
print formatter( 1234.0,"%i" )
1.234.567,89
12.345,100000
1.234
EDIT: Kann es sein, das eine Stringumkehrung mit [::-1] nicht mit älteren Python Versionen funktioniert :(

Verfasst: Donnerstag 7. Juli 2005, 13:53
von Leonidas
jens hat geschrieben:EDIT: Kann es sein, das eine Stringumkehrung mit [::-1] nicht mit älteren Python Versionen funktioniert :(
Sie dir mal NeuereVersionen an, dort steht das unter "Slice Syntax".

Verfasst: Donnerstag 7. Juli 2005, 14:12
von jens
Leonidas hat geschrieben:Sie dir mal NeuereVersionen an, dort steht das unter "Slice Syntax".
Also gibt's das erst seid Python v2.4 :( Schade... Nunja, hier eine Version, dich auch mit >2.4 läuft:

Code: Alles auswählen

def formatter( number, format = "%.2f" ):
    """Formatiert Zahlen mit Tausenderpunkte"""
    def reverse( string ):
        # ersatz für string[::-1] welches erst ab v2.4 gibt :(
        l = re.findall(".",string)
        l.reverse()
        return "".join( l )

    num_string = format % number # Formatierung anwenden
    try:
        pre, post = num_string.split(".")
    except ValueError: # Ganzzahl liegt vor
        pre  = num_string
        post = False

    pre = reverse( pre ) # umkehren
    num_split = re.findall( r"\d{3,3}|\d{0,2}", pre )[:-1] # Aufsplitten
    num = ".".join( num_split ) # Tausenderpunkte + umkehren
    num = reverse( num )
    if post: num += ",%s" % post # Nachkommastellen anfügen
    return num

re:

Verfasst: Donnerstag 7. Juli 2005, 14:27
von HarryH
Hi,

Code: Alles auswählen

def __formatter(number, format = "%.2f", decChar = ",", groupChar = ".", groupRange = 3):
    """
    Convert to required format
    number =      number to convert
    format =      python string formatting (%)
    decChar =     decimal char for the converted format
    groupChar =   group char for the converted format
    groupRange =  group range for the converted format

    For example:
    __formatter(1234567890.987, "%.2f", ",", ".", 3)
    ==> 1.234.567.890,99

    """

    regex = re.compile("^ *\d*\D\d{1,%s}|\d{1,%s} *" % (groupRange, groupRange))
    form_num = groupChar.join(regex.findall((format % number).replace(".", decChar)[::-1]))[::-1]
    return form_num


Funktioniert nun auch für int-Zahlen.
Außerdem werden auch vorn oder hinten angestellte Leerzeichen mit ausgegeben (z.b. beim Format "%20.2f")

Nun noch eine Frage:
Gibt es bei regex eine Möglichkeit den String von hinten nach vorne zu durchsuchen? :?:
Dann könnte man sich das zweimalige Umkehren des Strings sparen.

Verfasst: Donnerstag 7. Juli 2005, 15:41
von jens
OK, und hier nochmal die Variante für Python >v2.3

Code: Alles auswählen

import re

formatter_regex = re.compile("^ *\d*\D\d{1,3}|\d{1,3} *")
def formatter(number, format = "%.2f", decChar = ",", groupChar = "."):
    """
    Convert to required format
    by HarryH modify by Jens Diemer

    number =      number to convert
    format =      python string formatting (%)
    decChar =     decimal char for the converted format
    groupChar =   group char for the converted format

    For example:
    formatter(1234567890.987, "%.2f", ",", ".")
    ==> 1.234.567.890,99
    formatter( 1234567890.987, "%i")
    ==> 1.234.567.890

    """
    def reverse( string ):
        # ersatz für string[::-1] welches erst ab v2.3 gibt :(
        list = re.findall(".",string)
        list.reverse()
        return "".join( list )

    return reverse(
        groupChar.join(
            formatter_regex.findall(
                reverse( (format % number).replace(".", decChar) )
            )
        )
    )
Ich hab re.compile() außerhalb der Funktion gemacht, deswegen erübrigt sich der Parameter groupRange

Warum hast du die Funktion __formatter genannt? Was bedeuten die doppelten Unterstriche?

Verfasst: Donnerstag 7. Juli 2005, 15:43
von Leonidas
jens hat geschrieben:OK, und hier nochmal die Variante für Python >v2.4
Du meinst wohl 2.3 denn 2.3 kennt schon [::-1].

Verfasst: Donnerstag 7. Juli 2005, 15:46
von jens
Leonidas hat geschrieben:Du meinst wohl 2.3 denn 2.3 kennt schon [::-1].
Oh :oops:

Hab ich oben korregiert...

Verfasst: Donnerstag 7. Juli 2005, 20:47
von gerold
Hi!

Und hier noch eine kleine Übersicht über das Laufzeitverhalten bei 10.000 Durchläufen:

Code: Alles auswählen

#!/usr/bin/env python
# -*- coding: iso-8859-1 -*-

import re

#----------------------------------------------------------------------
def format_number_1(
   number, 
   format = "%0.2f",
   decimal_char = ",",
   group_char = ".",
   group_range = 3
):
   """
   Nach einer Idee von Voges, HarryH und Jens.
   http://www.python-forum.de/viewtopic.php?t=371
   """
   
   def reverse(string):
      # ersatz für string[::-1] welches erst ab v2.3 gibt :(
      list = re.findall(".",string)
      list.reverse()
      return "".join(list)
   
   regex = re.compile(
      "^ *\d*\D\d{1,%s}|\d{1,%s} *" % (group_range, group_range)
   )
   
   return reverse(
      group_char.join(
         regex.findall(
            reverse( (format % number).replace(
               ".", decimal_char) 
            )
         )
      )
   )


#----------------------------------------------------------------------
def format_number_2(
   number, 
   format = "%0.2f",
   decimal_char = ",",
   group_char = ".",
   group_range = 3
):
   """
   Nach einer Idee von Milan.
   http://www.python-forum.de/viewtopic.php?t=371
   """

   def split(s, size = group_range):
      return map(lambda i: s[i:i + size], xrange(0, len(s), size))

   def reverse(s):
      l = map(None, s)
      l.reverse()
      return ('').join(l)

   num = (format % number).replace('.', decimal_char)
   int_part = num[:num.find(decimal_char)]
   return (
      reverse(
         group_char.join(
            split(reverse(int_part))
         )
      ) + num[num.find(decimal_char):]
   ).replace(" %s" % group_char, "  ")
   

if __name__ == "__main__":
   # Testen welche Funktion schneller ist
   
   import time
   
   zahlen = (
      66,
      1,
      2,
      3.4,
      -5.678,
      612345,
      612345.555,
      987654321.067
   )

   begin = time.time()
   
   for i in range(10000):
      for zahl in zahlen:
         x = format_number_1(zahl)

   print "1:", time.time() - begin
   print

   begin = time.time()

   for i in range(10000):
      for zahl in zahlen:
         x = format_number_2(zahl)
         
   print "2:", time.time() - begin
   print
Ergebnis:

Code: Alles auswählen

1: 4.18799996376
2: 2.64100003242
mfg
Gerold
:-)

Verfasst: Donnerstag 7. Juli 2005, 21:19
von jens
Halt, da fehlt noch die ursprüngliche Version und sowieso und überhaupt:

Code: Alles auswählen

#!/usr/bin/python
# -*- coding: UTF-8 -*-

import re

#----------------------------------------------------------------------

format_number_0a_regex = re.compile("^ *\d*\D\d{1,3}|\d{1,3} *")
def format_number_0a(number, format = "%.2f", decChar = ",", groupChar = "."):
    """
    Convert to required format
    number =      number to convert
    format =      python string formatting (%)
    decChar =     decimal char for the converted format
    groupChar =   group char for the converted format
    groupRange =  group range for the converted format

    For example:
    __formatter(1234567890.987, "%.2f", ",", ".", 3)
    ==> 1.234.567.890,99

    """
    form_num = groupChar.join(format_number_0a_regex.findall((format % number).replace(".", decChar)[::-1]))[::-1]
    return form_num

#----------------------------------------------------------------------

def format_number_0b(number, format = "%.2f", decChar = ",", groupChar = ".", groupRange = 3):
    """
    Convert to required format
    number =      number to convert
    format =      python string formatting (%)
    decChar =     decimal char for the converted format
    groupChar =   group char for the converted format
    groupRange =  group range for the converted format

    For example:
    __formatter(1234567890.987, "%.2f", ",", ".", 3)
    ==> 1.234.567.890,99

    """

    regex = re.compile("^ *\d*\D\d{1,%s}|\d{1,%s} *" % (groupRange, groupRange))
    form_num = groupChar.join(regex.findall((format % number).replace(".", decChar)[::-1]))[::-1]
    return form_num

#----------------------------------------------------------------------
format_number_1_regex = re.compile( "^ *\d*\D\d{1,3}|\d{1,3} *" )
def format_number_1(
   number,
   format = "%0.2f",
   decimal_char = ",",
   group_char = "."
):
   """
   Nach einer Idee von Voges, HarryH und Jens.
   http://www.python-forum.de/viewtopic.php?t=371
   """

   def reverse(string):
      # ersatz für string[::-1] welches erst ab v2.3 gibt :(
      list = re.findall(".",string)
      list.reverse()
      return "".join(list)

   return reverse(
      group_char.join(
         format_number_1_regex.findall(
            reverse( (format % number).replace(
               ".", decimal_char)
            )
         )
      )
   )

#----------------------------------------------------------------------
format_number_1_regex = re.compile( "^ *\d*\D\d{1,3}|\d{1,3} *" )
def format_number_1b(
   number,
   format = "%0.2f",
   decimal_char = ",",
   group_char = "."
):
   """
   Nach einer Idee von Voges, HarryH und Jens.
   http://www.python-forum.de/viewtopic.php?t=371
   """

   def reverse(s):
      # ersatz für string[::-1] welches erst ab v2.3 gibt :(
      l = map(None, s)
      l.reverse()
      return ('').join(l)

   return reverse(
      group_char.join(
         format_number_1_regex.findall(
            reverse( (format % number).replace(
               ".", decimal_char)
            )
         )
      )
   )


#----------------------------------------------------------------------
def format_number_2(
   number,
   format = "%0.2f",
   decimal_char = ",",
   group_char = ".",
   group_range = 3
):
   """
   Nach einer Idee von Milan.
   http://www.python-forum.de/viewtopic.php?t=371
   """

   def split(s, size = group_range):
      return map(lambda i: s[i:i + size], xrange(0, len(s), size))

   def reverse(s):
      l = map(None, s)
      l.reverse()
      return ('').join(l)

   num = (format % number).replace('.', decimal_char)
   int_part = num[:num.find(decimal_char)]
   return (
      reverse(
         group_char.join(
            split(reverse(int_part))
         )
      ) + num[num.find(decimal_char):]
   ).replace(" %s" % group_char, "  ")


if __name__ == "__main__":
   # Testen welche Funktion schneller ist

   import time

   zahlen = (
      66,
      1,
      2,
      3.4,
      -5.678,
      612345,
      612345.555,
      987654321.067
   )

   begin = time.time()

   for i in range(10000):
      for zahl in zahlen:
         x = format_number_0a(zahl)

   print "0a:", time.time() - begin
   print

   begin = time.time()

   for i in range(10000):
      for zahl in zahlen:
         x = format_number_0b(zahl)

   print "0b:", time.time() - begin
   print

   begin = time.time()

   for i in range(10000):
      for zahl in zahlen:
         x = format_number_1(zahl)

   print "1:", time.time() - begin
   print


   begin = time.time()

   for i in range(10000):
      for zahl in zahlen:
         x = format_number_1b(zahl)

   print "1b:", time.time() - begin
   print

   begin = time.time()

   for i in range(10000):
      for zahl in zahlen:
         x = format_number_2(zahl)

   print "2:", time.time() - begin
   print

Code: Alles auswählen

0a: 0.921999931335

0b: 1.31200003624

1: 2.4849998951

1b: 1.32800006866

2: 1.57800006866
Ein guter kompromiss (wenn Python >v2.3) ist wohl die 1b Version... Dort hab ich die reverse() Funktion von Milan eingebaut...

Verfasst: Donnerstag 7. Juli 2005, 22:20
von BlackJack
jens hat geschrieben:

Code: Alles auswählen

   def reverse(string):
      # ersatz für string[::-1] welches erst ab v2.3 gibt :(
      list = re.findall(".",string)
      list.reverse()
      return "".join(list)
`list` ist hier ein ganz schlechter Name, weil man genau hier das eingebaute `list()` benutzen kann, um ohne den regulären Ausdruck auszukommen:

Code: Alles auswählen

In [6]: list("hallo")
Out[6]: ['h', 'a', 'l', 'l', 'o']

Verfasst: Freitag 8. Juli 2005, 06:18
von jens
Hier mal ein Test, wie schnell oder langsam die unterschiedlichen reverse() Geschichten sind:

Code: Alles auswählen

import time, re

def reverse0(string):
    l = list( string )
    l.reverse()
    return "".join(l)

def reverse1(s):
    l = map(None, s)
    l.reverse()
    return ('').join(l)

def reverse2(string):
    list = re.findall(".",string)
    list.reverse()
    return "".join(list)

def reverse3(s):
    return s[::-1]


TestString = "1234567890abcdefghijklmnopqrstuvwxyz"
loops = 500000

begin = time.time()
for i in xrange(loops): reverse0( TestString )
print "reverse0: %0.3f" % (time.time()-begin)

begin = time.time()
for i in xrange(loops): reverse1( TestString )
print "reverse1: %0.3f" % (time.time()-begin)

begin = time.time()
for i in xrange(loops): reverse2( TestString )
print "reverse2: %0.3f" % (time.time()-begin)

begin = time.time()
for i in xrange(loops): reverse3( TestString )
print "reverse3: %0.3f" % (time.time()-begin)

Code: Alles auswählen

reverse0: 2.594
reverse1: 2.500
reverse2: 12.953
reverse3: 0.609

re:

Verfasst: Freitag 8. Juli 2005, 06:38
von HarryH
Hi,

Der in den obigen Beispielen verwendete regex muss noch folgendemaßen abgeändert werden:

Code: Alles auswählen

regex = re.compile("^ *\d*\D\d{1,%s}|\d{1,%s}[ -]*" % (groupRange, groupRange))
Ich hatte nämlich ganz vergessen das es auch negative Zahlen gibt :oops:
Jetzt werden auch diese korrekt wiedergegeben.

Verfasst: Freitag 8. Juli 2005, 06:46
von jens
Mir ist da gerade eine Idee gekommen...
Man könnte sich die umkehrung ersparen, wenn man die Zahl vor der RE auffüllt, dann durch RE die tausenderpunkte einfügen läßt und danach, die Aufgefüllten Zeichen wieder abschneidet.

Verfasst: Freitag 8. Juli 2005, 07:39
von cime
cime hat geschrieben:darf ich ma fragen warum das hier so kompliziert gemacht wird?

er will doch nur eine einfache formatierung, die man auch selber schreiben kann, ohne irgendwelche module, oder hab ich das falsch verstanden?

Code: Alles auswählen

#format_number.py

def format_number(number):
    hinter_komma=str(number%1)[2:]
    if not hinter_komma:
        hinter_komma="00"
    elif len(hinter_komma)==1:
        hinter_komma+="0"
    else:
        hinter_komma=hinter_komma[0:2]
    string=","+hinter_komma
    number=int(number)
    x=1
    while 1000**x<=number:
        string="."+str(number%(1000**x))[0:3]+string
        x+=1
    string=str(number/(1000**(x-1)))+string
    return string

print format_number(input("Zahl: "))
das hier macht exakt das, was er haben will, oder?
Hi,

wollt ma fragen, warum ihr meinen code einfach ma so ignoriert. Er hat schließlich ein paar Vorteile:
1. er nutzt keine nicht automatisch schon importierten Funktionen (/Module)
2. er ist mit abstand am schnellsten (sieher unten)

Hier ist er nochmal im Vergleich mit den anderen:

Code: Alles auswählen

# -*- coding: cp1252 -*-
#format_number.py

def format_number_0(number):
    if number<0:
         vorzeichen="-"
         number=-number
    else:
        vorzeichen=""
    hinter_komma=str(number%1)[2:]
    if not hinter_komma:
        hinter_komma="00"
    elif len(hinter_komma)==1:
        hinter_komma+="0"
    else:
        hinter_komma=hinter_komma[0:2]
    string=","+hinter_komma
    number=int(number)
    x=1
    while 1000**x<=number:
        string="."+str(number%(1000**x))[0:3]+string
        x+=1
    string=vorzeichen+str(number/(1000**(x-1)))+string
    return string

#----------------------------------------------------------------------

import re 

#---------------------------------------------------------------------- 
def format_number_1( 
   number, 
   format = "%0.2f", 
   decimal_char = ",", 
   group_char = ".", 
   group_range = 3 
): 
   """
   Nach einer Idee von Voges, HarryH und Jens. 
   http://www.python-forum.de/viewtopic.php?t=371 
   """
    
   def reverse(string): 
      # ersatz für string[::-1] welches erst ab v2.3 gibt :( 
      list = re.findall(".",string) 
      list.reverse() 
      return "".join(list) 
    
   regex = re.compile( 
      "^ *\d*\D\d{1,%s}|\d{1,%s} *" % (group_range, group_range) 
   ) 
    
   return reverse( 
      group_char.join( 
         regex.findall( 
            reverse( (format % number).replace( 
               ".", decimal_char) 
            ) 
         ) 
      ) 
   ) 


#---------------------------------------------------------------------- 
def format_number_2( 
   number, 
   format = "%0.2f", 
   decimal_char = ",", 
   group_char = ".", 
   group_range = 3 
): 
   """
   Nach einer Idee von Milan. 
   http://www.python-forum.de/viewtopic.php?t=371 
    """

   def split(s, size = group_range): 
      return map(lambda i: s[i:i + size], xrange(0, len(s), size)) 

   def reverse(s): 
      l = map(None, s) 
      l.reverse() 
      return ('').join(l) 

   num = (format % number).replace('.', decimal_char) 
   int_part = num[:num.find(decimal_char)] 
   return ( 
      reverse( 
         group_char.join( 
            split(reverse(int_part)) 
         ) 
      ) + num[num.find(decimal_char):] 
   ).replace(" %s" % group_char, "  ") 
    

if __name__ == "__main__": 
    # Testen welche Funktion schneller ist 

    import time 

    zahlen = ( 
      66, 
      1, 
      2, 
      3.4, 
      -5.678, 
      612345, 
      612345.555, 
      987654321.067 
    )
    for x in range(10):
        begin = time.time()

        for i in range(10000): 
          for zahl in zahlen: 
             x = format_number_0(zahl) 

        print "0:", time.time() - begin 
        print 

        begin = time.time() 

        for i in range(10000): 
          for zahl in zahlen: 
             x = format_number_1(zahl) 
              
        print "1:", time.time() - begin 
        print

        begin = time.time() 

        for i in range(10000): 
          for zahl in zahlen: 
             x = format_number_2(zahl) 
              
        print "2:", time.time() - begin 
        print 
Ergebnis:

Code: Alles auswählen

0: 0.828000068665

1: 3.93799996376

2: 2.9849998951

0: 0.81299996376

1: 4.17199993134

2: 2.70299983025

0: 0.844000101089

1: 4.0

2: 2.7349998951

0: 0.891000032425

1: 4.09299993515

2: 2.68799996376

0: 0.827999830246

1: 4.15600013733

2: 3.17200016975

0: 0.875

1: 4.0

2: 2.78099989891

0: 0.844000101089

1: 3.96900010109

2: 2.81299996376

0: 0.844000101089

1: 4.01499986649

2: 2.79699993134

0: 0.844000101089

1: 3.95300006866

2: 2.8900001049

0: 0.875

1: 4.53200006485

2: 2.73500013351

Verfasst: Freitag 8. Juli 2005, 07:49
von mawe
Hi!

Ich werf auch mal eine Version ins Rennen ;

Code: Alles auswählen

def commify(number, comma=",", thousand="."):
    n = str(number).split(comma)
    n[0] = list(str(n[0]))[::-1]
    n[0] = thousand.join(
            ["".join(n[0][i:i+3][::-1]) for i in     
             range(0,len(n[0]),3)][::-1])
    return comma.join(n)

print commify(100000000)
print commify(1000.58,comma=".",thousand=",")
print commify("2,45")
print commify(1234567)
print commify("22343435455423423,2344324234")
Wie's mit der Performance aussieht, weiß ich nicht (ist das überhaupt wichtig?). Von den vielen [::-1] wird mir zwar schlecht, dafür kann man sich die Zeichen für Komma und Tausendertrennung aussuchen (es soll ja Leute geben, bei denen das Komma ein Punkt ist ;)).

Gruß, mawe

Verfasst: Freitag 8. Juli 2005, 07:54
von jens
mawe hat geschrieben:Wie's mit der Performance aussieht, weiß ich nicht (ist das überhaupt wichtig?).
Kommt IMHO drauf an... Wenn man eine große Tabelle "umformen" will, ist es schon nicht schlecht, das es recht schnell geht...

Der größte Knackpunkt ist wohl, wenn Python's [::-1] zum umdrehen nicht vorliegt!

Aber wie schon geschrieben, was ist mit der Idee den Zahl-String auf zu füllen, das es gerade teilbar durch drei ist? ich hab gerade andere Sachen um das mal zu testen...

@cime: Sorry, hatte deinen Code glatt übersehen... Mir scheint es IMHO nur sehr lang ;)

Verfasst: Freitag 8. Juli 2005, 08:50
von mawe
jens, ich weiß nicht ob ich verstanden habe was Du meinst, aber ich hab mal das zusammengestoppelt:

Code: Alles auswählen

def commify(number, comma=",", thousand="."):
    n = str(number).split(comma)
    x = len(n[0]) % 3
    n[0] = "%s%s" % ("0" * (3-x), n[0])
    n[0] = thousand.join([n[0][i:i+3] 
              for i in range(0,len(n[0]),3)]).lstrip("0%s" % thousand)
    return comma.join(n)
Sieht auch recht performant aus :)

Verfasst: Freitag 8. Juli 2005, 11:19
von gerold
cime hat geschrieben: wollt ma fragen, warum ihr meinen code einfach ma so ignoriert. Er hat schließlich ein paar Vorteile:
1. er nutzt keine nicht automatisch schon importierten Funktionen (/Module)
2. er ist mit abstand am schnellsten (sieher unten)
Hi crime!

Ich habe deinen Code deshalb nicht getestet, da es mir wichtig ist, mindestens das Format, das Dezimaltrennzeichen und das Zeichen für die Gruppierung übergeben zu können. Das Einbauen dieser Variablen schien mir bei deinem Code zu kompliert.

Das Format ist wichtig, um auch einfache Listen realisieren zu können. Z.B. mit %15.2f. Oder auch die Rundung besser im Griff zu haben.

lg
Gerold
:-)

Verfasst: Freitag 8. Juli 2005, 11:44
von mawe
gerold hat geschrieben: da es mir wichtig ist, mindestens das Format, das Dezimaltrennzeichen und das Zeichen für die Gruppierung übergeben zu können.
Formatieren kannst Du's doch auch bevor die Zahl an die Funktion übergeben wird.