如何用逗号将数字打印为千位分隔符?


752

我正在尝试在Python 2.6.1中打印一个整数,并以逗号作为千位分隔符。例如,我要将数字显示12345671,234,567。我将如何去做呢?我在Google上看到了很多示例,但我正在寻找最简单的实用方法。

在句点和逗号之间进行决定不需要特定于区域设置。我希望尽可能简单一些。

Answers:


1736

不知道语言环境

'{:,}'.format(value)  # For Python ≥2.7
f'{value:,}'  # For Python ≥3.6

区域感知

import locale
locale.setlocale(locale.LC_ALL, '')  # Use '' for auto, or force e.g. to 'en_US.UTF-8'

'{:n}'.format(value)  # For Python ≥2.7
f'{value:n}'  # For Python ≥3.6

参考

每种格式规格的迷你语言

','选项表示千位分隔符使用逗号。对于可识别语言环境的分隔符,请改用'n'整数表示类型。


24
请注意,在美国以外的其他地方,这是不正确的,在这种情况下,所选的locale.format()是正确的答案。
Gringo Suave 2014年

10
关键字参数形式:{val:,}.format(val=val)
CivFan 2015年

11
十分感谢。对于金额,用2个小数位表示-“ {:,。2f}”。format(value)
dlink

3
对于葡萄牙,我们仅将点(。)用作分隔符:{

13
在python 3.6及更高版本中,f字符串增加了更多的便利。例如f"{2 ** 64 - 1:,}"
CJ Gaconnet '17

285

我得到这个工作:

>>> import locale
>>> locale.setlocale(locale.LC_ALL, 'en_US')
'en_US'
>>> locale.format("%d", 1255000, grouping=True)
'1,255,000'

当然,您不需要国际化支持,但它清晰,简洁并且使用内置库。

PS“%d”是通常的%样式格式化程序。您只能有一个格式化程序,但是就字段宽度和精度设置而言,它可以是您所需的任何格式。

PPS如果您无法locale上班,建议您修改Mark的答案:

def intWithCommas(x):
    if type(x) not in [type(0), type(0L)]:
        raise TypeError("Parameter must be an integer.")
    if x < 0:
        return '-' + intWithCommas(-x)
    result = ''
    while x >= 1000:
        x, r = divmod(x, 1000)
        result = ",%03d%s" % (r, result)
    return "%d%s" % (x, result)

递归对于否定情况很有用,但是每个逗号一次递归对我来说似乎有点多余。


14
我尝试了您的代码,但不幸的是,我得到了:“ locale.Error:不支持的语言环境设置”。:-s
Mark Byers,

11
马克:如果您使用的是Linux,则可能要查看/etc/locale.gen中的内容,或者您​​的glibc用于构建其语言环境的任何内容。您可能还想尝试“ en”,“ en_US.utf8”,“ en_US.UTF-8”,“ en_UK”(sp?)等。mikez:需要有一本书:“ PEP博士:或者我如何学会不再担心和爱docs.python.org。” 我放弃了记住所有关于Python 1.5.6的库。至于locale,我会尽可能少地使用它。
Mike DeSimone

10
您可以使用'' setlocale来使用默认值,希望它是合适的。
Mark Ransom

24
试试这个:locale.setlocale(locale.LC_ALL,'')它为我工作
Nadia Alramli

1
尽管很聪明,但我不喜欢进行全局设置的函数...使用'blah'.format()是更好的方法。
塞林

132

由于效率低下和可读性差,很难克服:

>>> import itertools
>>> s = '-1234567'
>>> ','.join(["%s%s%s" % (x[0], x[1] or '', x[2] or '') for x in itertools.izip_longest(s[::-1][::3], s[::-1][1::3], s[::-1][2::3])])[::-1].replace('-,','-')

171
投票支持最低效且难以理解的方法来回答这个问题。
psytek

1
如果这至少行得通,那就太好了。试试这个数字“ 17371830”,它变成“ 173.718.3.0” =)
holms 2012年

5
时期?霍姆斯,那根本不可能。这部分垃圾完全忽略了语言环境。我不知道你是怎么得到这个结果的。如您的预期,您的示例为我产生了“ 17,371,830”。
Kasey Kirkham

11
为了使这个功能发挥作用,我建议:lambda x: (lambda s: ','.join(["%s%s%s" % (x[0], x[1] or '', x[2] or '') for x in itertools.izip_longest(s[::-1][::3], s[::-1][1::3], s[::-1][2::3])])[::-1].replace('-,','-'))(str(x))保持混淆主题。
2012年

95

在删除无关部分并对其进行一些清理之后,这是区域设置代码:

(以下仅适用于整数)

def group(number):
    s = '%d' % number
    groups = []
    while s and s[-1].isdigit():
        groups.append(s[-3:])
        s = s[:-3]
    return s + ','.join(reversed(groups))

>>> group(-23432432434.34)
'-23,432,432,434'

这里已经有一些不错的答案。我只想添加此内容以供将来参考。在python 2.7中,将有一个用于千位分隔符的格式说明符。根据python文档,它像这样工作

>>> '{:20,.2f}'.format(f)
'18,446,744,073,709,551,616.00'

在python3.1中,您可以执行以下操作:

>>> format(1234567, ',d')
'1,234,567'

是的,较难的方法主要是针对使用旧Python的人,例如RHEL和其他长期支持发行版附带的Python。
Mike DeSimone 2012年

3
如何用格式字符串表达这一点?“%d”%1234567不起作用
弗雷德里克·巴赞

91

令我惊讶的是,没有人提到您可以在Python 3.6中使用f字符串做到这一点,就像这样简单:

>>> num = 10000000
>>> print(f"{num:,}")
10,000,000

...冒号后面的部分是格式说明符。逗号是所需的分隔符,因此请f"{num:_}"使用下划线而不是逗号。

这等效于format(num, ",")用于旧版本的python 3。


39

这是单行正则表达式替换:

re.sub("(\d)(?=(\d{3})+(?!\d))", r"\1,", "%d" % val)

仅适用于非正式输出:

import re
val = 1234567890
re.sub("(\d)(?=(\d{3})+(?!\d))", r"\1,", "%d" % val)
# Returns: '1,234,567,890'

val = 1234567890.1234567890
# Returns: '1,234,567,890'

或对于少于4位数字的浮点数,将格式说明符更改为%.3f

re.sub("(\d)(?=(\d{3})+(?!\d))", r"\1,", "%.3f" % val)
# Returns: '1,234,567,890.123'

注意:超过三位的小数位数无法正常工作,因为它将尝试对小数部分进行分组:

re.sub("(\d)(?=(\d{3})+(?!\d))", r"\1,", "%.5f" % val)
# Returns: '1,234,567,890.12,346'

怎么运行的

让我们分解一下:

re.sub(pattern, repl, string)

pattern = \
    "(\d)           # Find one digit...
     (?=            # that is followed by...
         (\d{3})+   # one or more groups of three digits...
         (?!\d)     # which are not followed by any more digits.
     )",

repl = \
    r"\1,",         # Replace that one digit by itself, followed by a comma,
                    # and continue looking for more matches later in the string.
                    # (re.sub() replaces all matches it finds in the input)

string = \
    "%d" % val      # Format the string as a decimal to begin with

1
使用详细模式,您可以在代码内添加注释
DanielStracaboško,

您不能用“ $”替换“(?!\ d)”吗?
GL2014

28

这就是我为花车所做的。虽然,老实说,我不确定它适用于哪个版本-我使用的是2.7:

my_number = 4385893.382939491

my_string = '{:0,.2f}'.format(my_number)

回报:4,385,893.38

更新:我最近遇到了这种格式的问题(无法告诉您确切的原因),但是可以通过删除0:来解决它:

my_string = '{:,.2f}'.format(my_number)

19

您也可以将其'{:n}'.format( value )用于语言环境。我认为这是语言环境解决方案的最简单方法。

有关更多信息,请thousandsPython DOC中搜索。

对于货币,您可以使用locale.currency,设置标志grouping

import locale

locale.setlocale( locale.LC_ALL, '' )
locale.currency( 1234567.89, grouping = True )

输出量

'Portuguese_Brazil.1252'
'R$ 1.234.567,89'

13

稍微扩大Ian Schneider的答案:

如果要使用自定义的千位分隔符,最简单的解决方案是:

'{:,}'.format(value).replace(',', your_custom_thousands_separator)

例子

'{:,.2f}'.format(123456789.012345).replace(',', ' ')

如果要这样的德语表示形式,它将变得更加复杂:

('{:,.2f}'.format(123456789.012345)
          .replace(',', ' ')  # 'save' the thousands separators 
          .replace('.', ',')  # dot to comma
          .replace(' ', '.')) # thousand separators to dot

稍短一些:'{:_.2f}'.format(12345.6789).replace('.', ',').replace('_', '.')
汤姆·波尔

12

我确定必须有一个标准的库函数,但是尝试自己使用递归编写它很有趣,所以这是我想出的:

def intToStringWithCommas(x):
    if type(x) is not int and type(x) is not long:
        raise TypeError("Not an integer!")
    if x < 0:
        return '-' + intToStringWithCommas(-x)
    elif x < 1000:
        return str(x)
    else:
        return intToStringWithCommas(x / 1000) + ',' + '%03d' % (x % 1000)

话虽如此,如果其他人确实找到了一种标准方法,则应该改用该方法。


不幸的是,并非在所有情况下都有效。intToStringWithCommas(1000.1) - > '1.0001,000'
纳迪亚Alramli

他专门说了整数,它应该尽可能简单,因此我决定不处理整数以外的数据类型。我还在函数名称_int_ToStringWithCommas中明确了它。现在,我还增加了加薪幅度以使其更加清晰。
Mark Byers

8

评论到activestate食谱498181,我对此进行了重新设计:

import re
def thous(x, sep=',', dot='.'):
    num, _, frac = str(x).partition(dot)
    num = re.sub(r'(\d{3})(?=\d)', r'\1'+sep, num[::-1])[::-1]
    if frac:
        num += dot + frac
    return num

它使用正则表达式功能:先行搜索,(?=\d)确保只有三个数字组成的组在其“后”有一个逗号。我说“之后”是因为此时字符串是反向的。

[::-1] 只是反转一个字符串。




5

从Python 2.6版开始,您可以执行以下操作:

def format_builtin(n):
    return format(n, ',')

对于2.6以下的Python版本,仅供参考,这里有2个手动解决方案,它们将浮点数转换为整数,但是负数可以正常工作:

def format_number_using_lists(number):
    string = '%d' % number
    result_list = list(string)
    indexes = range(len(string))
    for index in indexes[::-3][1:]:
        if result_list[index] != '-':
            result_list.insert(index+1, ',')
    return ''.join(result_list)

这里需要注意的几件事:

  • 这行代码:string ='%d'%number数字很好地转换为字符串,它支持负数,并从浮点数中除去小数,使它们成为整数;
  • 这个slice的索引[::-3]从末尾开始返回每个第三个项目,因此我使用了另一个切片[1:]删除了最后一个项目,因为在最后一个数字之后不需要逗号;
  • 如果l [index]!='-'用于支持负数,则此条件,不要在减号后插入逗号。

还有一个更核心的版本:

def format_number_using_generators_and_list_comprehensions(number):
    string = '%d' % number
    generator = reversed( 
        [
            value+',' if (index!=0 and value!='-' and index%3==0) else value
            for index,value in enumerate(reversed(string))
        ]
    )
    return ''.join(generator)

2

我是Python初学者,但是经验丰富的程序员。我有Python 3.5,所以我只能使用逗号,但这仍然是一个有趣的编程练习。考虑无符号整数的情况。添加数千个分隔符的最易读的Python程序似乎是:

def add_commas(instr):
    out = [instr[0]]
    for i in range(1, len(instr)):
        if (len(instr) - i) % 3 == 0:
            out.append(',')
        out.append(instr[i])
    return ''.join(out)

也可以使用列表理解:

add_commas(instr):
    rng = reversed(range(1, len(instr) + (len(instr) - 1)//3 + 1))
    out = [',' if j%4 == 0 else instr[-(j - j//4)] for j in rng]
    return ''.join(out)

它比较短,可能只有一个衬里,但是您必须进行一些心理体操才能理解它的工作原理。在这两种情况下,我们得到:

for i in range(1, 11):
    instr = '1234567890'[:i]
    print(instr, add_commas(instr))
1 1
12 12
123 123
1234 1,234
12345 12,345
123456 123,456
1234567 1,234,567
12345678 12,345,678
123456789 123,456,789
1234567890 1,234,567,890

如果您想了解该程序,则第一个版本是更明智的选择。


1

这也是一种适用于浮点数的方法:

def float2comma(f):
    s = str(abs(f)) # Convert to a string
    decimalposition = s.find(".") # Look for decimal point
    if decimalposition == -1:
        decimalposition = len(s) # If no decimal, then just work from the end
    out = "" 
    for i in range(decimalposition+1, len(s)): # do the decimal
        if not (i-decimalposition-1) % 3 and i-decimalposition-1: out = out+","
        out = out+s[i]      
    if len(out):
        out = "."+out # add the decimal point if necessary
    for i in range(decimalposition-1,-1,-1): # working backwards from decimal point
        if not (decimalposition-i-1) % 3 and decimalposition-i-1: out = ","+out
        out = s[i]+out      
    if f < 0:
        out = "-"+out
    return out

用法示例:

>>> float2comma(10000.1111)
'10,000.111,1'
>>> float2comma(656565.122)
'656,565.122'
>>> float2comma(-656565.122)
'-656,565.122'

1
float2comma(12031023.1323)回报:'12,031,023.132,3'
DEMUX

1

一种适用于Python 2.5+和Python 3的衬板(仅适用于正整数):

''.join(reversed([x + (',' if i and not i % 3 else '') for i, x in enumerate(reversed(str(1234567)))]))

1

通用解决方案

我在上一个投票最高的答案中发现了点分隔符的一些问题。我设计了一个通用解决方案,您可以在不修改语言环境的情况下将任何内容用作千位分隔符。我知道这不是最优雅的解决方案,但可以完成工作。随时进行改进!

def format_integer(number, thousand_separator='.'):
    def reverse(string):
        string = "".join(reversed(string))
        return string

    s = reverse(str(number))
    count = 0
    result = ''
    for char in s:
        count = count + 1
        if count % 3 == 0:
            if len(s) == count:
                result = char + result
            else:
                result = thousand_separator + char + result
        else:
            result = char + result
    return result


print(format_integer(50))
# 50
print(format_integer(500))
# 500
print(format_integer(50000))
# 50.000
print(format_integer(50000000))
# 50.000.000

0

这与逗号一起赚钱

def format_money(money, presym='$', postsym=''):
    fmt = '%0.2f' % money
    dot = string.find(fmt, '.')
    ret = []
    if money < 0 :
        ret.append('(')
        p0 = 1
    else :
        p0 = 0
    ret.append(presym)
    p1 = (dot-p0) % 3 + p0
    while True :
        ret.append(fmt[p0:p1])
        if p1 == dot : break
        ret.append(',')
        p0 = p1
        p1 += 3
    ret.append(fmt[dot:])   # decimals
    ret.append(postsym)
    if money < 0 : ret.append(')')
    return ''.join(ret)

0

我有此代码的python 2和python 3版本。我知道这个问题是针对python 2提出的,但是现在(8年后,大声笑)人们可能会使用python3。Python

3代码:

import random
number = str(random.randint(1, 10000000))
comma_placement = 4
print('The original number is: {}. '.format(number))
while True:
    if len(number) % 3 == 0:
        for i in range(0, len(number) // 3 - 1):
            number = number[0:len(number) - comma_placement + 1] + ',' + number[len(number) - comma_placement + 1:]
            comma_placement = comma_placement + 4
    else:
        for i in range(0, len(number) // 3):
            number = number[0:len(number) - comma_placement + 1] + ',' + number[len(number) - comma_placement + 1:]
    break
print('The new and improved number is: {}'.format(number))        


Python 2代码:(编辑。python2代码无法正常工作。我认为语法是不同的)。

import random
number = str(random.randint(1, 10000000))
comma_placement = 4
print 'The original number is: %s.' % (number)
while True:
    if len(number) % 3 == 0:
        for i in range(0, len(number) // 3 - 1):
            number = number[0:len(number) - comma_placement + 1] + ',' + number[len(number) - comma_placement + 1:]
            comma_placement = comma_placement + 4
    else:
        for i in range(0, len(number) // 3):
            number = number[0:len(number) - comma_placement + 1] + ',' + number[len(number) - comma_placement + 1:]
    break
print 'The new and improved number is: %s.' % (number) 

0

我正在使用python 2.5,因此无法访问内置格式。

我查看了Django代码intcomma(下面的代码中的intcomma_recurs),发现它效率低下,因为它是递归的,并且每次运行时都编译正则表达式也不是一件好事。这不是必需的“问题”,因为django并不是真的专注于这种低级性能。另外,我期望性能差异达到10倍,但仅慢3倍。

出于好奇,我实现了一些intcomma版本,以查看使用正则表达式时的性能优势。我的测试数据总结出此任务有一点优势,但令人惊讶的是根本没有优势。

我也很高兴看到我所怀疑的:在无正则表达式的情况下,不需要使用反向xrange方法,但这确实使代码看起来更好一点,但性能却降低了10%。

另外,我假设您要传递的是一个字符串,看起来有点像一个数字。否则结果不确定。

from __future__ import with_statement
from contextlib import contextmanager
import re,time

re_first_num = re.compile(r"\d")
def intcomma_noregex(value):
    end_offset, start_digit, period = len(value),re_first_num.search(value).start(),value.rfind('.')
    if period == -1:
        period=end_offset
    segments,_from_index,leftover = [],0,(period-start_digit) % 3
    for _index in xrange(start_digit+3 if not leftover else start_digit+leftover,period,3):
        segments.append(value[_from_index:_index])
        _from_index=_index
    if not segments:
        return value
    segments.append(value[_from_index:])
    return ','.join(segments)

def intcomma_noregex_reversed(value):
    end_offset, start_digit, period = len(value),re_first_num.search(value).start(),value.rfind('.')
    if period == -1:
        period=end_offset
    _from_index,segments = end_offset,[]
    for _index in xrange(period-3,start_digit,-3):
        segments.append(value[_index:_from_index])
        _from_index=_index
    if not segments:
        return value
    segments.append(value[:_from_index])
    return ','.join(reversed(segments))

re_3digits = re.compile(r'(?<=\d)\d{3}(?!\d)')
def intcomma(value):
    segments,last_endoffset=[],len(value)
    while last_endoffset > 3:
        digit_group = re_3digits.search(value,0,last_endoffset)
        if not digit_group:
            break
        segments.append(value[digit_group.start():last_endoffset])
        last_endoffset=digit_group.start()
    if not segments:
        return value
    if last_endoffset:
        segments.append(value[:last_endoffset])
    return ','.join(reversed(segments))

def intcomma_recurs(value):
    """
    Converts an integer to a string containing commas every three digits.
    For example, 3000 becomes '3,000' and 45000 becomes '45,000'.
    """
    new = re.sub("^(-?\d+)(\d{3})", '\g<1>,\g<2>', str(value))
    if value == new:
        return new
    else:
        return intcomma(new)

@contextmanager
def timed(save_time_func):
    begin=time.time()
    try:
        yield
    finally:
        save_time_func(time.time()-begin)

def testset_xsimple(func):
    func('5')

def testset_simple(func):
    func('567')

def testset_onecomma(func):
    func('567890')

def testset_complex(func):
    func('-1234567.024')

def testset_average(func):
    func('-1234567.024')
    func('567')
    func('5674')

if __name__ == '__main__':
    print 'Test results:'
    for test_data in ('5','567','1234','1234.56','-253892.045'):
        for func in (intcomma,intcomma_noregex,intcomma_noregex_reversed,intcomma_recurs):
            print func.__name__,test_data,func(test_data)
    times=[]
    def overhead(x):
        pass
    for test_run in xrange(1,4):
        for func in (intcomma,intcomma_noregex,intcomma_noregex_reversed,intcomma_recurs,overhead):
            for testset in (testset_xsimple,testset_simple,testset_onecomma,testset_complex,testset_average):
                for x in xrange(1000): # prime the test
                    testset(func)
                with timed(lambda x:times.append(((test_run,func,testset),x))):
                    for x in xrange(50000):
                        testset(func)
    for (test_run,func,testset),_delta in times:
        print test_run,func.__name__,testset.__name__,_delta

这是测试结果:

intcomma 5 5
intcomma_noregex 5 5
intcomma_noregex_reversed 5 5
intcomma_recurs 5 5
intcomma 567 567
intcomma_noregex 567 567
intcomma_noregex_reversed 567 567
intcomma_recurs 567 567
intcomma 1234 1,234
intcomma_noregex 1234 1,234
intcomma_noregex_reversed 1234 1,234
intcomma_recurs 1234 1,234
intcomma 1234.56 1,234.56
intcomma_noregex 1234.56 1,234.56
intcomma_noregex_reversed 1234.56 1,234.56
intcomma_recurs 1234.56 1,234.56
intcomma -253892.045 -253,892.045
intcomma_noregex -253892.045 -253,892.045
intcomma_noregex_reversed -253892.045 -253,892.045
intcomma_recurs -253892.045 -253,892.045
1 intcomma testset_xsimple 0.0410001277924
1 intcomma testset_simple 0.0369999408722
1 intcomma testset_onecomma 0.213000059128
1 intcomma testset_complex 0.296000003815
1 intcomma testset_average 0.503000020981
1 intcomma_noregex testset_xsimple 0.134000062943
1 intcomma_noregex testset_simple 0.134999990463
1 intcomma_noregex testset_onecomma 0.190999984741
1 intcomma_noregex testset_complex 0.209000110626
1 intcomma_noregex testset_average 0.513000011444
1 intcomma_noregex_reversed testset_xsimple 0.124000072479
1 intcomma_noregex_reversed testset_simple 0.12700009346
1 intcomma_noregex_reversed testset_onecomma 0.230000019073
1 intcomma_noregex_reversed testset_complex 0.236999988556
1 intcomma_noregex_reversed testset_average 0.56299996376
1 intcomma_recurs testset_xsimple 0.348000049591
1 intcomma_recurs testset_simple 0.34600019455
1 intcomma_recurs testset_onecomma 0.625
1 intcomma_recurs testset_complex 0.773999929428
1 intcomma_recurs testset_average 1.6890001297
1 overhead testset_xsimple 0.0179998874664
1 overhead testset_simple 0.0190000534058
1 overhead testset_onecomma 0.0190000534058
1 overhead testset_complex 0.0190000534058
1 overhead testset_average 0.0309998989105
2 intcomma testset_xsimple 0.0360000133514
2 intcomma testset_simple 0.0369999408722
2 intcomma testset_onecomma 0.207999944687
2 intcomma testset_complex 0.302000045776
2 intcomma testset_average 0.523000001907
2 intcomma_noregex testset_xsimple 0.139999866486
2 intcomma_noregex testset_simple 0.141000032425
2 intcomma_noregex testset_onecomma 0.203999996185
2 intcomma_noregex testset_complex 0.200999975204
2 intcomma_noregex testset_average 0.523000001907
2 intcomma_noregex_reversed testset_xsimple 0.130000114441
2 intcomma_noregex_reversed testset_simple 0.129999876022
2 intcomma_noregex_reversed testset_onecomma 0.236000061035
2 intcomma_noregex_reversed testset_complex 0.241999864578
2 intcomma_noregex_reversed testset_average 0.582999944687
2 intcomma_recurs testset_xsimple 0.351000070572
2 intcomma_recurs testset_simple 0.352999925613
2 intcomma_recurs testset_onecomma 0.648999929428
2 intcomma_recurs testset_complex 0.808000087738
2 intcomma_recurs testset_average 1.81900000572
2 overhead testset_xsimple 0.0189998149872
2 overhead testset_simple 0.0189998149872
2 overhead testset_onecomma 0.0190000534058
2 overhead testset_complex 0.0179998874664
2 overhead testset_average 0.0299999713898
3 intcomma testset_xsimple 0.0360000133514
3 intcomma testset_simple 0.0360000133514
3 intcomma testset_onecomma 0.210000038147
3 intcomma testset_complex 0.305999994278
3 intcomma testset_average 0.493000030518
3 intcomma_noregex testset_xsimple 0.131999969482
3 intcomma_noregex testset_simple 0.136000156403
3 intcomma_noregex testset_onecomma 0.192999839783
3 intcomma_noregex testset_complex 0.202000141144
3 intcomma_noregex testset_average 0.509999990463
3 intcomma_noregex_reversed testset_xsimple 0.125999927521
3 intcomma_noregex_reversed testset_simple 0.126999855042
3 intcomma_noregex_reversed testset_onecomma 0.235999822617
3 intcomma_noregex_reversed testset_complex 0.243000030518
3 intcomma_noregex_reversed testset_average 0.56200003624
3 intcomma_recurs testset_xsimple 0.337000131607
3 intcomma_recurs testset_simple 0.342000007629
3 intcomma_recurs testset_onecomma 0.609999895096
3 intcomma_recurs testset_complex 0.75
3 intcomma_recurs testset_average 1.68300008774
3 overhead testset_xsimple 0.0189998149872
3 overhead testset_simple 0.018000125885
3 overhead testset_onecomma 0.018000125885
3 overhead testset_complex 0.0179998874664
3 overhead testset_average 0.0299999713898

我以为Daniel Fortunov的单正则表达式解决方案将是#1,并且击败了所有算法,因为正则表达式是如此精致/优化并用C编码,但不是。即使预先编译了正则表达式,它也大约是上述间隔时间的两倍。
parity3


-1

这是使用生成器函数的另一种变体,适用于整数:

def ncomma(num):
    def _helper(num):
        # assert isinstance(numstr, basestring)
        numstr = '%d' % num
        for ii, digit in enumerate(reversed(numstr)):
            if ii and ii % 3 == 0 and digit.isdigit():
                yield ','
            yield digit

    return ''.join(reversed([n for n in _helper(num)]))

这是一个测试:

>>> for i in (0, 99, 999, 9999, 999999, 1000000, -1, -111, -1111, -111111, -1000000):
...     print i, ncomma(i)
... 
0 0
99 99
999 999
9999 9,999
999999 999,999
1000000 1,000,000
-1 -1
-111 -111
-1111 -1,111
-111111 -111,111
-1000000 -1,000,000

-1

只是子类long(或float,或其他)。这非常实用,因为这样您仍然可以在数学运算中使用数字(因此也可以在现有代码中使用数字),但是它们都可以在终端中很好地打印出来。

>>> class number(long):

        def __init__(self, value):
            self = value

        def __repr__(self):
            s = str(self)
            l = [x for x in s if x in '1234567890']
            for x in reversed(range(len(s)-1)[::3]):
                l.insert(-x, ',')
            l = ''.join(l[1:])
            return ('-'+l if self < 0 else l) 

>>> number(-100000)
-100,000
>>> number(-100)
-100
>>> number(-12345)
-12,345
>>> number(928374)
928,374
>>> 345

8
我喜欢子类的想法,但是__repr__()重写的正确方法是吗?我建议重写__str__(),留下__repr__()孤单,因为int(repr(number(928374)))应该工作,但int()会噎死的逗号。
steveha

@steveha有一个很好的观点,但是理由应该是那number(repr(number(928374)))是行不通的,不是int(repr(number(928374)))。完全一样,要print按照OP的要求直接使用此方法,该__str__()方法应被覆盖而不是__repr__()。无论如何,核心逗号插入逻辑中似乎存在一个错误。
martineau 2010年

-1

意大利:

>>> import locale
>>> locale.setlocale(locale.LC_ALL,"")
'Italian_Italy.1252'
>>> f"{1000:n}"
'1.000'

-8

对于花车:

float(filter(lambda x: x!=',', '1,234.52'))
# returns 1234.52

对于整数:

int(filter(lambda x: x!=',', '1,234'))
# returns 1234

5
将删除逗号。虽然方便,但OP要求一种添加方式。此外,类似的东西float('1,234.52'.translate(None, ','))可能更直接,甚至更快。
暂停,直到另行通知。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.